AWS re:Post Knowledge Center Feedback Survey
Help us improve the AWS re:Post Knowledge Center by sharing your feedback in a brief survey. Your input can influence how we create and update our content to better support your AWS journey.
【以下的问题经过翻译处理】 我们最近将位于US-EAST-1的Postgres RDS实例从db.m5.4xl修改为db.m6i.4xl。自从修改之后,我们注意到Postgres错误日志中出现了archive/WAL错误。这个实例运行的是Postgres 10.21版本。
例如: 2022-10-30 22:10:48 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:10:48 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000082
2022-10-30 22:28:04 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:28:04 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000086
(当然,文件名每次都会变化) 这些错误可能频繁地发生,每隔几分钟或几个小时就会发生。这是RDS实例中的错误还是我们需要解决的问题?
【以下的回答经过翻译处理】 通过AWS支持,我了解到“archive command failed with exit code 1”的日志条目是没有足够的IOPS将WAL写入S3的失败症状。因为文件名每次都在增加,所以这本身不是问题,但是表明存储子系统内存在反压情况。如果文件名保持不变,这意味着WAL没有被写入S3,并且开始影响最后可恢复时间。
简而言之,RDS实例需要更多的IOPS。
您未登录。 登录 发布回答。
一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。