RDS Postgres Archive/WAL错误日志

0

【以下的问题经过翻译处理】 我们最近将位于US-EAST-1的Postgres RDS实例从db.m5.4xl修改为db.m6i.4xl。自从修改之后,我们注意到Postgres错误日志中出现了archive/WAL错误。这个实例运行的是Postgres 10.21版本。

例如: 2022-10-30 22:10:48 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:10:48 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000082

2022-10-30 22:28:04 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:28:04 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000086

(当然,文件名每次都会变化) 这些错误可能频繁地发生,每隔几分钟或几个小时就会发生。这是RDS实例中的错误还是我们需要解决的问题?

profile picture
专家
已提问 8 个月前45 查看次数
1 回答
0

【以下的回答经过翻译处理】 通过AWS支持,我了解到“archive command failed with exit code 1”的日志条目是没有足够的IOPS将WAL写入S3的失败症状。因为文件名每次都在增加,所以这本身不是问题,但是表明存储子系统内存在反压情况。如果文件名保持不变,这意味着WAL没有被写入S3,并且开始影响最后可恢复时间。

简而言之,RDS实例需要更多的IOPS。

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则