RDS Postgres Archive/WAL错误日志

0

【以下的问题经过翻译处理】 我们最近将位于US-EAST-1的Postgres RDS实例从db.m5.4xl修改为db.m6i.4xl。自从修改之后,我们注意到Postgres错误日志中出现了archive/WAL错误。这个实例运行的是Postgres 10.21版本。

例如: 2022-10-30 22:10:48 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:10:48 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000082

2022-10-30 22:28:04 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:28:04 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000086

(当然,文件名每次都会变化) 这些错误可能频繁地发生,每隔几分钟或几个小时就会发生。这是RDS实例中的错误还是我们需要解决的问题?

profile picture
전문가
질문됨 8달 전49회 조회
1개 답변
0

【以下的回答经过翻译处理】 通过AWS支持,我了解到“archive command failed with exit code 1”的日志条目是没有足够的IOPS将WAL写入S3的失败症状。因为文件名每次都在增加,所以这本身不是问题,但是表明存储子系统内存在反压情况。如果文件名保持不变,这意味着WAL没有被写入S3,并且开始影响最后可恢复时间。

简而言之,RDS实例需要更多的IOPS。

profile picture
전문가
답변함 8달 전

로그인하지 않았습니다. 로그인해야 답변을 게시할 수 있습니다.

좋은 답변은 질문에 명확하게 답하고 건설적인 피드백을 제공하며 질문자의 전문적인 성장을 장려합니다.

질문 답변하기에 대한 가이드라인

관련 콘텐츠