RDS Postgres Archive/WAL错误日志

0

【以下的问题经过翻译处理】 我们最近将位于US-EAST-1的Postgres RDS实例从db.m5.4xl修改为db.m6i.4xl。自从修改之后,我们注意到Postgres错误日志中出现了archive/WAL错误。这个实例运行的是Postgres 10.21版本。

例如: 2022-10-30 22:10:48 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:10:48 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000082

2022-10-30 22:28:04 UTC::@:[359]:LOG: archive command failed with exit code 1 2022-10-30 22:28:04 UTC::@:[359]:DETAIL: The failed archive command was: /etc/rds/dbbin/pgscripts/rds_wal_archive pg_wal/0000000100000AE000000086

(当然,文件名每次都会变化) 这些错误可能频繁地发生,每隔几分钟或几个小时就会发生。这是RDS实例中的错误还是我们需要解决的问题?

profile picture
EXPERTE
gefragt vor 8 Monaten49 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 通过AWS支持,我了解到“archive command failed with exit code 1”的日志条目是没有足够的IOPS将WAL写入S3的失败症状。因为文件名每次都在增加,所以这本身不是问题,但是表明存储子系统内存在反压情况。如果文件名保持不变,这意味着WAL没有被写入S3,并且开始影响最后可恢复时间。

简而言之,RDS实例需要更多的IOPS。

profile picture
EXPERTE
beantwortet vor 8 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen