AWS DMS 작업에서 대상 지연 시간이 길어지는 문제를 해결하려면 어떻게 해야 하나요?

3분 분량
0

전체 로드 및 변경 데이터 캡처(CDC) AWS Database Migration Service(AWS DMS) 작업을 실행 중입니다. 소스 지연 시간은 높지 않지만 목표 지연 시간은 높거나 증가하고 있습니다.

간략한 설명

Amazon CloudWatch 메트릭을 사용하여 복제 작업의 메트릭을 모니터링합니다. 진행 중인 복제 단계에서 복제 대기 시간을 확인하려면 CDCLatencySourceCDCLatencyTarget을 모니터링합니다. CDCLatencySource 메트릭은 소스와 복제 인스턴스 간의 레이턴시입니다. CDCLatencyTarget 메트릭은 복제 인스턴스와 타겟 간의 레이턴시입니다. 자세한 내용을 보려면 복제 작업 메트릭을 참조하세요.

CDCLatencySource가 높으면 소스에서 변경 사항을 캡처하는 프로세스가 지연된다는 의미입니다. CDCLatencyTarget이 높으면 변경 이벤트를 대상에 적용하는 프로세스가 지연된다는 의미입니다. CDCLatencySourceCDCLatencyTarget가 모두 높은 경우, 타겟 지연 시간이 항상 소스 지연 시간보다 같거나 크므로 CDCLatencySource 문제를 먼저 해결합니다. CDCLatencyTarget이 높으면 소스에서 변경 이벤트를 캡처하는 데 지연이 발생하기 때문일 가능성이 높습니다. CDCLatencySource는 높지 않은데 CDCLatencyTarget가 높은 경우 다음 문제로 인해 지연 시간이 발생할 수 있습니다.

  • 대상에 기본 키 또는 인덱스가 없습니다.
  • 대상에 리소스 병목 현상이 있습니다.
  • 복제 인스턴스에 리소스 병목 현상이 있습니다.
  • 복제 인스턴스와 대상 간에 네트워크 문제가 있습니다.

이러한 문제를 해결하려면 다음 해결 방법성공 사례 및 문제 해결 섹션을 참조하세요.

해결 방법

대상에 기본 키 또는 인덱스가 없음

기본적으로 AWS DMS는 DML(데이터 조작 언어) 문을 사용하여 INSERT, UPDATE 또는 DELETE와 같은 변경 사항을 대상에 씁니다. 필요한 인덱스가 없는 경우 업데이트 및 삭제와 같은 변경 사항으로 인해 전체 테이블 스캔이 발생할 수 있습니다. 전체 테이블 스캔은 대상에서 성능 문제를 일으키고 대상 지연을 초래할 수 있습니다. 특히 수동으로 대상 스키마를 만든 경우 대상 데이터베이스 스키마를 확인하세요. 대상 데이터베이스 메커니즘을 사용하여 느린 쿼리를 식별합니다(예: MySQL의 경우 slow 쿼리 로그, PostgreSQL의 경우 pg_stat_activity(Amazon Relational Database Service(RDS) 또는 쿼리 계획). 대상이 Amazon Redshift인 경우 테이블에 대한 배포 스타일도 확인합니다. 배포 스타일은 테이블에 데이터를 삽입하거나 업데이트하는 데 시간이 더 오래 걸리므로 모든 배포 스타일은 대상 지연을 유발할 수 있습니다.

대상의 리소스 병목 현상

대상에 충분한 리소스가 없는 경우 대상은 AWS DMS가 전송하는 속도로 변경 사항을 수락할 수 없습니다. 이로 인해 대상에서 리소스 병목 현상이 발생하고 대상 대기 시간이 발생할 수 있습니다. 다른 프로세스가 대상에서 리소스를 사용하는 경우에도 이러한 문제가 발생합니다. AWS가 대상을 호스팅하는 경우 CloudWatch 메트릭에서 리소스 통계를 확인하세요.

복제 인스턴스의 리소스 병목 현상

마이그레이션을 처리하기에 충분한 리소스가 있는 복제 인스턴스를 선택하세요. CPU, 메모리, 네트워크 또는 iOPS.

CloudWatch 메트릭을 사용하여 복제 인스턴스 리소스를 모니터링하세요.

복제 인스턴스와 대상 간의 네트워크 문제

네트워크 대역폭은 특히 대상이 온프레미스 데이터베이스이거나 AWS 리전 간 복제를 위해 AWS DMS를 사용하는 경우 지연 시간 문제를 일으킬 수 있습니다.

우수 사례 및 문제 해결

대상이 Amazon RDS인 경우, 모범 사례에 따라 AWS DMS 마이그레이션의 성능을 개선하세요. Amazon RDS에는 백업 창 내에서 시작되는 자동화된 백업 메커니즘이 있으며, Amazon RDS는 이동된 데이터를 백업합니다. 대상 RDS DB 인스턴스의 스냅샷이 캡처 프로세스에 있는 경우, 서비스가 대상에 변경 사항을 적용할 때 AWS DMS에 문제가 발생할 수 있습니다. 그 결과, 스냅샷 캡처가 완료될 때까지 대상 지연 시간이 증가합니다. 대상이 Amazon EC2(Amazon Elastic Compute Cloud) 또는 온프레미스 데이터베이스인 경우, 대상 데이터베이스의 백업 메커니즘을 확인하세요.

일부 작업 설정으로 인해 변경 내용이 대상에 느리게 기록될 수 있습니다. 변경 속도가 빠른 소스에서 진행 중인 복제를 실행하는 경우 BatchApplyEnabled를 사용하세요. 자세한 내용을 보려면 AWS DMS 마이그레이션 디버깅의 BatchApplyEnabled 섹션을 참조하세요. 문제가 발생하면 어떻게 해야 하나요? 3부

BatchApplyEnabledTrue로 설정하려면 AWS CLI(AWS 명령줄 인터페이스)를 사용하여 modify-replication-task 명령을 실행합니다.

aws dms modify-replication-task --replication-task-arn arn:aws:dms:ap-northeast-1:123456789012:task:ABCDEFGHIJKLMNOPQRSTUVWXYZ --replication-task-settings "{\"TargetMetadata\":{\"BatchApplyEnabled\":true}}"

참고: AWS CLI 명령을 실행할 때 오류가 발생하면 AWS CLI 오류 해결을 참조하세요. 또한 최신 AWS CLI 버전을 사용하고 있는지 확인하세요.

관련 정보

처리 튜닝 설정 변경

AWS 공식
AWS 공식업데이트됨 7달 전