CloudWatch 에이전트를 사용하여 Amazon EC2 Linux 인스턴스에 대한 NVIDIA GPU 지표를 수집합니다. CloudWatch 에이전트 구성 파일의 metrics_collected 섹션 내에 nvidia_gpu 필드를 추가합니다. 자세한 내용은 NVIDIA GPU 지표 수집을 참조하십시오.
인스턴스에 NVIDIA 드라이버가 설치되어 있어야 합니다. 자세한 내용은 권장 GPU 인스턴스를 참조하십시오. 일부 Amazon Machine Image(AMI)에는 NVIDIA 드라이버가 사전 설치되어 있습니다. 인스턴스에 NVIDIA 드라이버가 없는 경우 드라이버를 수동으로 설치하십시오. 공개 NVIDIA 드라이버를 다운로드하거나 Amazon Simple Storage Service(Amazon S3)에서 드라이버를 다운로드할 수 있습니다. 또한 드라이버가 사전 설치된 AMI를 사용할 수도 있습니다. 자세한 내용은 Linux 인스턴스에 NVIDIA 드라이버 설치를 참조하십시오.
sudo /opt/aws/amazon-cloudwatch-agent/bin/amazon-cloudwatch-agent-ctl -a fetch-config -m ec2 -c file:configuration-file-path -s
참고:configuration-file-path를 구성 파일 경로로 바꾸십시오.
CloudWatch 에이전트가 시작되지 않고 다음과 같은 오류 메시지가 표시되면 에이전트가 nvidia-smi 파일을 찾을 수 없는 것입니다.
"[telegraf] Error running agent: validate input plugin nvidia_smi failed because of Cannot get file's stat /usr/bin/nvidia-smi: no such file or directory"