Textract的DetectDocumentText支持PDF格式吗?

0

【以下的问题经过翻译处理】 我正在查阅@aws-sdk/client-textract的javascript文档。

在DetectDocumentTextCommand文档页面中,它声称支持JPEG、PNG、PDF或TIFF格式。

但在DetectDocumentTextCommandInput文档页面中,它声称只支持JPEG或PNG格式。

我尝试了在S3中使用PDF文件和BLOB格式的命令,它抛出了UnsupportedDocumentException。只是想弄清楚它是否不支持PDF格式,或者这里有一些错误。

DetectDocumentTextCommand文档页面: https://docs.aws.amazon.com/AWSJavaScriptSDK/v3/latest/clients/client-textract/classes/detectdocumenttextcommand.html

DetectDocumentTextCommandInput文档页面: https://docs.aws.amazon.com/AWSJavaScriptSDK/v3/latest/clients/client-textract/interfaces/detectdocumenttextcommandinput.html

profile picture
전문가
질문됨 8달 전28회 조회
1개 답변
0

【以下的回答经过翻译处理】 是的,同步的[DetectText API]支持PDF文档。但是,文档必须最多只有1页,大小不能超过10MB(来源)。这些限制是因为API是同步的,并且有一个期望结果会快速返回的预期。多页PDF文档需要更长的处理时间,并且只能通过异步的[StartDocumentTextDetection API]来处理。

我同意您提供的问题文档在这方面不够清晰,所以我将向Textract文档团队报告此问题并要求更新。

profile picture
전문가
답변함 8달 전

로그인하지 않았습니다. 로그인해야 답변을 게시할 수 있습니다.

좋은 답변은 질문에 명확하게 답하고 건설적인 피드백을 제공하며 질문자의 전문적인 성장을 장려합니다.

질문 답변하기에 대한 가이드라인