上传PDF至文件夹时Textract报错,是什么原因?

0

【以下的问题经过翻译处理】 你好,

我目前有一个Lambda,当上传PDF文档到一个S3存储桶时会被触发。一旦被调用,Lambda会调用 start_document_text_detection 方法来提取文档文本。任务会被发布到一个SNS主题上,另一个Lambda会在完成时被触发以调用 get_document_text_detection 方法来检索结果并将其上传到该存储桶中。

如果我将文档上传到S3存储桶的根目录,一切都很好。但是我遇到的问题是,当我在S3存储桶中创建一个文件夹并将PDF上传到那里时,触发器会触发,但我会收到以下错误消息:

[ERROR] InvalidParameterException: An error occurred (InvalidParameterException) when calling the StartDocumentTextDetection operation: Request has invalid parameters
Traceback (most recent call last):
  File "/var/task/lambda_function.py", line 33, in lambda_handler
    raise e
  File "/var/task/lambda_function.py", line 26, in lambda_handler
    'SNSTopicArn': os.environ['sns_arn']
  File "/opt/python/botocore/client.py", line 357, in _api_call
    return self._make_api_call(operation_name, kwargs)
  File "/opt/python/botocore/client.py", line 661, in _make_api_call
    raise error_class(parsed_response, operation_name)

这是因为 SNSTopicARN 是 start_document_text_detection 调用的 NotificationChannel 参数之一。RoleARN 也有 FullSNSAccess 策略,JobTag 是文档名称。我已经检查了 Textract 的限制,一切都在范围内。我还尝试调整 S3 存储桶的 Events 属性中的前缀以匹配文件夹,但没有成功。

任何建议都将不胜感激。

profile picture
专家
已提问 8 个月前15 查看次数
1 回答
0

【以下的回答经过翻译处理】 你好,感谢你联系我们!

根据帖子中分享的错误日志,看起来失败是由于SNSTopicArn可能没有被正确设置所触发的。你能否检查环境变量*'sns_arn'*是否包含预期的ARN?

祝好,

Srikanth。

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则