我应该使用Lambda InvokeAsync还是Amazon SQS事件源来从Amazon S3提取数据?

0

【以下的问题经过翻译处理】 我想知道从成千上万的Amazon S3文件中提取数据的最佳方法。我想使用Amazon S3 Put触发器来调用AWS Lambda函数,以启动对Amazon Textract的API调用,从这些S3文件中提取数据。由于文档每月上传到S3一次,所以这个过程不需要同步进行。 由于Lambda的并发限制为1000(在某些地区),而该过程可以是异步的,因此我考虑使用解耦的Amazon SQS队列与Lambda函数的选项。我也知道Lambda可以处理异步调用。 在什么条件下我使用Amazon SQS而不是Lambda InvokeAsync?

profile picture
专家
已提问 10 个月前17 查看次数
1 回答
0

【以下的回答经过翻译处理】 根据您的使用情况,您可以选择使用Amazon SQS队列来确保更好地控制重试和并发。由于Amazon Textract的API限制相对较低,因此如果您直接使用Amazon S3 Put触发器提取数据,大量文件可能会导致限流。在中间添加Amazon SQS允许您更好地控制和查看信息,例如还有多少消息需要处理以及未处理的失败消息可以重试多少次。

profile picture
专家
已回答 10 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则