如何使用AWS Kendra 搜索手写文本 PDF?

0

【以下的问题经过翻译处理】 我有一份手写文字的扫描PDF文件,尝试使用AWS Kendra搜索其中内容,但是Kendra无法搜索到手写文字。我尝试使用textract和comprehend,但是这两种服务似乎对PDF文件的大小和页面数量有限制。有没有办法使Kendra能够搜索这些手写文字呢?

profile picture
专家
已提问 8 个月前55 查看次数
1 回答
0

【以下的回答经过翻译处理】 如果要进行手写识别,Textract是你最好的选择 - 它专为手写识别设计(而不只是手写识别)。而Kendra则专为语言和含义识别而设计。简单来说,一个是用于图像的卷积神经网络,另一个是用于语言的递归神经网络; RNN对图像的识别效果较差,而CNN则对语言的识别效果较差。 Textract 也有限制 - 对于PDF文件限制为3000页/500MB,如果你超出了这些限制可以考虑先拆分PDF文档,然后再将识别后的内容放入Kendra供搜索使用。

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则