如何使用AWS Kendra 搜索手写文本 PDF?

0

【以下的问题经过翻译处理】 我有一份手写文字的扫描PDF文件,尝试使用AWS Kendra搜索其中内容,但是Kendra无法搜索到手写文字。我尝试使用textract和comprehend,但是这两种服务似乎对PDF文件的大小和页面数量有限制。有没有办法使Kendra能够搜索这些手写文字呢?

profile picture
エキスパート
質問済み 8ヶ月前60ビュー
1回答
0

【以下的回答经过翻译处理】 如果要进行手写识别,Textract是你最好的选择 - 它专为手写识别设计(而不只是手写识别)。而Kendra则专为语言和含义识别而设计。简单来说,一个是用于图像的卷积神经网络,另一个是用于语言的递归神经网络; RNN对图像的识别效果较差,而CNN则对语言的识别效果较差。 Textract 也有限制 - 对于PDF文件限制为3000页/500MB,如果你超出了这些限制可以考虑先拆分PDF文档,然后再将识别后的内容放入Kendra供搜索使用。

profile picture
エキスパート
回答済み 8ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン