1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 通过格式化,我假定您指的是字体大小和样式(例如加粗,斜体)?目前,Textract无法提取此类格式化信息。
DetectText API目前提供以下信息(sourcehttps://docs.aws.amazon.com/textract/latest/dg/how-it-works-detecting.html):
- 检测到的文本行和单词
- 检测到的文本行和单词之间的关系
- 检测到的文本所出现的页码
- 文档页面上文本行和单词的位置
它还可以通过查询提取表格、表单和特定信息。此页面https://docs.aws.amazon.com/textract/latest/dg/how-it-works-document-layout.html提供了相应的概述。