Explore how you can quickly prepare for, respond to, and recover from security events. Learn more.
标记有以下标签的问题: Amazon Textract
Amazon Textract is a machine learning (ML) service that automatically extracts text, handwriting, and data from scanned documents.
内容语言: 中文 (简体)
Select up to 5 tags to filter
排序方式 最新
浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。
27 条结果
【以下的问题经过翻译处理】 我正在使用aws textract从pdf中提取键值对。因为有时准确率低,所以我使用augmented AI(人工审核工作流程)来引入人工参与到流程中来。
这在处理png文件时效果很好,但当我使用pdf文件(textract支持pdf文件)时,出现“无法加载图像”的错误。
我该如何解决这个问题?我尝试过使用自定义模板,但找不到插入文件类型的方法。
【以下的问题经过翻译处理】 Amazon Textract中“Detect Document Text API”和“Analyze Document API”有什么区别,它们不是一样的吗?我知道“Analyze Document”意味着提取数据(例如表格、表单或根据我们的问题提取数据),但是“Detect Document Text API”是什么意思?这两者之间有什么区别?
价格表:<http...
【以下的问题经过翻译处理】 你好,
我正在尝试使用textract从存储在S3存储桶中的pdf中提取文本。
```
response = textract.start_document_text_detection(
DocumentLocation={
'S3Object': {
'Bucket': '样本存储桶',
'Name': '扫描_pdf_#1...
【以下的问题经过翻译处理】 你好,
我尝试使用textract boto3客户端在us-east-2中启动一个Lambda函数,但出现以下错误;
```
module initialization error: Unknown service: 'textract'. Valid service names are:...
```
我的函数遵循了文档的规范;
```
import bot...
【以下的问题经过翻译处理】 在 AWS Textract 发票扫描器中是否可以提取自定义字段?
【以下的问题经过翻译处理】 Textract中的新函数AnalyzeID在Lambda中可以用了么?在Lambda和SAM中,我都遇到了这个错误:
```
Textract.analyzeID is not a function
```
```
const AWS = require('aws-sdk');
const Textract = new AWS.Textract();
exp...
【以下的问题经过翻译处理】 嗨,我正在尝试使用Textract和“start_document_analysis”API分析多页pdf。我知道要分析的文档必须存在于S3存储桶中。然而,当调用此接口时,我收到以下错误消息:
```
InvalidS3ObjectException: An error occurred (InvalidS3ObjectException) when calling ...
【以下的问题经过翻译处理】 请问Textract是如何识别PDF中的文本的?就是那种可以直接贴到记事本中的纯文本。
Textract是直接使用PDF中包含的文本,还是先把PDF当成图片,然后通过OCR识别的?
【以下的问题经过翻译处理】 对于“StartDocumentTextDetection“API 每个AWS账户默认为15 TPS的限制,如果要将其增加到50,是否存在**直接**费用?如果15个不再满足您的业务需求,通常的服务配额限制会增加到多少?
【以下的问题经过翻译处理】 我有一份手写文字的扫描PDF文件,尝试使用AWS Kendra搜索其中内容,但是Kendra无法搜索到手写文字。我尝试使用textract和comprehend,但是这两种服务似乎对PDF文件的大小和页面数量有限制。有没有办法使Kendra能够搜索这些手写文字呢?
【以下的问题经过翻译处理】 你好。
我正在使用 AWS textract,特别是 FORMS 功能来提取表单。它真的很好用。但我遇到的问题是,当提取表单并返回结果 时,并没有按照在文档中的原始顺序进行返回。有什么办法可以保持返回结果的原始顺序?或者我可以使用坐标映射回文档顺序吗?以下代码就是我目前使用提取的方式:
def ocr(document):
```
job_id = start...
【以下的问题经过翻译处理】 我有几个关于AWS Textract支持的语言的问题。
1. 是否在开发支持更多语言的计划?
2. 如果是,是否有计划表明哪些语言将被添加以及何时添加?
3. 是否有选项让客户在尚未支持的语言上训练Textract,从而可能也可以获得折扣?