如何从身份证号码中提取详细信息(非美国身份证)?

0

【以下的问题经过翻译处理】 你好,我目前正在探索AWS服务,为一个项目(KYC处理)寻找解决方案。我想知道是否可以从ID中提取数据(例如:驾驶执照)。虽然Textract已经提供了这项服务,但它只支持美国驾驶执照和护照。是否有办法让它也能从其他国家获取驾驶执照的信息呢?

我已知的:

  1. 使用Textract分析ID
  2. 使用AWS Rekognition图像文本服务(它可以使用,但我想做的是返回详细信息的键值对,该服务只返回文本)

问题:

  1. 对于#1,仅支持美国驾驶执照和护照。是否有办法自定义它以便它也可以读取不同国家的驾驶执照?
  2. 对于#2,我可以创建自定义标签,训练我的模型,它可以识别ID的详细信息。是否有办法也获取提取它的方法,而不仅仅在上面提供一个边界框?
  3. 如果我要使用自定义标签,需要多少数据集数量才能使自定义模型准确?我应该使用不同个人的不同ID或具有不同情况的同一ID的多个图像(不同角度,不同光线或图像上不同位置)。
profile picture
专家
已提问 8 个月前55 查看次数
1 回答
0

【以下的回答经过翻译处理】 为了提取非美国身份证或驾驶执照的数据,您可以使用Textract Query https://docs.aws.amazon.com/textract/latest/dg/API_Query.html

请查看这个英国的示例(虚拟样本), Enter image description here

如您在示例中看到的,我使用了“在3中的日期是什么”或“在3中的国家是什么”来提取正确的子字段在行主字段“3”中。

结合使用Textract的此功能和Rekognition的自定义标签来识别ID的类型和国家,您可以为您的问题利用一个步骤函数逻辑流程。

请注意,Rekognition文本检测主要用于路标、标志等,而不是智能OCR(光学字符识别)提取文档,因此Textract是最好的选择。

[如果您认为此答案有帮助,请接受我的答案]

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则