How does Textract deal with actual text in a PDF?

0

How does Textract deal with PDF documents that contain actual text, as in text that you can copy and paste into a Notepad document (as opposed to an image that Textract can recognise text in). Does Textract simply take the text verbatim, or does it render the text as an image, and then OCR it?

feita há 2 anos328 visualizações
1 Resposta
1
Resposta aceita

Textract does the latter where it first renders the PDF as an image and then performs OCR on it.

AWS
respondido há 2 anos
profile picture
ESPECIALISTA
avaliado há 9 meses

Você não está conectado. Fazer login para postar uma resposta.

Uma boa resposta responde claramente à pergunta, dá feedback construtivo e incentiva o crescimento profissional de quem perguntou.

Diretrizes para responder a perguntas