How does Textract deal with actual text in a PDF?

0

How does Textract deal with PDF documents that contain actual text, as in text that you can copy and paste into a Notepad document (as opposed to an image that Textract can recognise text in). Does Textract simply take the text verbatim, or does it render the text as an image, and then OCR it?

preguntada hace 2 años328 visualizaciones
1 Respuesta
1
Respuesta aceptada

Textract does the latter where it first renders the PDF as an image and then performs OCR on it.

AWS
respondido hace 2 años
profile picture
EXPERTO
revisado hace 9 meses

No has iniciado sesión. Iniciar sesión para publicar una respuesta.

Una buena respuesta responde claramente a la pregunta, proporciona comentarios constructivos y fomenta el crecimiento profesional en la persona que hace la pregunta.

Pautas para responder preguntas