How does Textract deal with actual text in a PDF?

0

How does Textract deal with PDF documents that contain actual text, as in text that you can copy and paste into a Notepad document (as opposed to an image that Textract can recognise text in). Does Textract simply take the text verbatim, or does it render the text as an image, and then OCR it?

gefragt vor 2 Jahren328 Aufrufe
1 Antwort
1
Akzeptierte Antwort

Textract does the latter where it first renders the PDF as an image and then performs OCR on it.

AWS
beantwortet vor 2 Jahren
profile picture
EXPERTE
überprüft vor 9 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen