TEXTRACT: Anayze Table of Contents

0

Using Textract for a table of contents where each line has** TITLE . . . . Author PageNo.** Resultant table has Title and Author merges ignoring dot-leader as one column and page numbers has 2nd column. How can I get Textract to treat dot-leader as a column separator

demandé il y a 2 mois170 vues
2 réponses
0

Could you provide sample image for better understanding?

AWS
répondu il y a 2 mois
0

Would it be feasible to process text before textract ? So you could insert some kind of well known separator to be easily recognized by the ML behind it.

profile picture
EXPERT
répondu il y a 2 mois

Vous n'êtes pas connecté. Se connecter pour publier une réponse.

Une bonne réponse répond clairement à la question, contient des commentaires constructifs et encourage le développement professionnel de la personne qui pose la question.

Instructions pour répondre aux questions