【以下的问题经过翻译处理】 你好,
我正在尝试使用textract从存储在S3存储桶中的pdf中提取文本。
response = textract.start_document_text_detection(
DocumentLocation={
'S3Object': {
'Bucket': '样本存储桶',
'Name': '扫描_pdf_#1.pdf'
}
},
JobTag = '扫描_pdf_#1.pdf_job',
NotificationChannel={
'RoleArn': 'arn:aws:iam::*******:role/AWSSNSFullAccessRole',
'SNSTopicArn': 'arn:aws:sns:us-east-1:*********:PDF_TextProcess_Completed'
})
这里,当文件名包含特殊符号时,会出现以下错误
InvalidParameterException: An error occurred (InvalidParameterException) when calling the StartDocumentTextDetection operation: Request has invalid parameters
我该如何在不更改文件名称的情况下解决这个问题?
我也尝试过以下方法,但它没有起作用
‘’‘
file = urllib.parse.unquote_plus(file, encoding='utf-8')
’‘’