Amazon Transcribe自定义词典错误:无效字符或者格式不正确的术语

0

【以下的问题经过翻译处理】 源码链接:https://github.com/aws-samples/amazon-transcribe-comprehend-podcast

步骤:

  1. 使用源代码自述文件中的“创建堆栈”按钮部署堆栈。使用默认配置。
  2. 按照源代码中的README文件中的说明,使用样例JSON文件启动RSS Step Functions状态机进行执行。

错误:

  1. Step Function失败,显示消息“Fail state executed in step: Processing Error”。 当我进一步分析Amazon Transcribe时,发现“自定义词汇表”作业失败。 并且错误提示为“Failure reason The vocabulary that you’re trying to create contains invalid characters or incorrectly formatted terms. See the developer guide for more information.”

现在不太清楚该如何处理。想知道如何诊断转录作业中具体的问题。

profile picture
专家
已提问 8 个月前63 查看次数
1 回答
0

【以下的回答经过翻译处理】 你好! 看起来,在创建自定义词汇表时,传递给Transcribe的单词格式不正确。 我检查了负责创建词汇表的lambda函数,并在示例中使用了以下术语

["-Hawn", "Cloud", "A-W-S-A-I-Services", "Amazon", "Code-Whisperer", "Pillir", "A-W-S", "S-A-P", "U-K-T-V", "Media-two-Cloud", "Marketplace", "Mainframe-Modernization", "E-M-R-Serverless", "E-M-R", "Apache", "Spark", "Hive", "Hawn", "Amazon-Connect", "Local-Measure", "low", "Intelligent-Automation"]

当创建自定义词汇表“-word”(在本例中为-Hawn,引发了该问题)时,不被接受,因此需要检查负责进行预处理的lambda函数-> podcast-transcribe-index-createTranscribeVocabular ***

希望这能帮助!

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则