Transcribe:通过竖杠分隔的 languageCodes 未能满足枚举值集合

0

【以下的问题经过翻译处理】 启动TranscriptionJob时遇到了非常奇怪的问题。我正在使用AWS SDK for PHP转录包含英语和希伯来语的音频文件。

$client->startTranscriptionJob([
  'LanguageCode'          => 'en-US|he-IL', 
  'Media' => [
    'MediaFileUri'        => 'xxx'
  ],
  'OutputBucketName'      => 'xxx',
  'OutputKey'             => 'xxx.json',
  'TranscriptionJobName'  =>'xxx-job'
]);

返回以下错误:BadRequestException (client): 1 validation error detected: Value 'en-US|he-IL' at 'languageCode' failed to satisfy constraint: Member must satisfy enum value set: [en-IE, ar-AE, te-IN, zh-TW, en-US, ta-IN, en-AB, en-IN, zh-CN, ar-SA, en-ZA, gd-GB, th-TH, tr-TR, ru-RU, pt-PT, nl-NL, it-IT, id-ID, fr-FR, es-ES, de-DE, ga-IE, af-ZA, en-NZ, ko-KR, hi-IN, de-CH, vi-VN, cy-GB, ms-MY, he-IL, da-DK, en-AU, pt-BR, en-WL, fa-IR, sv-SE, ja-JP, es-US, fr-CA, en-GB]

注意!!:如果我使用'en-US'(或'he-IL')替换'LanguageCode',它运行得很好...(当然,我的结果只有英语或只有希伯来语,很明显!)。

所有的文档都将'LanguageCode'指定为一个带有竖杠的字符串,但如果我指定超过1个'LanguageCode',就会出现'Member must satisfy enum value set'异常。

profile picture
专家
已提问 9 个月前65 查看次数
1 回答
0

【以下的回答经过翻译处理】 LanguageCode参数用于处理只包含一种语言的音频文件。在文档中,“|”符号表示“或”,因此您可以选择其中一个选项。但是,有一种方法可以实现您想要的效果...

在转录作业中使用IdentifyMultipleLanguages参数可实现自动检测多种语言。如果您的媒体文件包含多种语言,请使用此参数。如果包括IdentifyMultipleLanguages,则可以使用LanguageOptions提供一组可能存在于您的媒体文件中的语言代码。

LanguageOptions是字符串数组,可以在其中提供“en-US”和“he-IL”。

profile picture
专家
已回答 9 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则