Transcribe:通过竖杠分隔的 languageCodes 未能满足枚举值集合

0

【以下的问题经过翻译处理】 启动TranscriptionJob时遇到了非常奇怪的问题。我正在使用AWS SDK for PHP转录包含英语和希伯来语的音频文件。

$client->startTranscriptionJob([
  'LanguageCode'          => 'en-US|he-IL', 
  'Media' => [
    'MediaFileUri'        => 'xxx'
  ],
  'OutputBucketName'      => 'xxx',
  'OutputKey'             => 'xxx.json',
  'TranscriptionJobName'  =>'xxx-job'
]);

返回以下错误:BadRequestException (client): 1 validation error detected: Value 'en-US|he-IL' at 'languageCode' failed to satisfy constraint: Member must satisfy enum value set: [en-IE, ar-AE, te-IN, zh-TW, en-US, ta-IN, en-AB, en-IN, zh-CN, ar-SA, en-ZA, gd-GB, th-TH, tr-TR, ru-RU, pt-PT, nl-NL, it-IT, id-ID, fr-FR, es-ES, de-DE, ga-IE, af-ZA, en-NZ, ko-KR, hi-IN, de-CH, vi-VN, cy-GB, ms-MY, he-IL, da-DK, en-AU, pt-BR, en-WL, fa-IR, sv-SE, ja-JP, es-US, fr-CA, en-GB]

注意!!:如果我使用'en-US'(或'he-IL')替换'LanguageCode',它运行得很好...(当然,我的结果只有英语或只有希伯来语,很明显!)。

所有的文档都将'LanguageCode'指定为一个带有竖杠的字符串,但如果我指定超过1个'LanguageCode',就会出现'Member must satisfy enum value set'异常。

profile picture
EXPERTE
gefragt vor 8 Monaten56 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 LanguageCode参数用于处理只包含一种语言的音频文件。在文档中,“|”符号表示“或”,因此您可以选择其中一个选项。但是,有一种方法可以实现您想要的效果...

在转录作业中使用IdentifyMultipleLanguages参数可实现自动检测多种语言。如果您的媒体文件包含多种语言,请使用此参数。如果包括IdentifyMultipleLanguages,则可以使用LanguageOptions提供一组可能存在于您的媒体文件中的语言代码。

LanguageOptions是字符串数组,可以在其中提供“en-US”和“he-IL”。

profile picture
EXPERTE
beantwortet vor 8 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen