我在使用Polly role tag 时,为什么会出现不一致的结果?

0

【以下的问题经过翻译处理】 我尝试使用role tag让Polly说出'live'(例如“Live from New York!”),当 live 位于句子的开头时,它工作正常。但是当单词被埋在句子中间时,发音会发生变化。我正在使用Windows CIL接口和Neural声音,并设置了区域为us-east-1。我还尝试过使用phoneme标签的各种解决方法,但我无法使任何东西起作用。我认为这是因为我需要在ph=选项(如ipa中的重音标记和x-samp中的<?>)中转义字符,但是\似乎在CIL中无法正常工作。当我尝试转义任何字符时,AWS一直返回“无效的SSML请求”。以下是我发送的角色命令:[代码部分省略]。以下是我尝试过的各种音素标签:[代码部分省略]。同时,我在Web控制台和CIL之间获得了不一致的结果。这两个完全相同的条目。控制台正确发音“live”,但命令行未能正确发音。

profile picture
专家
已提问 6 个月前15 查看次数
1 回答
0

【以下的回答经过翻译处理】 您好,

要获取与“dive”发声相似的“live”,您可以使用以下代码:

<w role="amazon:NN">live</w>

要获取与“give”发声相似的“live”,您可以使用以下代码:

<w role="amazon:VB">live</w>

角色amazon:SENSE_0不起作用。SENSE角色从amazon:SENSE_1开始编号。它们通常用于澄清不能通过语法解释的发音(例如,频率范围/吉他中的“bass”,或作为物种的“bass”)。因此,SENSE角色在此处没有用。

关于<phoneme>标签,要获取与“dive”发音相似的<w role="amazon:NN">live</w>的等效语言,可以使用以下代码:

<phoneme alphabet="ipa" ph="ˈlaɪv">live</phoneme>

<phoneme alphabet="x-sampa" ph="&quot;laIv">live</phoneme>

要获取与“give”发音相似的<w role="amazon:VB">live</w>的等效语言,可以使用以下代码:

<phoneme alphabet="ipa" ph="ˈlɪv">live</phoneme>

<phoneme alphabet="x-sampa" ph="&quot;lIv">live</phoneme>

IPA主要重音标记字符“ˈ”无需转义,因为它与单引号字符“'”不同。

然而,对于X-SAMPA,主要重音标记是双引号,因此需要在双引号的shell命令中使用等效的XML实体进行替换:“"”

关于CLI和控制台之间的不一致性,感谢您报告。我无法重现此操作。尽管如此,我提供的建议应该能够对您有所帮助。

profile picture
专家
已回答 6 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则