Transcribe如何提高行业术语的准确性?

0

【以下的问题经过翻译处理】 我正在尝试为医疗用途开发流媒体语音转文本。虽然亚马逊医疗转录对于大多数医疗术语都很好,但是我无法使其识别常见的剂量和速率短语。

失败短语的例子:

1-“Administered at a rate of 5 mcg/kg/hr”

2-“begin at a starting dose of 8 mg/kg”

剂量的口语发音为:

1-“mike-per-kig-per-hour”

2-“mig-per-kig”

在这两个例子中,分数要么被忽略,要么被读成“mike pir”或“months per cake”,有时它只是崩溃并显示500个错误。

我尝试过:

1-添加以下相关条目的自定义词汇表:

短语IPASoundsLikeDisplayAs
mig-per-kigmig-per-kigmg / kg
mike-per-kig-per-hourmike-per-kig-per-hourmcg / kg /hr

2-我尝试改变医学专业,但没有改进。

3-我尝试了使用常规的亚马逊转录与自定义词汇表以及一个包含这些短语在上下文中多个例子的10,000词语言模型。

4-如果不口头缩写短语,我可以获得更可靠的结果。现在不说“mikes per kig per hour“,反而说“micrograms per kilogram per hour”,但是需求方人为以这种冗长的方式说话会引起人们的烦恼和抵触情绪,使他们不愿使用该服务。

我是否错误地使用了词汇表?有什么其他方法可以提高这些短语的准确性吗?这让我很痛苦,因为准确性在其他方面非常好,但遗漏常见的用药短语不幸地成为一个小但关键的断奶器。

profile picture
专家
已提问 8 个月前38 查看次数
1 回答
0

【以下的回答经过翻译处理】 我认为我已经找到了解决我的问题的答案。

当我改变了自定义词汇表并移除了"/"时,它按预期读出了缩写。

亚马逊团队,请为从自定义词汇表返回的无效字符创建一个错误。

简而言之:可能会创建一个带有无效字符的自定义词汇表,而没有出现错误。当使用自定义词汇表时,转录将悄悄地失败。

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则