【以下的问题经过翻译处理】 我正在尝试为医疗用途开发流媒体语音转文本。虽然亚马逊医疗转录对于大多数医疗术语都很好,但是我无法使其识别常见的剂量和速率短语。
失败短语的例子:
1-“Administered at a rate of 5 mcg/kg/hr”
2-“begin at a starting dose of 8 mg/kg”
剂量的口语发音为:
1-“mike-per-kig-per-hour”
2-“mig-per-kig”
在这两个例子中,分数要么被忽略,要么被读成“mike pir”或“months per cake”,有时它只是崩溃并显示500个错误。
我尝试过:
1-添加以下相关条目的自定义词汇表:
短语 | IPA | SoundsLike | DisplayAs |
---|
mig-per-kig | | mig-per-kig | mg / kg |
mike-per-kig-per-hour | | mike-per-kig-per-hour | mcg / kg /hr |
2-我尝试改变医学专业,但没有改进。
3-我尝试了使用常规的亚马逊转录与自定义词汇表以及一个包含这些短语在上下文中多个例子的10,000词语言模型。
4-如果不口头缩写短语,我可以获得更可靠的结果。现在不说“mikes per kig per hour“,反而说“micrograms per kilogram per hour”,但是需求方人为以这种冗长的方式说话会引起人们的烦恼和抵触情绪,使他们不愿使用该服务。
我是否错误地使用了词汇表?有什么其他方法可以提高这些短语的准确性吗?这让我很痛苦,因为准确性在其他方面非常好,但遗漏常见的用药短语不幸地成为一个小但关键的断奶器。