技术特征:
技术总结
本发明公开了一种多语言智能预处理实时统计机器翻译系统的预处理模块,所述预处理模块包括文本预处理模块和语音识别结果预处理模块,所述文本预处理模块用于对文本输入的语言进行单词规范化操作、类别识别标注及语块语序调整;所述语音识别结果预处理模块用于对语音进行单词规范化操作和标点预测。本发明的预处理模块能够对待翻译的文本语言进行单词规范化操作、类别识别标注以及语块语序调整等基本操作,方便后续翻译模块对待翻译语言文本的翻译;或者对语音语言进行单词规范化操作或者对语音流中的标点进行预测等预处理,方便后续机器翻译模块的翻译;本发明预处理模块对小概率词语进行标注并优先翻译,能够提高对小概率词语翻译的准确性。
技术研发人员:张昱琪;唐亮
受保护的技术使用者:唐亮
技术研发日:2017.03.30
技术公布日:2017.08.11