一种现场会议人工智能同传设备的制作方法

文档序号:17544383发布日期:2019-04-29 15:09阅读:401来源:国知局
一种现场会议人工智能同传设备的制作方法

本发明涉及智能同传翻译设备技术领域,特别是涉及一种现场会议人工智能同传设备。



背景技术:

目前市面上逐渐出现了会议翻译机的硬件设备,其集成运用了google、微软等ai人工智能,极大的简化了会议流程,让沟通更加顺畅便捷,相对于人工翻译更加简洁高效,但目前的会议翻译机,一人一个话筒,说a语言的人拿a话筒,说b语言的人拿b话筒,十分不便,且翻译设备还存在种种不足,严重影响了翻译质量,容易对会议造成一定的影响。



技术实现要素:

为了克服现有技术的不足,本发明提供一种现场会议人工智能同传设备,其翻译质量高、能快速同传翻译多国语言文字,并进行同步播报,有利于会议的进行。

为解决上述技术问题,本发明提供如下技术方案:一种现场会议人工智能同传设备,所述设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、asr语音识别模块、自动判断语种模块、神经网络翻译模块;所述麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;所述回声消除模块可消除接收语音中的回声,所述噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;所述声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;所述asr语音识别模块能够将用户语音翻译成文字;所述自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;所述神经网络翻译模块连接有翻译库,所述翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过asr语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,所述神经网络翻译模块还连接有tts播报模块和显示器,所述tts播报模块能够将文字生成对应语种国家人的声音,进而播放出来,所述显示屏显示最终翻译的文字结果。

作为本发明的一种有限技术方案,所述显示屏通过外接接口连接投屏模块,所述投屏模块投影显示最终翻译的文字结果,便于参会人员观看。

作为本发明的一种有限技术方案,所述显示屏通过蓝牙或wifi或hdmi有线或android或airplay与投屏模块连接,通过多种连接方式的调换,可保证连接顺利,让开会过程实时展现。

作为本发明的一种有限技术方案,所述麦克风阵列为四麦或六麦或八麦等麦克风阵列,可根据参会人数的多少,调整麦克风阵列中麦克风的数量,提高各个方向上的拾音能力。

作为本发明的一种有限技术方案,所述tts播报模块连接有手动开关,方便手动开关tts播报模块,若会场需要安静可手动关闭tts播报模块,通过显示屏呈现最终翻译的文字结果。

与现有技术相比,本发明能达到的有益效果是:

1)本发明能够自动判断语言,一直记录谈话内容,并实时显示在屏幕上,由于能自动判断语言,无需专用语种话筒,会议桌上直接放置麦克风,自由说话,还原开会真实场景;

2)可以实时更换翻译语料库,根据会议性质切换翻译的语料,例如医学翻译语料、电子翻译语料、金融翻译语料,提高会议专业术语的翻译准确度,从而保证翻译质量;

3)可“流式翻译”:一边识别说话者说话,一边显示他说的话,一边立刻显示翻译文字,呈现出来的几乎是说话者吐一个字翻译一个字,并根据上下句实时调整翻译结果;

4)自带声纹识别,不仅会自动判断语种,而且会标记是哪个人说话的话,谁发言的都有详细记录并有对应翻译;

5)自带屏幕,且拥有蓝牙、wifi、hdmi有线、android、airplay等投屏手段,投放到会议屏幕或电视机上,让开会过程实时展现;

6)拥有环形麦克风阵列,在会场各个角落都能清晰识别说话者声音;

7)拥有回声消除装置、噪声消除装置,在会议封闭环境下,能有效消除会议室回声,从而保证录音效果。

附图说明

图1是本发明的模块结构原理图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

请参照图1所示,一种现场会议人工智能同传设备,设备包括依次连接的麦克风阵列、回声消除模块、噪声消除模块、声纹识别模块、asr语音识别模块、自动判断语种模块、神经网络翻译模块;麦克风阵列为环形麦克风阵列,均匀分布于会议桌外圈,目的是提高各个方向上的拾音能力,让用户在会议桌各个方向说话都能被设备准确识别;回声消除模块可消除接收语音中的回声,噪声消除模块能够消除接收语音中的各种背景音、背景噪声,提高接收语音的清晰度;声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;asr语音识别模块能够将用户语音翻译成文字;自动判断语种模块能够将自动判断用户说话的语种,并且标记现场会议有哪几个国家的人,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;神经网络翻译模块连接有翻译库,翻译库内包括各语种专业翻译库,会议开始时切换相应专业翻译库,通过asr语音识别模块得到文字后,放入神经网络翻译模块得到对应国家语种翻译结果的文字,神经网络翻译模块还连接有tts播报模块和显示器,tts播报模块能够将文字生成对应语种国家人的声音,进而播放出来,显示屏显示最终翻译的文字结果。

显示屏通过外接接口连接投屏模块,投屏模块投影显示最终翻译的文字结果,便于参会人员观看。

显示屏通过蓝牙或wifi或hdmi有线或android或airplay与投屏模块连接,通过多种连接方式的调换,可保证连接顺利,让开会过程实时展现。

麦克风阵列为四麦或六麦或八麦等麦克风阵列,可根据参会人数的多少,调整麦克风阵列中麦克风的数量,提高各个方向上的拾音能力。

tts播报模块连接有手动开关,方便手动开关tts播报模块,若会场需要安静可手动关闭tts播报模块,通过显示屏呈现最终翻译的文字结果。

具体的,该装置使用时,会议举办者在会议开始前,在会议机上设置这次会议会有哪几种语言,例如选择中文、英语、法语、日语四种;会议机摆放在会议桌中间,并且会议机投屏到会议屏幕上;会议各人员到达会议室,开始会议,若用户a说中文,b说英语,c说法语,d说日语;a说话时,会议屏幕上记录下a用户说的话,并且下方实时展示将用户a中文翻译成的英语、法语、日语;b说话时,会议屏幕上记录下b用户说的话,并且下方实时展示用户b英文翻译成的中文、法语、日语;依次类推。

本发明的实施方式不限于此,按照本发明的上述实施例内容,利用本领域的常规技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,以上优选实施例还可以做出其它多种形式的修改、替换或组合,所获得的其它实施例均落在本发明权利保护范围之内。



技术特征:

技术总结
本发明公开了一种现场会议人工智能同传设备,其中麦克风阵列可提高各个方向上的拾音能力,让会议桌各个方向说话都能被设备识别;回声消除模块可消除接收语音中的回声,噪声消除模块能够消除接收语音中的各种噪声,提高接收语音的清晰度;声纹识别模块能够通过声纹识别标记是哪个人说话,指明说话者的性别、年龄等特征;ASR语音识别模块能够将用户语音翻译成文字;自动判断语种模块能够将自动判断用户说话的语种,进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字;神经网络翻译模块配合翻译库,给出参会对应国家语种翻译结果的文字,TTS播报模块能够将文字生成对应语种国家人的声音,进而播放出来,显示屏显示最终翻译的文字结果。

技术研发人员:张岩;代同杰;熊涛
受保护的技术使用者:深圳市合言信息科技有限公司
技术研发日:2019.02.26
技术公布日:2019.04.26
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1