一种仿真机器人语音系统的制作方法

文档序号:22878249发布日期:2020-11-10 17:32阅读:204来源:国知局
一种仿真机器人语音系统的制作方法

本发明涉及机器人技术领域,尤其涉及一种仿真机器人语音系统。



背景技术:

目前针对仿真机器人的特点,要想让仿真机器人像真人一样,仿真机器人设计和控制就必须考虑到言谈、行为、情绪和思考能力这四个方面,并要把此四要素作为仿真机器人设计和控制的出发点和仿真机器人设计和控制任务是否完成的评判点;仿真机器人控制系统较复杂,涉及的技术较多,包括语音相关技术、电机控制技术、多媒体技术、多串口通信技术;四个要素中,语音技术最能够表达机器人情感的基础,而一些语音系统的词汇量单一,功能单一,无法更好的呈现仿真机器人的特点。

经检索,中国专利申请号为cn200920155944.0的专利,公开了一种用于机器人的语音系统及带有该语音系统的机器人,所述语音系统包括音频文件存储单元和语音控制单元,所述音频文件存储单元存储有从音频文件制作单元获取的音频文件;所述音频文件制作单元位于机器人外部,所述音频文件存储单元所存储的数据可以依据使用者的需求进行制作、修改或更换,所述语音控制单元根据接收到的机器人状态信息,将存储在音频文件存储单元中的对应于该状态的音频文件中的音频数据转换为相应的模拟信号播出;上述专利虽使得机器人具备一定的语音表达能力,但随着社会不断发展,各种新型词汇的出现,使得该系统不能够很好的融入并使用;针对无法做出应答的交互信息,不能够利用其相近的同义词来执行指令。



技术实现要素:

本发明的目的是为了解决现有技术中存在的缺点,而提出的一种仿真机器人语音系统。

为了实现上述目的,本发明采用了如下技术方案:

一种仿真机器人语音系统,基于智能机器人硬件平台的android应用程序,开发语言为java,具体包括语音识别模块、分析处理模块、学习模块、语音播放模块、信号输入输出模块、中央控制模块;所述学习模块包括匹配单元、同义词库和语音库;所述分析处理模块分别连接语音识别模块、学习模块、语音播放模块和中央控制模块;信号输入输出模块连接中央控制模块和语音库;语音库和同义词库通过信号输入输出模块接入互联网定期更新互联网热词。

优选地:所述语音识别模块包括语音降噪单元和语音拾取单元,语音拾取单元用于拾取外界语音信息,语音降噪单元用于对语音拾取单元拾取的语音信息进行降噪处理,并将语音信息传输至分析处理模块;分析处理模块用于分析、处理语音降噪单元传递的语音信息。

优选地:所述语音库包括快捷应答区、交互区、多媒体区和翻译区;快捷应答区录有快捷应答语,快捷应答语包括:“请再说一遍”“对不起”“谢谢”“好的”,基于分析处理模块的处理命令通过语音播放模块做出应答。

优选地:所述分析处理模块基于传递的语音信息波长、频率进行分析,对语音信息清晰度进行判定,判定为不清晰的,直接基于快捷应答语中的“请再说一遍”通过语音播放模块做出应答;判定为清晰的进行进一步分析,进一步分析具体为提取语音信息中的关键字,通过匹配单元进行关键字匹配,从而做出应答。

优选地:所述提取语音信息中的关键字具体为,提取语音信息中的主语、宾语、肢体命令性词汇和功能命令性词汇;所述关键字匹配具体为将关键字信息在同义词库进行检索,得出意思相仿的且可执行的同义词,基于得出的同义词传输指令至中央控制模块执行肢体指令,或在快捷应答区、交互区、多媒体区和翻译区选择对应的应答语,通过语音播放模块做出应答。

优选地:所述多媒体区设有新闻播报、音乐播放、故事播放、笑话播放的音频信息;所述翻译区设有英语、日语、韩语、俄语的音频信息;所述翻译区经分析处理模块分析播报时,未检索到播报结果的配合同义词库结合翻译。

优选地:所述语音播放模块做出应答的同时,中央控制模块同样对机器人肢体控制端发出指令,做出模拟人类说话时的嘴唇动作、眼睛眨眼的动作、眼珠的转动动作、脖子的转动动作、手臂的摆动动作。

优选地:所述信号输入输出模块包括usb接口单元、无线网络单元、蓝牙单元,可通过usb接口单元、无线网络单元和蓝牙单元对同义词库和语音库进行更新。

一种仿真机器人语音系统,基于智能机器人硬件平台的android应用程序,开发语言为java,具体包括语音识别模块、分析处理模块、学习模块、语音播放模块、信号输入输出模块、中央控制模块、视频显示模块;所述学习模块包括匹配单元、同义词库和语音库;所述分析处理模块分别连接语音识别模块、学习模块、语音播放模块和中央控制模块;信号输入输出模块连接中央控制模块和语音库;语音库和同义词库通过信号输入输出模块接入互联网定期更新互联网热词。

优选地:所述多媒体区设有新闻播报、音乐播放、故事播放、笑话播放的音频信息以及电视节目、电影、动漫的视频信息;所述翻译区设有英语、日语、韩语、俄语的音频信息;所述翻译区经分析处理模块分析播报时,未检索到播报结果的配合同义词库结合翻译。

本发明的有益效果为:

1.本发明的语音系统可以实现机器人与人进行语音识别之外,还可以对用户所说的话进行语意分析和理解,然后再对用户进行合理的应答,达到交流和沟通的目的,针对无法做出应答的语音信息,能够利用其相近的同义词来执行指令,提升了可靠性。

2.本发明通过设置语音库和同义词库通过信号输入输出模块接入互联网定期更新互联网热词,能够顺应社会的发展,提升个性化,通过设置语音播放模块做出应答的同时,中央控制模块同样对机器人肢体控制端发出指令,做出模拟人类说话时的肢体动作,体现了仿真机器人的特点。

3.本发明通过设置多媒体区和翻译区,能够根据互动者的不同需要,分别提供新闻和音乐等音频播放功能、动漫和电影等视频观赏功能以及不同语种的翻译功能,体现了仿真机器人的功能性,保障了互动体验。

4.通过设置分析处理模块基于传递的语音信息波长、频率进行分析,对语音信息清晰度进行判定,判定为不清晰的,基于快捷应答语做出应答;提升了系统的可靠性,进一步体现了仿真机器人的特点。

附图说明

图1为本发明提出的一种仿真机器人语音系统的框架图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

实施例1:

一种仿真机器人语音系统,基于智能机器人硬件平台的android应用程序,开发语言为java;具体包括语音识别模块、分析处理模块、学习模块、语音播放模块、信号输入输出模块、中央控制模块;所述学习模块包括匹配单元、同义词库和语音库;所述分析处理模块分别连接语音识别模块、学习模块、语音播放模块和中央控制模块;信号输入输出模块连接中央控制模块和语音库;语音库和同义词库通过信号输入输出模块接入互联网定期更新互联网热词;语音库和同义词库通过信号输入输出模块接入互联网定期更新互联网热词。

所述语音识别模块包括语音降噪单元和语音拾取单元,语音拾取单元用于拾取外界语音信息,语音降噪单元用于对语音拾取单元拾取的语音信息进行降噪处理,并将语音信息传输至分析处理模块;分析处理模块用于分析、处理语音降噪单元传递的语音信息。

所述语音库包括快捷应答区、交互区、多媒体区和翻译区;快捷应答区录有快捷应答语,快捷应答语包括:“请再说一遍”“对不起”“谢谢”“好的”,基于分析处理模块的处理命令通过语音播放模块做出应答。

所述分析处理模块基于传递的语音信息波长、频率进行分析,对语音信息清晰度进行判定,判定为不清晰的,直接基于快捷应答语中的“请再说一遍”通过语音播放模块做出应答;判定为清晰的进行进一步分析,进一步分析具体为提取语音信息中的关键字,通过匹配单元进行关键字匹配,从而做出应答。

所述提取语音信息中的关键字具体为,提取语音信息中的主语、宾语、肢体命令性词汇(如:走、蹲等)和功能命令性词汇(如:播放、翻译等);所述关键字匹配具体为将关键字信息在同义词库进行检索,得出意思相仿的且可执行的同义词,基于得出的同义词传输指令至中央控制模块执行肢体指令,或在快捷应答区、交互区、多媒体区和翻译区选择对应的应答语,通过语音播放模块做出应答。

所述多媒体区设有新闻播报、音乐播放、故事播放、笑话播放的音频信息;所述翻译区设有英语、日语、韩语、俄语的音频信息;所述翻译区经分析处理模块分析播报时,未检索到播报结果的配合同义词库结合翻译。

所述语音播放模块做出应答的同时,中央控制模块同样对机器人肢体控制端发出指令,做出模拟人类说话时的嘴唇动作、眼睛眨眼的动作、眼珠的转动动作、脖子的转动动作、手臂的摆动动作。

所述信号输入输出模块包括usb接口单元、无线网络单元、蓝牙单元,可通过usb接口单元、无线网络单元和蓝牙单元对同义词库和语音库进行更新。

实施例2:

一种仿真机器人语音系统,基于智能机器人硬件平台的android应用程序,开发语言为java;具体包括语音识别模块、分析处理模块、学习模块、语音播放模块、信号输入输出模块、中央控制模块、视频显示模块;所述学习模块包括匹配单元、同义词库和语音库;所述分析处理模块分别连接语音识别模块、学习模块、语音播放模块和中央控制模块;信号输入输出模块连接中央控制模块和语音库;语音库和同义词库通过信号输入输出模块接入互联网定期更新互联网热词。

所述语音识别模块包括语音降噪单元和语音拾取单元,语音拾取单元用于拾取外界语音信息,语音降噪单元用于对语音拾取单元拾取的语音信息进行降噪处理,并将语音信息传输至分析处理模块;分析处理模块用于分析、处理语音降噪单元传递的语音信息。

所述语音库包括快捷应答区、交互区、多媒体区和翻译区;快捷应答区录有快捷应答语,快捷应答语包括:“请再说一遍”“对不起”“谢谢”“好的”,基于分析处理模块的处理命令通过语音播放模块做出应答。

所述分析处理模块基于传递的语音信息波长、频率进行分析,对语音信息清晰度进行判定,判定为不清晰的,直接基于快捷应答语中的“请再说一遍”通过语音播放模块做出应答;判定为清晰的进行进一步分析,进一步分析具体为提取语音信息中的关键字,通过匹配单元进行关键字匹配,从而做出应答。

所述提取语音信息中的关键字具体为,提取语音信息中的主语、宾语、肢体命令性词汇(如:走、蹲等)和功能命令性词汇(如:播放、翻译等);所述关键字匹配具体为将关键字信息在同义词库进行检索,得出意思相仿的且可执行的同义词,基于得出的同义词传输指令至中央控制模块执行肢体指令,或在快捷应答区、交互区、多媒体区和翻译区选择对应的应答语,通过语音播放模块做出应答。

所述多媒体区设有新闻播报、音乐播放、故事播放、笑话播放的音频信息以及电视节目、电影、动漫的视频信息;所述翻译区设有英语、日语、韩语、俄语的音频信息;所述翻译区经分析处理模块分析播报时,未检索到播报结果的配合同义词库结合翻译。

所述语音播放模块做出应答的同时,中央控制模块同样对机器人肢体控制端发出指令,做出模拟人类说话时的嘴唇动作、眼睛眨眼的动作、眼珠的转动动作、脖子的转动动作、手臂的摆动动作。

所述信号输入输出模块包括usb接口单元、无线网络单元、蓝牙单元,可通过usb接口单元、无线网络单元和蓝牙单元对同义词库和语音库进行更新。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1