交互式3d语音服务系统的制作方法

文档序号：2826156阅读：271来源：国知局

交互式3d语音服务系统的制作方法
【专利摘要】本发明涉及一种交互式3D语音服务系统，包括用户终端和服务器，其中，所述用户终端，用于采集用户的表情和语音并上传给所述服务器；所述服务器，用于接收和处理所述表情和语音，生成3D虚拟人物视频并发送给所述用户终端。本发明基于语音识别技术和3D虚拟人物技术，将其与电视机、家庭智能设备、移动智能终端等结合，通过采集用户的表情和语音，并根据该语音提取关键词，通过搜索得到与关键词对应的结果，并将该表情和语音赋予在3D虚拟人物模型上，形成3D虚拟人物视频并发送给用户终端，由用户终端播放和显示，完成用户的需求。
【专利说明】交互式3D语音服务系统
【技术领域】
[0001]本发明涉及一种服务系统，尤其涉及一种交互式3D语音服务系统。
【背景技术】
[0002]在家庭中，由于网络电视可提供给用户的内容资源过多，有时为了收看一些特定的节目，不得不在大量的节目单中找寻，浪费了大量的时间，造成使用上的不便；另外，在很多公众场合，设置了一些用于信息查询的终端，其一般是由触摸屏和电脑一起构成，由用户通过触摸来进行查询或者用鼠标、键盘来查询，不能直接通过会话来进行信息查询，这对一些手部不灵活的人造成了很大的不便，使得服务缺乏人性化。

【发明内容】

[0003]本发明克服了现有技术的不足，提供一种使用便捷、反应快速的交互式3D语音服务系统。
[0004]为达到上述目的，本发明采用的技术方案为:一种交互式3D语音服务系统，包括用户终端和服务器，其中，
所述用户终端，用于采集用户的表情和语音并上传给所述服务器；
所述服务器，用于接收、处理所述表情和语音，生成3D虚拟人物视频并发送给所述用户终端。
[0005]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述用户终端包括摄像模块、语音模块和播放模块。
[0006]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述服务器包括表情接收模块、语音接收模块、表情处理模块、语音处理模块、搜索模块、数据库、表情重现模块和语音重现模块。
[0007]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述语音处理模块包括语音转文字模块和文字转语音模块。
[0008]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述搜索模块根据所述语音转文字模块提取的关键词在所述数据库中进行搜索。
[0009]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述搜索模块根据所述语音转文字模块提取的关键词通过连接无线网络进行搜索。
[0010]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述搜索的结果反馈给所述文字转语音模块。
[0011]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述用户终端还包括将所述表情和语音发送给所述服务器的上传模块。
[0012]本发明一个较佳实施例中，交互式3D语音服务系统进一步包括所述上传模块通过无线网络将所述表情和语音发送给所述服务器。
[0013]本发明解决了【背景技术】中存在的缺陷，本发明基于语音识别技术和3D虚拟人物技术，将其与电视机、家庭智能设备、移动智能终端等结合，通过采集用户的表情和语音，并根据该语音提取关键词，通过搜索得到与关键词对应的结果，并将该表情和语音赋予在3D虚拟人物模型上，形成3D虚拟人物视频并发送给用户终端，由用户终端播放和显示，完成用户的需求。
【专利附图】

【附图说明】
[0014]下面结合附图和实施例对本发明进一步说明。
[0015]图1是本发明的优选实施例的结构框图；
图中:2、用户终端，4、服务器，6、摄像装置，8、语音模块，10、上传模块，12、播放模块，14、表情接收模块，16、语音接收模块，18、表情处理模块，20、语音处理模块，22、搜索模块，24、数据库，26、表情重现模块，28、语音重新模块，30、语音转文字模块，32、文字转语音模块，34、3D虚拟人模型。
【具体实施方式】
[0016]现在结合附图和实施例对本发明作进一步详细的说明，这些附图均为简化的示意图，仅以示意方式说明本发明的基本结构，因此其仅显示与本发明有关的构成。
[0017]如图1所示，一种交互式3D语音服务系统，包括用户终端2和服务器4。其中，用户终端2为智能电视机、电脑、智能手机、银行终端、医院终端等，用于采集用户的表情和语音并上传给服务器4;服务器4，用于接收、处理表情和语音，生成3D虚拟人物视频并发送给用户终端2。
[0018]本发明优选用户终端2包括摄像模块6、语音模块8、上传模块10和播放模块12。摄像模块6为摄像头，用于采集用户的表情；语音模块8为麦克风，用于采集用户的语音；上传模块10通过无线网络将采集的表情和语音发送给服务器4，该无线网络可以为红外、微波、WIFI或3G网络；播放模块12用于播放服务器4传送的3D虚拟人物视频。
[0019]服务器4包括表情接收模块14、语音接收模块16、表情处理模块18、语音处理模块20、搜索模块22、数据库24、表情重现模块26和语音重现模块28。其中，表情处理模块18用于将用户的表情分割成由若干个单一五官或脸部肌肉位置组成的表情记录；语音处理模块20包括语音转文字模块30和文字转语音模块32，用于将用户的语音转换成文字和将文字转换成用户的语音；搜索模块22根据语音转文字模块30提取的文字形式的关键词在数据库24中进行搜索；或者当数据库24内所存储的内容没有与关键词匹配的内容时，搜索模块22根据语音转文字模块30提取的文字形式的关键词通过连接无线网络进行搜索；搜索的结果反馈给文字转语音模块32，将搜索到的文字形式的结果转换成语音。
[0020]本发明的交互式3D语音服务系统在使用时，用户通过语音和表情向用户终端发送需求，如用户到达一个医院，需要寻找眼科医生的相关信息，则只需要说“我眼睛疼”，用户终端2的摄像模块6和语音模块8采集用户的表情和语音并上传至服务器4，服务器4通过3D建模软件制作出3D虚拟人模型34，语音处理模块20的语音转文字模块30提取语音的“眼睛”关键词并转换为文字形式，通过搜索模块22在数据库24内或通过连接无线网络进行搜索，将眼科医生的相关信息传送给文字转语音模块32，表情处理模块18将表情分割成由若干个单一五官或脸部肌肉位置组成的表情记录，例如眨眼、眼睛睁大、嘴巴鼓起等，文字转语音模块32将搜索的结果转换成用户的语音，再通过表情重现模块26和语音重现模块28在3D虚拟人模型34上重现用户的表情和语音，3D虚拟人模型34会做与用户相同的表情，同时说出“眼科医生在三楼305室”，形成3D虚拟人物视频，最后发送给用户终端2，由播放模块12播放。
[0021]以上依据本发明的理想实施例为启示，通过上述的说明内容，相关人员完全可以在不偏离本项发明技术思想的范围内，进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容，必须要根据权利要求范围来确定技术性范围。
【权利要求】
1.一种交互式3D语音服务系统，其特征在于，包括用户终端和服务器，其中，所述用户终端，用于采集用户的表情和语音并上传给所述服务器；所述服务器，用于接收、处理所述表情和语音，生成3D虚拟人物视频并发送给所述用户终端。
2.根据权利要求1所述的交互式3D语音服务系统，其特征在于:所述用户终端包括摄像模块、语音模块和播放模块。
3.根据权利要求2所述的交互式3D语音服务系统，其特征在于:所述服务器包括表情接收模块、语音接收模块、表情处理模块、语音处理模块、搜索模块、数据库、表情重现模块和语音重现模块。
4.根据权利要求3所述的交互式3D语音服务系统，其特征在于:所述语音处理模块包括语音转文字模块和文字转语音模块。
5.根据权利要求4所述的交互式3D语音服务系统，其特征在于:所述搜索模块根据所述语音转文字模块提取的关键词在所述数据库中进行搜索。
6.根据权利要求4所述的交互式3D语音服务系统，其特征在于:所述搜索模块根据所述语音转文字模块提取的关键词通过连接无线网络进行搜索。
7.根据权利要求5或6所述的交互式3D语音服务系统，其特征在于:所述搜索的结果反馈给所述文字转语音模块。
8.根据权利要求2所述的交互式3D语音服务系统，其特征在于:所述用户终端还包括将所述表情和语音发送给所述服务器的上传模块。
9.根据权利要求7所述的交互式3D语音服务系统，其特征在于:所述上传模块通过无线网络将所述表情和语音发送给所述服务器。
【文档编号】G10L15/26GK103428293SQ201310363987
【公开日】2013年12月4日申请日期:2013年8月19日优先权日:2013年8月19日
【发明者】张国祥, 罗霄申请人:苏州跨界软件科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张国祥;罗霄
技术所有人：苏州跨界软件科技有限公司
我是此专利的发明人

上一篇：一种信息处理方法及电子设备的制作方法
上一篇：实现语音命令控制的方法、设备及系统的制作方法