一种基于图书服务机器人的语音交互装置的制作方法

文档序号:13002963阅读:178来源:国知局

本实用新型涉及信息处理技术,语音识别,语义分析,语音合成,机器学习,互联网,尤其涉及一种基于图书服务机器人的人语音交互装置。



背景技术:

当前,人工智能技术的发展带动了机器人领域,而机器人的发展促进了人工智能技术的发展,迫切的需要将人工智能技术植入到机器人本体上,让机器人的智商变的更高,更好的具有职业技能。图书服务机器人就是其中的一种应用,但是目前现有的图书服务机器人,都是以被动的方式工作,用户无法与作者沟通,机器人也不能很好的整理出客户所感兴趣的专栏,能够更好的给客户推荐书籍。



技术实现要素:

因此,本实用新型目的是提供一种基于图书服务机器人的语音交互装置,此装置或嵌入到手机中,或嵌入图书服务机器人本体内,可以精准的获取用户的语音内容进行识别,将其转译为文字并分析其语义,针对内容提供回复,并收集客户的阅读信息以及历史提问,以便更好的了解客户的需求。

语音交互装置包括移动端语音采集模块,语音传输模块,语音识别模块,关键词检测模块,信息推送模块和离线训练模块;

所述的移动端语音采集模块用于装置启动后,不断的在移动端采集音频数据;

所述的语音传输模块用于针对移动端语音采集模块采集到的音频,做压缩和加密处理,通过无线网络传送到后台云端分析系统;

所述的语音识别模块用于针对语音传输模块传送上来的语音,进行解压和反加密处理,提取音频的特征,进行声纹识别,确认说话人身份,并与模型库中的语音模型进行匹配,返回识别结果;

所述的关键词检测模块用于将语音识别模块返回的识别结果与模型库中预存储的关键词进行匹配,返回匹配度最高的关键词识别结果;

所述的信息推送模块用于搜索与关键词检测模块检测到的关键词匹配的预播放的信息文字,发送信息文字到手机端,进行播放;

所述的离线训练模块用于针对搜集的语音样本,进行人工标注,提取语音特征,进行训练,将训练后的语音模型存储到模型库中。

进一步的,移动端语音采集模块内置于手机端,用于当手机端检测到有语音时自动开启,并以一个频率不断的采集音频数据。

进一步的,所述的离线训练模块用于针对搜集的语音样本,进行人工标注,提取语音特征,采用混合高斯模型进行训练,将训练后的语音模型存储到模型库中。

本实用新型的有益效果在于:本实用新型的基于图书服务机器人的语音交互装置,既可以以手机应用的形式使用,同时可以嵌入到图书服务器机器人本体内,可以将被动阅读的图书,变为主动获取,根据用户提出的问题,检索提炼图书内容,提高用户的读书体验;同时也为用户提供了直接与作者沟通的途径,机器人将模拟作者的声音,为读者读书或解答问题;该应用可以通过对读者阅读历史、提问历史等信息进行大数据分析,整理出客户所感兴趣的专栏,能够更好的给客户推荐书籍。本实用新型的装置可以接入任何一个互联网APP中,达到采集用户的语音信息,进行特定人身份识别和语音识别,与客户进行自由交流互动。

附图说明

图1为本实用新型一种基于图书服务机器人的语音交互装置的示意图。

具体实施方式

下面结合附图对本实用新型的具体实施方式进行说明:

本实用新型实施例技术方案中,装置主要包括以下三个方面:

第一方面:语音获取单元,手机端内置采集语音模块,当检测到有语音时,自动开启语音采集模块,以一个频率不断的采集音频数据,将采集的音频数据数据,进行压缩和加密处理,通过无线网络传送到云端分析服务器,分析服务器端进行解压和反加密处理,获取采集到的语音数据。

第二方面:语音识别单元,提取音频的梅尔倒谱系数(MFCC)特征,进行声纹识别,确认说话人身份,结合k-mean及LBG算法,以GMM高斯混合模型建立训练库并与库内的声纹特征参数进行匹配识别,返回识别结果。将识别结果与库中预存储的关键词进行匹配,返回匹配度最高的关键词识别结果。搜索到与关键词匹配的预播放的信息文字,发送信息文字到手机端,进行播放。

第三方面:训练单元,针对搜集的语音样本,进行人工标注,结合k-mean及LBG算法,提取语音的特征,采用混合高斯进行训练,存储训练后的模型。

具体的技术方案如图1所示,一种基于图书服务机器人的语音交互装置,包括移动端语音采集模块,语音传输模块,语音识别模块,关键词检测模块,信息推送模块和离线训练模块;

所述的移动端语音采集模块用于装置启动后,不断的在移动端采集音频数据;

所述的语音传输模块用于针对移动端语音采集模块采集到的音频,做压缩和加密处理,通过无线网络传送到后台云端分析系统;

所述的语音识别模块用于针对语音传输模块传送上来的语音,进行解压和反加密处理,提取音频的特征,进行声纹识别,确认说话人身份,并与模型库中的语音模型进行匹配,返回识别结果;

所述的关键词检测模块用于将语音识别模块返回的识别结果与模型库中预 存储的关键词进行匹配,返回匹配度最高的关键词识别结果;

所述的信息推送模块用于搜索与关键词检测模块检测到的关键词匹配的预播放的信息文字,发送信息文字到手机端,进行播放;

所述的离线训练模块用于针对搜集的语音样本,进行人工标注,提取语音特征,进行训练,将训练后的语音模型存储到模型库中。

优选的,移动端语音采集模块内置于手机端,用于当手机端检测到有语音时自动开启,并以一个频率不断的采集音频数据。

优选的,所述的离线训练模块用于针对搜集的语音样本,进行人工标注,提取语音特征,采用混合高斯模型进行训练,将训练后的语音模型存储到模型库中。

本领域技术人员可以知晓,本申请的实施例采用完全硬件实施例的形式实现。可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的产品的形式实现。

以上所述是本实用新型的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本实用新型所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本实用新型的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1