一种基于互联网大数据机器人物联网系统的制作方法

文档序号:15636988发布日期:2018-10-12 21:35阅读:160来源:国知局

本发明涉及物联网技术领域,具体为一种基于互联网大数据机器人物联网系统。



背景技术:

现代汉语有各种不同的地方语言,它们分布的区域很广。现代汉语各方言之间的差异表语音、词汇、语法各个方面,语音方面尤为突出。多数方言和共同语之间在语音上都有一定的对应规律,词汇、语法方面也有许多相同之处,因此它们不是独立的语言。各方言区的人互相不能通话,因此它们是很独立的语言,尤其是闽语中的各方言。按照现代通俗的分法,现代汉语方言可分为七大方言区。即官话方言、吴方言、湘方言、客家方言、闽方言、粤方言、赣方言。

目前的语音识别过程主要由声音分帧、内容提取和语义分析几个部分组成,语音识别需要把首尾端的静音切除,降低后续步骤造成的干扰。这个静音切除的操作一股称为vad,又称静音抑制,对声音进行分析,要对声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧。分帧操作一股不是简单的切开,而是使用两组移动窗函数来实现声音的分割,根据不同函数之间的时间差,使得帧与帧之间有交会的重叠的区域,称之为帧移分帧。

分帧后,语音就变成了很多小段。但波形在时域上几乎没有描述能力,因此必须将波形作变换。常见的一种变换方法是提取mfcc特征,mfcc为梅尔频率倒谱系数,根据人耳的生理特性,把每一帧波形变成一个多维向量,可以简单地理解为这个向量包含了这帧语音的内容信息。这个过程叫做声学特征提取。

识别过程是将若干帧堆砌组成状态,每三个状态组合成一个音素,若干个音素组合成一个单词,通过将每一帧对应的状态提取出来,就能够得到对应的语音内容,其中音素为单词或词语发音的组成单位,若干和音素组成一个词语或者单词。

但是上述语音识别技术都是基于官方语言特征进行语义识别的,而现阶段各地区的地方语言存在较大的差异性,人们通过方言很难实现跨地区交流,语义识别和翻译工作没有合理的声学数据模型,无法做到正确的方言翻译,不利于普通话的推广工作,地方语言的交流障碍亟待解决。



技术实现要素:

针对现有技术的不足,本发明提供了一种基于互联网大数据机器人物联网系统,通过机器人与云服务数据库的数据传输与比对,解决了地方语言交流障碍的问题。

为实现以上目的,本发明通过以下技术方案予以实现:一种基于互联网大数据机器人物联网系统,包括机器人、录入单元和翻译单元,所述录入单元与机器人相连,所述翻译单元与机器人相连;

所述录入单元包括定位模块和麦克风组,所述翻译单元包括扬声器组;

包括云服务数据库,所述机器人通过4g网络单元与云服务数据库相连;

包括筛选单元,所述筛选单元与云服务数据库相连;

包括后台分析单元,所述后台分析单元与云服务数据库相连。

进一步地,所述4g网络单元包括网络模块,所述网络模块独立设置于每台机器人上,所述网络模块与云服务数据库相连。

进一步地,所述筛选单元包括以下步骤:

ss01根据位置信息判断近似的几种语言种类;

ss02调出云服务数据库中近似的语言进行匹配;

ss03将重复或者近似度高的声音去除,留下清晰度最高的语言声音片段;

ss04按照声音片段音量大小对声音进行逐字拆分,录入数据库,将完整的声音片段和位置信息传输至后台分析单元。

进一步地,所述后台分析单元包括以下步骤:

ss05截取声音波形的前0.4秒-1.2秒范围的声音片段,将声音波形按照等距时间进行拆分;

ss06根据定位信息,将拆分的声音分帧与定位区域直径100公里的地方语言进行比对,判断几种近似语言种类;

ss07将完整的声音波形按照每15毫秒一帧进行拆分;

ss08将拆分后的声音分帧和云服务数据库中的相似声音进行匹配,根据近似的几种语言种类得出相对应的文字内容;

ss09对得到的文字内容进行语法逻辑检查,对识别错误的地方进行修正,修正完成后对文字内容进行翻译;

ss010在文字内容中挑出近似程度最高翻译结果录入数据库中。

进一步地,所述麦克风组包括两个麦克风和两个降噪麦克风,所述扬声器组包括低音单元和两个高音单元。

进一步地,所述云服务数据库分别由不同的地方语言数据库和官方数据库组成,所述云服务数据库分别由不同且独立的服务器和中央服务器进行运算,每一种地方语言对应一个服务器,识别过程中涉及的不同地方语言通过与之对应的服务器进行独立运算,分组运行识别语音,得出不同的语义结果由云服务数据库中的中央服务器进行近似筛选,选出最优翻译结果。

进一步地,包括以下步骤:

ss051利用vad技术对声音波形进行修剪,去除语音开始和结束中无用的声音边界;

ss052将修剪后的声音分别按照15毫秒和20毫秒进行拆分,得到若干帧移5毫秒分帧片段;

ss061以县级为区分单位对地方语言数据库进行区分,得到若干地方语言数据库,根据语音与地方语言数据库的比对选出六个最优近似数据库;

ss081将所得的六个地方语言数据库模型分批由对应的地方语言数据库服务器进行独立运算;

ss082将得出的语义结果传输至中央服务器。

进一步地,所述云服务器负责语音识别中的拆分和运算功能,机器人本身不具备识别和运算能力,整个识别和录入过程均需要通过互联网的传输进行技术支持,重复识别与录入操作完善整个云服务数据库声音模型。

本发明具有以下有益效果:

1、该基于互联网大数据机器人物联网系统,云服务数据库通过利用不同地方语言的数据库模型进行实时比对,依据相似度筛选出最优解,按照多组运算避免语音识别的不准确,具有提高翻译准确性的优点。

2、该基于互联网大数据机器人物联网系统,机器人通过连接互联网实时上传语音数据,通过服务器分组独立运算减少识别运算的压力,使得机器人在使用者说出语音后就直接进行翻译工作,减少了机器人翻译的响应时间,具有实时翻译地方语言的优点。

3、该基于互联网大数据机器人物联网系统,筛选单元通过比对不同的地方语言数据库,每个独立的地方语言数据库服务器可以从相似的数据库声学模型中提取有效的发音音素,根据发音的音素的相似性可以直接去除大量类似的发音内容,分组智能识别使得筛选单元能够处理大量的重复语音数据,高效剔除了大数据中无用性的优点。

4、该基于互联网大数据机器人物联网系统,后台分析单元可以通过识别声音来自主完善地方语言的声音模型数据库,减少了云服务数据库识别语音的运算处理压力,减少了云服务数据库中服务器宕机的风险。

当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一种基于互联网大数据机器人物联网系统的原理图;

图2为4g网络单元传输示意图;

图3为云服务数据库信息采集流程示意图;

图4为筛选单元流程示意图;

图5为后台分析单元流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

实施例一

请参阅图1,本发明提供一种技术方案:一种基于互联网大数据机器人物联网系统,包括机器人、录入单元和翻译单元,录入单元与机器人相连,翻译单元与机器人相连;

录入单元包括定位模块和麦克风组,翻译单元包括扬声器组;

包括云服务数据库,机器人通过4g网络单元与云服务数据库相连;

包括筛选单元,筛选单元与云服务数据库相连;

包括后台分析单元,后台分析单元与云服务数据库相连。

其中如图2所示,4g网络单元包括网络模块,网络模块独立设置于每台机器人上,网络模块与云服务数据库相连。

其中如图3-4所示,筛选单元包括以下步骤:

ss01根据位置信息判断近似的几种语言种类;

ss02调出云服务数据库中近似的语言进行匹配;

ss03将重复或者近似度高的声音去除,留下清晰度最高的语言声音片段;

ss04按照声音片段音量大小对声音进行逐字拆分,录入数据库,将完整的声音片段和位置信息传输至后台分析单元。

其中如图5所示,后台分析单元包括以下步骤:

ss05截取声音波形的前0.4秒-1.2秒范围的声音片段,将声音波形按照等距时间进行拆分;

ss06根据定位信息,将拆分的声音分帧与定位区域直径100公里的地方语言进行比对,判断几种近似语言种类;

ss07将完整的声音波形按照每15毫秒一帧进行拆分;

ss08将拆分后的声音分帧和云服务数据库中的相似声音进行匹配,根据近似的几种语言种类得出相对应的文字内容;

ss09对得到的文字内容进行语法逻辑检查,对识别错误的地方进行修正,修正完成后对文字内容进行翻译;

ss010在文字内容中挑出近似程度最高翻译结果录入数据库中。

其中,麦克风组包括两个麦克风和两个降噪麦克风,扬声器组包括低音单元和两个高音单元。

其中,云服务数据库分别由不同的地方语言数据库和官方数据库组成,云服务数据库分别由不同且独立的服务器和中央服务器进行运算,每一种地方语言对应一个服务器,识别过程中涉及的不同地方语言通过与之对应的服务器进行独立运算,分组运行识别语音,得出不同的语义结果由云服务数据库中的中央服务器进行近似筛选,选出最优翻译结果。

其中,包括以下步骤:

ss051利用vad技术对声音波形进行修剪,去除语音开始和结束中无用的声音边界;

ss052将修剪后的声音分别按照15毫秒和20毫秒进行拆分,得到若干帧移5毫秒分帧片段;

ss061以县级为区分单位对地方语言数据库进行区分,得到若干地方语言数据库,根据语音与地方语言数据库的比对选出六个最优近似数据库。

ss081将所得的六个地方语言数据库模型分批由对应的地方语言数据库服务器进行独立运算;

ss082将得出的语义结果传输至中央服务器。

其中,云服务器负责语音识别中的拆分和运算功能,机器人本身不具备识别和运算能力,整个识别和录入过程均需要通过互联网的传输进行技术支持,重复识别与录入操作完善整个云服务数据库声音模型。

实施例二

使用者发出声音时麦克风激活,麦克风对语言声音进行采集,降噪麦克风将语言声音中的环境杂音进行过滤,定位模块对机器人所在区域位置信息进行采集,机器人将所得数据通过网络模块上传至云服务数据库;

云服务数据库根据位置信息调取直径100公里范围内的地方语言资料库用于参照,云服务数据库将语言声音按照每帧15毫秒进行分帧拆分,将拆分的声音信息与地方语言资料库进行比对,输出高相似翻译文字结果,转化成普通话声音文件;

普通话声音文件通过网络模块传输至上传的机器人,通过扬声器组发出翻译后的普通话声音,整个翻译过程在使用者说出语言0.4秒后机器人就开始实时上传数据,并且迅速完成数据调用和对比,在使用者说完语言信息后,云服务数据库可以在短时间内输出翻译结果,机器人翻译反馈的时间根据4g网络单元的传输质量而定。

实施例三

若机器人传输的地方语言信息云服务数据库中没有相对应的资料时,系统会将未识别的语言信息临时存储在云服务数据库中;

存储的未识别声音信息中存在大量重复内容,筛选单元工作,将大量重复的信息通过比对完成筛选;

后台分析单元对筛选后的声音信息进行拆分,将拆分的信息进行分析,得到近似的几个翻译结果,将其中最高相似翻译结果转化为声音文件,通过网络模块传输至机器人,扬声器组进行翻译播报,后台分析单元输出的几个翻译结果通过人为干预的方式进行修正,所得翻译结果录入云服务器数据库,有利于减少云服务数据库优化算法的工作量;

云服务数据库对人为修正的翻译结果进行记录,用于完善云服务器的识别算法,重复上述步骤来进一步完善云服务数据库,有利于提高翻译的准确性。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1