一种适用于重口音的老人机顶盒智能语音识别方法与流程

文档序号：17735258发布日期：2019-05-22 03:08阅读：823来源：国知局

本发明涉及机顶盒技术领域，具体为一种适用于重口音的老人机顶盒智能语音识别方法。

背景技术：

数字视频变换盒，通常称作机顶盒或机上盒，是一个连接电视机与外部信号源的设备，它可以将压缩的数字信号转成电视内容，并在电视机上显示出来，信号可以来自有线电缆、卫星天线、宽带网络以及地面广播。机顶盒接收的内容除了模拟电视可以提供的图像、声音之外，更在于能够接收数字内容，包括电子节目指南、因特网网页、字幕等等，使用户能在现有电视机上观看数字电视节目，并可通过网络进行交互式数字化娱乐、教育和商业化活动。

由于年纪较大的老人不会使用机顶盒相关的功能，并且年纪较大的老人不熟悉电子产品，难以通过学习进行使用，并且老年人的地方方言口音比较重，并且模糊不清楚，现有提供的智能语音机顶盒不能满足老年人的使用需要，对于老年人使用过程麻烦不方便，

技术实现要素：

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种适用于重口音的老人机顶盒智能语音识别方法，解决了老年人的地方方言口音比较重，现有提供的智能语音机顶盒不能满足老年人的使用需要的问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：一种适用于重口音的老人机顶盒智能语音识别方法，包括以下步骤：

a、获取语音，获取用户语音，通过遥控器内置高性能麦克风采集到用户说话的声音信号，加工处理后进行存储；

b、对获取的语音信号进行语音识别，通过搜索计算相应的方言语料库进行对比；

c、根据概率计算识别，并进行纠错识别产生数据文本，将数据文本传输到所述机顶盒，并产生相应命令控制电视机进行选台。

优选的，所述步骤a中声音信号进行语言特征进行提取。

优选的，所述步骤b中方言语料库至少为五种方言语种，且每种方言语种至少一方言资料项，其中每一方言资料项包含一方言词汇，及该方言词汇对应的该方言语种及其中文解释。

优选的，所述步骤b中搜索计算具体为：

所述语音信号提取的语言特征在方言语料库进行搜索，并且匹配相对应的方言语种，且相匹配方言语种的结果至少为一个。

优选的，所述步骤c中概率计算具体步骤为：

c1、根据所述用户语音的声波与匹配的方言语料库并生成原词汇，与方言语料库中匹配对应的数据词汇的命令文本，若没有匹配相应的数据词汇，通过纠错识别生成相近的关联词汇；

c2、根据关联词汇对应相应命令文本，每个命令文本所对应的关联词汇的数量值为m；

c3、比较每个命令文本所对应的关联词汇的数量值m的大小，并选择m值最大的命令文本，生成数据文本传输到所述机顶盒。

优选的，所述步骤c1纠错识别具体为：

根据所述原词汇中的词组单元，寻找方言语料库中含有相同词组单元的数据词汇生成关联词汇。

优选的，所述命令文本对应的数据词汇的数量至少为一个。

优选的，所述所述步骤b中语音识别的具体步骤为；

b1、根据文本资料进行训练并得到语音模型；

b2、根据采集不同方言的音频，得到音频语料，并通过切音和标注进行训练得到声学模型；

b3、语音信号经过预处理，并进行特征提取，通过语音模型和声学模型进行识别解码，得到识别结果。

(三)有益效果

本发明提供了一种适用于重口音的老人机顶盒智能语音识别方法。具备以下有益效果：

该适用于重口音的老人机顶盒智能语音识别方法，通过方言的语音特征的独特性，对老人的方言进行辨别，再通过方言语料库中的数据词汇进行对比，并且由于本发明中的命令文本的种类较少，当语音模糊时通过概率计算得到正确的命令文本，也实现了多种方言的同步使用，解决了老年人的地方方言口音比较重，现有提供的智能语音机顶盒不能满足老年人的使用需要的问题，方便了老年人的使用。

附图说明

图1为本发明一种适用于重口音的老人机顶盒智能语音识别方法的步骤流程图；

图2为本发明概率计算的步骤流程图；

图3为本发明的工作原理框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-2，本发明实施例提供一种技术方案：一种适用于重口音的老人机顶盒智能语音识别方法，包括以下步骤：

a、获取语音，获取用户语音，通过遥控器内置高性能麦克风采集到用户说话的声音信号，加工处理后进行存储；

b、对获取的语音信号进行语音识别，通过搜索计算相应的方言语料库进行对比；

c、根据概率计算识别，并进行纠错识别产生数据文本，将数据文本传输到机顶盒，并产生相应命令控制电视机进行选台。

进一步的，步骤a中声音信号进行语言特征进行提取。

进一步的，步骤b中方言语料库至少为五种方言语种，且每种方言语种至少一方言资料项，其中每一方言资料项包含一方言词汇，及该方言词汇对应的该方言语种及其中文解释。

进一步的，步骤b中搜索计算具体为：

语音信号提取的语言特征在方言语料库进行搜索，并且匹配相对应的方言语种，且相匹配方言语种的结果至少为一个。

进一步的，步骤c中概率计算具体步骤为：

c1、根据用户语音的声波与匹配的方言语料库并生成原词汇，与方言语料库中匹配对应的数据词汇的命令文本，若没有匹配相应的数据词汇，通过纠错识别生成相近的关联词汇；

c2、根据关联词汇对应相应命令文本，每个命令文本所对应的关联词汇的数量值为m；

c3、比较每个命令文本所对应的关联词汇的数量值m的大小，并选择m值最大的命令文本，生成数据文本传输到机顶盒。

进一步的，步骤c1纠错识别具体为：

根据原词汇中的词组单元，寻找方言语料库中含有相同词组单元的数据词汇生成关联词汇。

进一步的，命令文本对应的数据词汇的数量至少为一个。

进一步的，步骤b中语音识别的具体步骤为；

b1、根据文本资料进行训练并得到语音模型；

b2、根据采集不同方言的音频，得到音频语料，并通过切音和标注进行训练得到声学模型；

b3、语音信号经过预处理，并进行特征提取，通过语音模型和声学模型进行识别解码，得到识别结果。

如图1所示，本发明，包括以下步骤：a、获取语音，获取用户语音，通过遥控器内置高性能麦克风采集到用户说话的声音信号，加工处理后进行存储，声音信号进行语言特征进行提取，声音信号通过录音设备进行存储；b、对获取的语音信号进行语音识别，通过搜索计算相应的方言语料库进行对比，语音信号提取的语言特征在方言语料库进行搜索，并且匹配相对应的方言语种，且相匹配方言语种的结果至少为一个，方言语料库至少为五种方言语种，且每种方言语种至少一方言资料项，其中每一方言资料项包含一方言词汇，及该方言词汇对应的该方言语种及其中文解释；c、根据概率计算识别，并进行纠错识别产生数据文本，将数据文本传输到机顶盒，并产生相应命令控制电视机进行选台；

如图3所示步骤b中语音识别的具体步骤为；b1、根据文本资料进行训练并得到语音模型；b2、根据采集不同方言的音频，得到音频语料，并通过切音和标注进行训练得到声学模型；b3、语音信号经过预处理，并进行特征提取，通过语音模型和声学模型进行识别解码，得到识别结果。

如图2所示，本发明的概率计算步骤为c1、根据用户语音的声波与匹配的方言语料库并生成原词汇，与方言语料库中匹配对应的数据词汇的命令文本，若没有匹配相应的数据词汇，通过纠错识别生成相近的关联词汇，根据原词汇中的词组单元，寻找方言语料库中含有相同词组单元的数据词汇生成关联词汇；c2、根据关联词汇对应相应命令文本，命令文本对应的数据词汇的数量至少为一个，每个命令文本所对应的关联词汇的数量值为mc3、比较每个命令文本所对应的关联词汇的数量值m的大小，并选择m值最大的命令文本，生成数据文本传输到机顶盒。

综上所述：

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：虞焰兴
技术所有人：安徽声讯信息技术有限公司
我是此专利的发明人

上一篇：一种去除金属离子的复合材料及其制备方法与流程
上一篇：一种污泥-垃圾协同焚烧混合物料热值测定方法与流程