一种基于音频识别技术的智能设备互动系统及方法

文档序号：10661521阅读：239来源：国知局

一种基于音频识别技术的智能设备互动系统及方法
【专利摘要】本发明公开了一种基于音频识别技术的智能设备互动系统及方法。系统包括智能设备、主机设备和从机设备。方法包括步骤：S1，通过主机设备采集智能设备中的音频信号；S2，主机设备对音频信号进行预处理；S3，主机设备对预处理后的音频信号进行比对识别，判断音频信号所对应的场景或内容，并根据场景或内容输出控制指令到从机设备。本发明通过利用主机设备采集和智能分析音频信号，控制从机设备进行响应动作，克服了现有技术中多媒体播放乏味、功能单一的问题，实现根据多媒体音频信号进行智能终端间的互动连接，有效改善了用户体验，具有良好的经济和社会效益。本发明可广泛应用于各种智能设备互动系统。
【专利说明】
一种基于音频识别技术的智能设备互动系统及方法
技术领域
[0001]本发明涉及音频识别和处理领域，尤其涉及一种基于音频识别和处理技术的智能设备互动方法及系统。
【背景技术】
[0002]随着科技的发展和人们生活水平的提高，智能化设备已经成为人们生活中不可或缺的一部分，与此同时，人们对设备的智能化需求也越来越高。
[0003]AR技术(Augmented Reality的简称)，中文名称为增强现实技术，是在虚拟现实的基础上发展起来的新技术，也被称之为混合现实。它利用计算机系统生成一种逼真的视、听、力、触和动等感觉的虚拟环境，并通过各种传感设备使用户〃沉浸〃到该环境中，实现用户和环境直接进行自然交互。
[0004]然而，现有技术中还未有一种设备或系统可以实现根据多媒体音频信号进行智能终端间的互动连接。

【发明内容】

[0005]为了解决上述技术问题，本发明的目的是提供一种可以实现根据多媒体音频信号进行智能终端间的互动连接的系统。
[0006]为了解决上述技术问题，本发明的另一个目的是提供一种可以实现根据多媒体音频信号进行智能终端间的互动连接的方法。
[0007]本发明所采用的技术方案是:
一种基于音频识别技术的智能设备互动系统，包括:
智能设备，所述智能设备用于输出音频信号到主机设备；
主机设备，所述主机设备包括信号预处理单元和比对识别单元，所述信号预处理单元用于接收音频信号，并对音频信号进行预处理，所述比对识别单元用于对预处理后的音频信号进行比对识别，判断音频信号所对应的场景或内容，并根据场景或内容输出控制指令到从机设备；
从机设备，用于接收主机设备的控制指令，并根据控制指令做出响应动作。
[0008]优选的，所述预处理单元包括依次连接的信号放大子单元、信号分频过滤子单元、数字编码子单元和分时分位处理子单元，各子单元依次对应的预处理步骤分别为信号放大、信号分频过滤、数字编码和将数字编码信号分时分位处理成数据块。
[0009]优选的，所述比对识别单元包括多通道处理子单元和预存信号库，所述多通道处理子单元将分时分为处理后的数据块通过多通道分别与预存信号库中的模板数据做比对，并根据各个通道的比对结果判断音频信号所对应的场景或内容。
[0010]优选的，所述从机设备包括驱动马达和动作执行装置，所述响应动作为通过驱动马达驱动动作执行装置动作。
[0011]优选的，所述从机设备还包括信号采集传感器单元，所述采集传感器单元的输出端与主机设备的输入端连接。
[0012]优选的，所述采集传感器单元包括声音采集传感器和/或温度采集传感器和/或高度采集传感器和/或震动采集传感器和/或红外采集传感器和/或光感采集传感器和/或心率脉搏血糖采集传感器和/或脑波传感器。
[0013]一种基于音频识别技术的智能设备互动方法，包括步骤:
SI，通过主机设备采集智能设备中的音频信号；
S2，主机设备对音频信号进行预处理；
S3，主机设备对预处理后的音频信号进行比对识别，判断音频信号所对应的场景或内容，并根据场景或内容输出控制指令到从机设备；
S4，从机设备接收主机设备的控制指令，并根据控制指令做出响应动作。
[0014]优选的，所述步骤S2具体包括子步骤:
S21，对音频信号的信号放大步骤；
S22，对音频信号进行信号分频过滤步骤；
S23，对音频信号进行数字编码步骤；
S24，将数字编码后的音频信号分时分位处理成数据块。
[0015]优选的，所述步骤S3具体包括子步骤:
S31，比对识别单元将分时分为处理后的数据块通过多通道分别与预存信号库中的模板数据做比对；
S32,比对识别单元根据各个通道的比对结果判断音频信号所对应的场景或内容； S33，比对识别单元根据场景或内容输出控制指令到从机设备。
[0016]优选的，还包括步骤:
S5，从机设备采集环境信号反馈回到主机设备，主机设备根据环境信号内容控制智能设备；
所述环境信号包括声音信号和/或温度信号和/或高度信号和/或震动信号。
[0017]本发明的有益效果是:
本发明通过利用主机设备采集和智能分析音频信号，控制从机设备进行响应动作，克服了现有技术中多媒体播放乏味、功能单一的问题，实现根据多媒体音频信号进行智能终端间的互动连接，有效改善了用户体验，具有良好的经济和社会效益。
[0018]另外，本发明通过多通道分时分块的音频信号处理方法，实现对音频信号的不停顿、快速识别;通过利用从机设备采集环境信号，实现对智能设备的反馈控制。
[0019]本发明可广泛应用于各种智能设备互动系统。
【附图说明】
[0020]下面结合附图对本发明的【具体实施方式】作进一步说明:
图1是本发明系统一种实施例的电路模块框图；
图2是本发明多通道分时分位处理方法一种实施例的说明示意图。
【具体实施方式】
[0021]需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。
[0022]如图1所示，一种基于音频识别技术的智能设备互动系统，包括:智能设备，所述智能设备用于输出音频信号到主机设备;主机设备，所述主机设备包括信号预处理单元和比对识别单元，所述信号预处理单元用于接收音频信号，并对音频信号进行预处理，所述比对识别单元用于对预处理后的音频信号进行比对识别，判断音频信号所对应的场景或内容，并根据场景或内容输出控制指令到从机设备;从机设备，用于接收主机设备的控制指令，并根据控制指令做出响应动作。
[0023]优选的，所述预处理单元包括依次连接的信号放大子单元、信号分频过滤子单元、数字编码子单元和分时分位处理子单元，各子单元依次对应的预处理步骤分别为信号放大、信号分频过滤、数字编码和将数字编码信号分时分位处理成数据块。
[0024]优选的，所述比对识别单元包括多通道处理子单元和预存信号库，所述多通道处理子单元将分时分为处理后的数据块通过多通道分别与预存信号库中的模板数据做比对，并根据各个通道的比对结果判断音频信号所对应的场景或内容。
[0025]优选的，所述从机设备包括驱动马达和动作执行装置，所述响应动作为通过驱动马达驱动动作执行装置动作。
[0026]本实施例中，智能设备为智能手机，从机设备为实体智能玩具。例如，当智能设备播放视频，主机设备通过3.5mm音频接口采集视频中的音频信号，并通过识别音频信号判断音频信号所对应的视频场景，然后根据视频场景控制智能玩具做与视频中相匹配的动作，动作执行装置可以是玩具的手脚、手中的工具、转动轮等等，可通过马达驱动玩具的手脚与智能设备中播放的多媒体视频同步动作。
[0027]优选的，所述从机设备还包括信号采集传感器单元，所述采集传感器单元的输出端与主机设备的输入端连接。
[0028]优选的，所述采集传感器单元包括声音采集传感器和/或温度采集传感器和/或高度采集传感器和/或震动采集传感器和/或红外采集传感器和/或光感采集传感器和/或心率脉搏血糖采集传感器和/或脑波传感器。例如，智能玩具通过MIC头(声音采集传感器)采集人声命令，主机设备中包括语音识别模块，通过识别人声命令内容，可控制智能设备中的视频快进快倒或放大缩小或暂停播放或音量大小或播放方式等。
[0029]一种基于音频识别技术的智能设备互动方法，包括步骤:
SI，通过主机设备采集智能设备中的音频信号；
S2，主机设备对音频信号进行预处理；
S3，主机设备对预处理后的音频信号进行比对识别，判断音频信号所对应的场景或内容，并根据场景或内容输出控制指令到从机设备；
S4，从机设备接收主机设备的控制指令，并根据控制指令做出响应动作。
[0030]优选的，所述步骤S2具体包括子步骤:
S21，对音频信号的信号放大步骤；
S22，对音频信号进行信号分频过滤步骤；
S23，对音频信号进行数字编码步骤；
S24，将数字编码后的音频信号分时分位处理成数据块。
[0031 ]优选的，所述步骤S3具体包括子步骤: S31，比对识别单元将分时分为处理后的数据块通过多通道分别与预存信号库中的模板数据做比对；
S32,比对识别单元根据各个通道的比对结果判断音频信号所对应的场景或内容； S33，比对识别单元根据场景或内容输出控制指令到从机设备。
[0032]具体的，该实施例中，如图2所示，步骤S24将I秒时间的音频数字代码切分为10个1/10秒时间的音频数字代码，对每个1/10秒时间的音频数字代码再切分为10个数据块0-9;步骤S31中，将数据块0-9按照奇偶数分别分到多通道处理子模块的两个通道(第一通道和第二通道)中进行比对处理;显然的，可根据运算能力和数据量大小设定通道数量和分时分位的时间和位数，以实现高速、不间断的信号处理。
[0033]该实施例中，主机将采集到的模拟音频信号转换成数字信号或者采集到的数字音频信号，经过N倍信号放大(放大或者不放大和放大倍数根据实际音频信号由软件判断处理)，将预设需要采集的音频类别做频率频谱分离，步骤S22利用DSP芯片加载软件的特殊算法计算出需求频率范围提取出数字音频信号，将提取出的数字音频信号分时分通道处理成若干小段数据块，按照分位分时连续提取原则，软件同时分位分时计算所提取的数字音频信号与预存是信号库中的模板数据做比对，得出与信号库中数字信号比对结果的接近值为有效信号，然后再经过软件算法合并所分时分位的数字音频信号对应数字库中对应的信号分类，判断出所处理的音频信号在音频来源中声音特性类别和关联视频动作类别，软件做出处理判断后输出数字指令经过有线连接或者无线连接控制从机设备。其中，预存信号库将预先采集信号源做分析处理，编码成若干小节数字代码，并经过编序处理，使得多通道处理子单元能快速识别提取应用。
[0034]优选的，还包括步骤:
S5，从机设备采集环境信号反馈回到主机设备，主机设备根据环境信号内容控制智能设备；
所述环境信号包括声音信号和/或温度信号和/或高度信号和/或震动信号。
[0035]该实施例中，与主机设备有线连接或者无线连接的从机设备，接收信号做相应响应，在响应过程中可以加载各类传感器收集相关环境信号(比如环境声音，温度，高度，震动等各种信号)，经过从机设备中的处理器做相关处理后发射回主机设备，主机接收环境信号并计算出结果做相应软件调整，结合采集的音频信号做混合运算，发出指令无线或者有线的方式到被采集信号的智能设备上，控制智能设备做相关联应用变化(比如视频播放可以控制视频的快进快倒，放大缩小，暂停播放，音量大小，播放方式等)。
[0036]本发明通过利用主机设备采集和智能分析音频信号，控制从机设备进行响应动作，克服了现有技术中多媒体播放乏味、功能单一的问题，实现根据多媒体音频信号进行智能终端间的互动连接，有效改善了用户体验，具有良好的经济和社会效益。
[0037]另外，本发明通过多通道分时分块的音频信号处理方法，实现对音频信号的不停顿、快速识别;通过利用从机设备采集环境信号，实现对智能设备的反馈控制。
[0038]本发明可广泛应用于各种智能设备互动系统。
[0039]以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
【主权项】
1.一种基于音频识别技术的智能设备互动系统，其特征在于，包括: 智能设备，所述智能设备用于输出音频信号到主机设备；主机设备，所述主机设备包括信号预处理单元和比对识别单元，所述信号预处理单元用于接收音频信号，并对音频信号进行预处理，所述比对识别单元用于对预处理后的音频信号进行比对识别，判断音频信号所对应的场景或内容，并根据场景或内容输出控制指令到从机设备；从机设备，用于接收主机设备的控制指令，并根据控制指令做出响应动作。2.根据权利要求1所述的一种基于音频识别技术的智能设备互动系统，其特征在于，所述预处理单元包括依次连接的信号放大子单元、信号分频过滤子单元、数字编码子单元和分时分位处理子单元，各子单元依次对应的预处理步骤分别为信号放大、信号分频过滤、数字编码和将数字编码信号分时分位处理成数据块。3.根据权利要求1所述的一种基于音频识别技术的智能设备互动系统，其特征在于，所述比对识别单元包括多通道处理子单元和预存信号库，所述多通道处理子单元将分时分为处理后的数据块通过多通道分别与预存信号库中的模板数据做比对，并根据各个通道的比对结果判断音频信号所对应的场景或内容。4.根据权利要求1所述的一种基于音频识别技术的智能设备互动系统，其特征在于，所述从机设备包括驱动马达和动作执行装置，所述响应动作为通过驱动马达驱动动作执行装置动作。5.根据权利要求1至4任一项所述的一种基于音频识别技术的智能设备互动系统，其特征在于，所述从机设备还包括信号采集传感器单元，所述采集传感器单元的输出端与主机设备的输入端连接。6.根据权利要求5所述的一种基于音频识别技术的智能设备互动系统，其特征在于，所述采集传感器单元包括声音采集传感器和/或温度采集传感器和/或高度采集传感器和/或震动采集传感器和/或红外采集传感器和/或光感采集传感器和/或心率脉搏血糖采集传感器和/或脑波传感器。7.一种基于音频识别技术的智能设备互动方法，其特征在于，包括步骤: SI，通过主机设备采集智能设备中的音频信号； S2，主机设备对音频信号进行预处理； S3，主机设备对预处理后的音频信号进行比对识别，判断音频信号所对应的场景或内容，并根据场景或内容输出控制指令到从机设备； S4，从机设备接收主机设备的控制指令，并根据控制指令做出响应动作。8.根据权利要求7所述的一种基于音频识别技术的智能设备互动方法，其特征在于，所述步骤S2具体包括子步骤: S21，对音频信号的信号放大步骤； S22，对音频信号进行信号分频过滤步骤； S23，对音频信号进行数字编码步骤； S24，将数字编码后的音频信号分时分位处理成数据块。9.根据权利要求7所述的一种基于音频识别技术的智能设备互动方法，其特征在于，所述步骤S3具体包括子步骤: S31，比对识别单元将分时分为处理后的数据块通过多通道分别与预存信号库中的模板数据做比对； S32,比对识别单元根据各个通道的比对结果判断音频信号所对应的场景或内容； S33，比对识别单元根据场景或内容输出控制指令到从机设备。10.根据权利要求7至9任一项所述的一种基于音频识别技术的智能设备互动方法，其特征在于，还包括步骤: S5，从机设备采集环境信号反馈回到主机设备，主机设备根据环境信号内容控制智能设备；所述环境信号包括声音信号和/或温度信号和/或高度信号和/或震动信号。
【文档编号】H04R3/00GK106028217SQ201610439828
【公开日】2016年10月12日
【申请日】2016年6月20日
【发明人】曾政军
【申请人】咻羞科技(深圳)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾政军;
技术所有人：咻羞科技(深圳)有限公司;
我是此专利的发明人

上一篇：声音大小可控的电子喇叭的制作方法
上一篇：音频采集增强方法以及使用所述方法的音频采集系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。