用于脖戴式语音交互耳机的骨麦收音处理装置的制作方法

文档序号:17602629发布日期:2019-05-07 20:28阅读:143来源:国知局
用于脖戴式语音交互耳机的骨麦收音处理装置的制作方法

本发明涉及智能穿戴设备技术领域,特别是一种用于脖戴式语音交互耳机的骨麦收音处理装置。



背景技术:

随着智能穿戴设备的发展和人们生活水平的不断提高,各种智能穿戴设备如智能手表的使用越来越普及,智能穿戴设备已经成为人们生活中不可缺少的通信工具。

人之所以能够听到声音,是因为空气中的震动通过外耳耳道把振动传递到耳膜,通过耳膜形成的振动驱动人的听觉神经。而当人们的中外耳损坏或用手塞住耳道时,声音还能够通过人们的皮肤以及骨骼传递声音振动,来驱动人们的听觉神经。

骨传导是一种声音传导方式,通过人的颅骨、颞骨、骨迷路、内耳淋巴液传递、耳蜗、听觉神经、听觉中枢来传递声波,这就是骨传导技术。骨传导是振动颅骨或者颞骨,不通过外耳与中耳直接传输到内耳当中。相对于传统的通过喇叭振膜产生声波的空气传导方式,骨传导省去了许多声波传递的步骤,能在嘈杂的管径中实现清晰的声音还原,而且声波也不会因为在空气中扩散而影响到她人。

然而,骨传导技术也具有以下几个缺点:(1)骨传导声音的适量与接触骨骼的位置相关,也与人体组织的特征有关。例如:用户的年龄、性别、胖瘦等差别都会导致不同用户在使用同一台骨传导耳机时,有不同的体验,往往这不同的体验都是性能恶化。(2)利用骨传导技术受话或者送话,骨传导器件必须紧贴骨头,沈波直接通过骨头传至听觉神经,佩戴方式决定了骨传导设备必须将骨传导器件高度压迫在骨骼上进行传到,一点松懈就会影响音频传递的质量,然而这种高度压迫骨骼的佩戴方式使得用户在使用过程中的舒适感、皮肤健康受到不同程度的影响。(3)骨骼和人体组织对于神东信号产生具有频率选择性的振幅衰减和延时,高保真或者宽带的音频信号很难通过骨骼传导到听觉神经,所以基于现有技术的用户多数会抱怨骨传导耳机“音质”和“音品”差。(4)骨传导漏音的问题。因为固态传导振动的特性,多数现有骨传导技术都无法真正解决骨传导漏音的问题,这是因为现有技术通过大音量、大振动信号来补偿频率相关的人体骨骼和组织衰减振动信号的现实情况,的那是这种方法相当于饮鸩止渴,用户会抱怨漏音严重,或者因为需要更大的功率,骨传导贞子体积重量大大增加,导致设备整体过于沉重。(5)骨传导耳机是开放双耳的系统,当用户置身在嘈杂的环境中,由于骨传导耳机的开放性会导致用户根本听不到耳机里传来的声音。

申请号为102084668a的专利申请公开了处理信号的方法和系统,所述系统包括:(a)处理器,设置为处理由第一麦克风在检测时刻检测到的第一输入信号、由第二麦克风在检测时刻检测到的第二输入信号,以及由第一麦克风在检测时刻检测到的第三输入信号,以产生响应于第一、第二和第三输入信号的校正后的信号;以及(b)通信接口,其设置为向外部系统提供校正后的信号。该方法通过卷积函数对声音进行降噪处理,已获得较为准确的声音信号。但是由于是几路声音混杂,有些声音容易被误判为正确的声音而记录在音轨中,因此输出的声音并不是完全准确且清晰的。

申请号为105721973a的专利申请公开了一种骨传导耳机及其音频处理方法,其中一种骨传导耳机及其基于所述骨传导耳机的音频播放装置,所述骨传导耳机包括人体骨骼和组织模型建模模块和数学预校正器,延时估算单元,数模转换器,模拟数字转换器,第一低通滤波器,第二低通滤波器,音频放大器,音频驱动放大器,至少一个第一麦克风,至少一个骨传导振子;实时监测不同用户的人体骨骼和组织的衰减效应信息,基于所述衰减效应信息,产生一补偿传递函数,通过所述补偿传递函数对输入音频信号对输入音频信号进行数字预校正后在骨骼和人体组织中传导。本申请是通过补偿的方法对输入的音频进行预校正,但是该方法主要用于解决音频信号的衰减问题,并不能够从噪音中分辨出正确的音频数据。



技术实现要素:

为了解决上述的技术问题,本发明提出了通过对第一麦克风和第二麦克风的信号进行处理,得到最优的音频信号再输出;或者通过对第一麦克风、第二麦克风和第三麦克风得到加强的音频信号再输出。

本发明提供一种用于脖戴式语音交互耳机的骨麦收音处理装置,包括:收音骨麦、控制装置和执行装置;

所述收音骨麦设置在所述脖戴式语音交互耳机的耳塞上和/或主机上;

所述控制装置设置在所述主机上;

所述执行装置设置在所述耳塞上和/或主机上;

所述收音骨麦通过有线或无线与所述控制装置连接;

所述控制装置通过柔性线缆与所述执行装置连接;

所述收音骨麦采集用户的语音,将所述语音转换成数字信号发送给控制装置;

所述控制装置接收所述数字信号,通过运算将其转换成控制信号发送给执行装置;

所述执行装置接收所述控制装置发出的所述控制信号,向用户发出唤醒提示或执行相应控制;

所述收音骨麦包括信号接收部、能量转化部和信号输出部;所述信号接收部设置于所述收音骨麦的外侧,形成所述收音骨麦的外壳的一部分;

所述能量转化部分别与所述信号接收部和所述信号输出部连接。

优选的是,所述收音骨麦包括第一麦克风和第二麦克风;所述第一麦克风设置于其中一个耳塞上;所述第二麦克风设置于所述主机的中部;所述第一麦克风和第二麦克风分别与人体皮肤或骨骼接触。

上述任一项优选的是,还包括第三麦克风,所述第三麦克风设置于另外一个耳塞上,与人体皮肤或骨骼接触。

上述任一项优选的是,收音骨麦为电动式麦克风、电容式麦克风、压电式麦克风、电磁式麦克风、碳粒式麦克风和半导体式麦克风中的任意一项或多项。

上述任一项优选的是,所述控制装置集成处理单元。

上述任一项优选的是,所述处理单元为mtk6580。

上述任一项优选的是,所述执行装置包括扬声器和/或屏幕。

上述任一项优选的是,所述声麦处理装置和所述控制装置之间还设有滤波装置。

上述任一项优选的是,所述控制装置和所述执行装置之间还设有信号转换装置。

上述任一项优选的是,还包括至少一个电池组,所述电池组通过柔性线缆与所述控制装置连接。

上述任一项优选的是,所述控制装置还集成运行内存ram。

上述任一项优选的是,所述控制装置还集成机身存储空间rom或机身存储空间rom插槽。

上述任一项优选的是,还包括振动传感器,所述振动传感器通过柔性线缆与所述控制装置电连接。

上述任一项优选的是,所述收音骨麦的所述数字信号包括第一音频信号和第二音频信号。

上述任一项优选的是,所述第一音频信号是指利用所述第一麦克风采集用户的语音信息。

上述任一项优选的是,所述第二音频信号是指利用所述第二麦克风采集所述第一音频信号发生时间范围内的环境音。

上述任一项优选的是,所述控制装置还包括以下子模块:音频特性检测子模块,用于对采集到的所述音频信号进行音频特性检测;主音源判定子模块,用于进行主音源判定;主音源补偿子模块,用于进行主音源补偿;降噪子模块,用于消除噪声。

本发明通过对两路或三路甚至多路输入的音频数据进行处理,能够有效的去除噪音和杂音,得到有效的清晰的且经过加强的音频数据,提高了脖戴式语音交互耳机的语音识别正确率、进一步提高了服务指令的准确性和录音质量,提高了用户的满意度。

附图说明

图1为按照本发明的实施例1的结构示意图;

附图中的标记说明:

100用于脖戴式语音交互耳机的骨麦收音处理装置;

1耳塞;

2主机;

10收音骨麦;

20控制装置;

21执行装置;

101第一麦克风;102第二麦克风;103第三麦克风;

210扬声器;211屏幕;

22电池组。

具体实施方式

下面结合附图和具体的实施例对本发明做进一步的阐述。

实施例1

如图1所示,一种用于脖戴式语音交互耳机的骨麦收音处理装置100,包括:收音骨麦10、控制装置20和执行装置21;

所述收音骨麦10设置在所述脖戴式语音交互耳机的耳塞上和/或主机上;

所述控制装置20设置在所述主机上;

所述执行装置21设置在所述耳塞上和/或主机上;

所述收音骨麦10通过有线或无线与所述控制装置20连接;

所述控制装置20通过柔性线缆与所述执行装置21连接;

所述收音骨麦10采集用户的语音,将所述语音转换成数字信号发送给控制装置20;

所述控制装置20接收所述数字信号,通过运算将其转换成控制信号发送给执行装置21;

所述执行装置21接收所述控制装置20发出的所述控制信号,向用户发出唤醒提示或执行相应控制;

所述收音骨麦10包括信号接收部、能量转化部和信号输出部;所述信号接收部设置于所述收音骨麦10的外侧,形成所述收音骨麦10的外壳的一部分;

所述能量转化部分别与所述信号接收部和所述信号输出部连接。

所述收音骨麦10包括第一麦克风101和第二麦克风102;所述第一麦克风101设置于其中一个耳塞上;所述第二麦克风102设置于所述主机的中部;所述第一麦克风101和第二麦克风102分别与人体皮肤或骨骼接触。

还包括第三麦克风103,所述第三麦克风103设置于另外一个耳塞上,与人体皮肤或骨骼接触。

收音骨麦10为电动式麦克风、电容式麦克风、压电式麦克风、电磁式麦克风、碳粒式麦克风和半导体式麦克风中的任意一项或多项。

所述控制装置20集成处理单元。

所述处理单元为mtk6580。

所述执行装置21包括扬声器210和/或屏幕211。

所述声麦处理装置和所述控制装置20之间还设有滤波装置。

所述控制装置20和所述执行装置21之间还设有信号转换装置。

还包括至少一个电池组22,所述电池组22通过柔性线缆与所述控制装置20连接。

所述控制装置20还集成运行内存ram。

所述控制装置20还集成机身存储空间rom或机身存储空间rom插槽。

还包括振动传感器,所述振动传感器通过柔性线缆与所述控制装置20电连接。

所述收音骨麦10的所述数字信号包括第一音频信号和第二音频信号。

所述第一音频信号是指利用所述第一麦克风101采集用户的语音信息。

所述第二音频信号是指利用所述第二麦克风102采集所述第一音频信号发生时间范围内的用户的另一位置的语音信息。

还包括第三音频信号,由第三麦克风103采集用户的第三位置的语音信息。

还包括传统麦克风,通过声波采集用户的语音信息,该语音信息包括环境噪声、扬声器的声音和用户的语音。

所述控制装置20还包括以下子模块:音频特性检测子模块,用于对采集到的所述音频信号进行音频特性检测;主音源判定子模块,用于进行主音源判定;主音源补偿子模块,用于进行主音源补偿;降噪子模块,用于消除噪声。

音频特性检测的步骤如下:1)提取帧长为20ms的音频数据,xi(n),并计算平均能量ei、过零率zcri、短时相关性ri和短时互相关性cij(k),

其中,2)根据所述平均能量ei、所述过零率zcri、所述短时相关性ri和所述短时互相关性cij(k)计算当前帧的非静音概率和语音概率

,其中,为i通道max(ei*zcri)的经验参考值,为i通道max{max[ri(k)]*max[cij(k)]}的经验参考值。3)所述音频特性检测的方法还为根据所述i通道当前帧的所述非静音概率和所述语音概率判断当前帧的类型,即是否为噪声帧、语音帧、无噪环境音帧,其中,是于相关判决的经验值,ambient为无噪环境音帧,noise为噪音帧,speech为语音帧。主音源判定,主音源判定子模块232根据当前帧的数值和判定结果来确定从那一路提取的当前帧作为当前位置帧的主音源。判定方法如下:1)当某一路为speech语音帧,而另一路为ambient无噪环境音帧或者noise噪音帧时,确定该路作为当前位置帧的主数据通路;2)当某一路为ambient无噪环境音帧,而另一路为noise噪音帧时,确定该路作为当前位置帧的主数据通路;3)当两路均为同一种类帧时,确定数值最大的通道作为当前位置帧的主数据通路。主音源补偿,确定当前位置帧的主音源后,补偿子模块从另一路提取有效数据,对主音源进行语音分量补偿。语音分量补偿方法为:1)利用不同通道有效音频数据在频域进行全频谱的子带加权叠加补偿;2)利用有效的低频子带数据相关特性进行频谱复制操作,补偿高频子带数据。噪音消除,补偿过后的音频数据中,仍然包含少量噪声数据,降噪子模块根据主数据通路语音帧前后关联的噪音帧获得噪声频谱特性,并对语音帧在频域上对噪声频谱成分进行有效抑制,从而得到较纯净的有效语音数据。输出信号,把最终生成的有效语音数据推送给终端设备。

导入主音频数据,调取存储器中存储的环境判定数据,把主音频数据与环境判定数据进行比对,并确定主音频输入时周边的噪音环境。从存储器中调取环境噪音数据,并与主音频数据进行单帧比对。去掉主音频数据单帧中与环境噪音数据相同的音频数据。生成有效的不带有噪音的音频数据。

为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

可能以许多方式来实现本发明的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1