脖戴式语音交互耳机的制作方法

文档序号:14745181发布日期:2018-06-19 23:49阅读:180来源:国知局
脖戴式语音交互耳机的制作方法

本实用新型涉及智能穿戴设备技术领域,特别是一种脖戴式语音交互耳机。



背景技术:

随着智能穿戴设备的发展和人们生活水平的不断提高,各种智能穿戴设备如智能手表的使用越来越普及,智能穿戴设备已经成为人们生活中不可缺少的通信工具。

人之所以能够听到声音,是因为空气中的震动通过外耳耳道把振动传递到耳膜,通过耳膜形成的振动驱动人的听觉神经。而当人们的中外耳损坏或用手塞住耳道时,声音还能够通过人们的皮肤以及骨骼传递声音振动,来驱动人们的听觉神经。

骨传导是一种声音传导方式,通过人的颅骨、颞骨、骨迷路、内耳淋巴液传递、耳蜗、听觉神经、听觉中枢来传递声波,这就是骨传导技术。骨传导是振动颅骨或者颞骨,不通过外耳与中耳直接传输到内耳当中。相对于传统的通过喇叭振膜产生声波的空气传导方式,骨传导省去了许多声波传递的步骤,能在嘈杂的管径中实现清晰的声音还原,而且声波也不会因为在空气中扩散而影响到她人。

然而,骨传导技术也具有以下几个缺点:(1)骨传导声音的适量与接触骨骼的位置相关,也与人体组织的特征有关。例如:用户的年龄、性别、胖瘦等差别都会导致不同用户在使用同一台骨传导耳机时,有不同的体验,往往这不同的体验都是性能恶化。(2)利用骨传导技术受话或者送话,骨传导器件必须紧贴骨头,沈波直接通过骨头传至听觉神经,佩戴方式决定了骨传导设备必须将骨传导器件高度压迫在骨骼上进行传到,一点松懈就会影响音频传递的质量,然而这种高度压迫骨骼的佩戴方式使得用户在使用过程中的舒适感、皮肤健康受到不同程度的影响。(3)骨骼和人体组织对于神东信号产生具有频率选择性的振幅衰减和延时,高保真或者宽带的音频信号很难通过骨骼传导到听觉神经,所以基于现有技术的用户多数会抱怨骨传导耳机“音质”和“音品”差。(4)骨传导漏音的问题。因为固态传导振动的特性,多数现有骨传导技术都无法真正解决骨传导漏音的问题,这是因为现有技术通过大音量、大振动信号来补偿频率相关的人体骨骼和组织衰减振动信号的现实情况,的那是这种方法相当于饮鸩止渴,用户会抱怨漏音严重,或者因为需要更大的功率,骨传导贞子体积重量大大增加,导致设备整体过于沉重。(5)骨传导耳机是开放双耳的系统,当用户置身在嘈杂的环境中,由于骨传导耳机的开放性会导致用户根本听不到耳机里传来的声音。

申请号为102084668A的专利申请公开了处理信号的方法和系统,所述系统包括:(a)处理器,设置为处理由第一麦克风在检测时刻检测到的第一输入信号、由第二麦克风在检测时刻检测到的第二输入信号,以及由第一麦克风在检测时刻检测到的第三输入信号,以产生响应于第一、第二和第三输入信号的校正后的信号;以及(b)通信接口,其设置为向外部系统提供校正后的信号。该方法通过卷积函数对声音进行降噪处理,已获得较为准确的声音信号。但是由于是几路声音混杂,有些声音容易被误判为正确的声音而记录在音轨中,因此输出的声音并不是完全准确且清晰的。

申请号为105721973A的专利申请公开了一种骨传导耳机及其音频处理方法,其中一种骨传导耳机及其基于所述骨传导耳机的音频播放装置,所述骨传导耳机包括人体骨骼和组织模型建模模块和数学预校正器,延时估算单元,数模转换器,模拟数字转换器,第一低通滤波器,第二低通滤波器,音频放大器,音频驱动放大器,至少一个第一麦克风,至少一个骨传导振子;实时监测不同用户的人体骨骼和组织的衰减效应信息,基于所述衰减效应信息,产生一补偿传递函数,通过所述补偿传递函数对输入音频信号对输入音频信号进行数字预校正后在骨骼和人体组织中传导。本申请是通过补偿的方法对输入的音频进行预校正,但是该方法主要用于解决音频信号的衰减问题,并不能够从噪音中分辨出正确的音频数据。



技术实现要素:

为了解决上述的技术问题,本实用新型提出了通过设置传统的声学麦克风(第一麦克风和第二麦克风相结合的方式),对两路音频输入分别进行单帧判定,确定语音概率较高的帧为语音帧,并将最终的语音帧组合成为输出的音频数据。

本实用新型提供一种脖戴式语音交互耳机,包括:声麦收音装置、控制装置和执行装置;

所述声麦收音装置设置在所述脖戴式语音交互耳机的耳塞上和/或主机上;

所述控制装置通过卡扣或螺钉固定在在所述主机上;

所述执行装置设置在所述耳塞上和/或主机上;

所述声麦收音装置通过有线或无线与所述控制装置连接;

所述控制装置通过柔性线缆与所述执行装置连接;

所述声麦收音装置采集用户的语音,将所述语音转换成数字信号发送给控制装置;

所述控制装置接收所述数字信号,通过运算将其转换成控制信号发送给执行装置;

所述声麦收音装置包括至少一个麦克风,所述麦克风设置在所述耳塞外侧和/或主机外侧。

例如,所述麦克风的数量为3个,分别设置在两个所述耳塞的外侧端面,集成于所述耳塞;第三麦克风设置于所述主机的一端处。

优选的是,所述控制装置包括协调分析模块、滤波模块、补偿模块、混频模块。

上述任一项优选的是,所述协调分析模块与所述麦克风连接,且集成于所述控制装置。

上述任一项优选的是,所述滤波模块分别与所述协调分析模块、所诉混频模块连接,且所述滤波模块集成于所述控制装置。

上述任一项优选的是,所述补偿模块分别与所述协调分析模块、所述混频模块连接,且所述补偿模块集成于所述控制装置。

上述任一项优选的是,所述混频模块分别与所述滤波模块、补偿模块连接和所述执行装置连接。

上述任一项优选的是,所述协调分析模块与所述麦克风之间还设有第一功率放大模块。

上述任一项优选的是,所述补偿模块与所述协调分析模块之间还设有第二功率放大模块。

上述任一项优选的是,所述混频模块与所述执行装置之间还设有第三功率放大模块。

上述任一项优选的是,声麦收音装置为电动式麦克风、电容式麦克风、压电式麦克风、电磁式麦克风、碳粒式麦克风和半导体式麦克风中的任意一项或多项。

上述任一项优选的是,所述控制装置集成处理单元。

上述任一项优选的是,所述处理单元为MTK 6580。

上述任一项优选的是,所述执行装置包括扬声器。

上述任一项优选的是,还包括至少一个电池组,所述电池组通过柔性线缆与所述控制装置连接。

上述任一项优选的是,所述控制装置还集成运行内存RAM。

上述任一项优选的是,所述控制装置还集成机身存储空间ROM或机身存储空间ROM插槽。

本实用新型通过在左、右两个耳塞上设置麦克风,采集环境噪声、人声和扬声器的声音,通过对这三者的音频信号进行处理,最终得到最清晰准确的用户的语音信号。实现了收音情况下的去除环境音、噪音和扬声器的声音,提高了脖戴式语音交互耳机的语音识别正确率、进一步提高了准备的服务指令,提高了用户的满意度。

附图说明

图1为按照本实用新型的实施例1的结构示意图;

图2为按照本实用新型的实施例1的ANC降噪电路结构示意图;

图3为按照本实用新型的实施例2的ANC降噪电路结构示意图。

附图中的标记说明:

100 脖戴式语音交互耳机;

1 耳塞;

2 主机;

10 声麦收音装置;

20 控制装置;

30 执行装置;

101 第一麦克风;102 第二麦克风;103 第三麦克风;

201 协调分析模块;202 滤波模块;203 补偿模块;204 混频模块;

301 扬声器;

231 音频特性检测子模块;232 主音源判定子模块;233 主音源补偿子模块;234 降噪子模块。

具体实施方式

下面结合附图和具体的实施例对本实用新型做进一步的阐述。

实施例1

如图1所示,一种脖戴式语音交互耳机100,包括:声麦收音装置10、控制装置20和执行装置30;

所述声麦收音装置10设置在所述脖戴式语音交互耳机的耳塞1上和/或主机2上;

所述控制装置20设置在所述主机2上;

所述执行装置30设置在所述耳塞1上和/或主机2上;

所述声麦收音装置10通过有线或无线与所述控制装置20连接;

所述控制装置20通过柔性线缆与所述执行装置30连接;

所述声麦收音装置10采集用户的语音,将所述语音转换成数字信号发送给控制装置20;

所述控制装置20接收所述数字信号,通过运算将其转换成控制信号发送给执行装置30;

所述声麦收音装置10包括至少一个麦克风,所述麦克风设置在所述耳塞1外侧和/或主机2外侧。

如图2所示,所述麦克风的数量为3个,分别设置在两个所述耳塞1的外侧端面,集成于所述耳塞1;第三麦克风103设置于所述主机2的一端处。

所述控制装置20包括协调分析模块201、滤波模块202、补偿模块203、混频模块204。

所述协调分析模块201与所述麦克风连接,且集成于所述控制装置20。

所述滤波模块202分别与所述协调分析模块201、所诉混频模块204连接,且所述滤波模块202集成于所述控制装置20。

所述补偿模块203分别与所述协调分析模块201、所述混频模块204连接,且所述补偿模块203集成于所述控制装置20。

所述混频模块204分别与所述滤波模块202、补偿模块203连接和所述执行装置30连接。

所述协调分析模块201与所述麦克风之间还设有第一功率放大模块。

所述补偿模块203与所述协调分析模块201之间还设有第二功率放大模块。

所述混频模块204与所述执行装置30之间还设有第三功率放大模块。

声麦收音装置10为电动式麦克风、电容式麦克风、压电式麦克风、电磁式麦克风、碳粒式麦克风和半导体式麦克风中的任意一项或多项。

所述控制装置20集成处理单元。

所述处理单元为MTK 6580。

所述执行装置30包括扬声器301。

还包括至少一个电池组,所述电池组通过柔性线缆与所述控制装置20连接。

所述控制装置20还集成运行内存RAM。

所述控制装置20还集成机身存储空间ROM或机身存储空间ROM插槽。

实施例2

如图3所示,所述声麦收音装置10的所述数字信号包括第一音频信号和第二音频信号。

所述第一音频信号是指利用所述第一麦克风101采集用户的语音信息。

所述第二音频信号是指利用所述第二麦克风102采集所述第一音频信号发生时间范围内的环境音。

所述控制装置20还包括以下子模块:音频特性检测子模块231,用于对采集到的所述音频信号进行音频特性检测;主音源判定子模块232,用于进行主音源判定;主音源补偿子模块233,用于进行主音源补偿;降噪子模块234,用于消除噪声。

音频特性检测的步骤如下:1)提取帧长为20ms的音频数据,xi(n),并计算平均能量Ei、过零率ZCRi、短时相关性Ri和短时互相关性Cij(k),

其中,2)根据所述平均能量Ei、所述过零率ZCRi、所述短时相关性Ri和所述短时互相关性Cij(k)计算当前帧的非静音概率和语音概率,其中,为i通道max(Ei*ZCRi)的经验参考值,为i通道max{max[Ri(k)]*max[Cij(k)]}的经验参考值。3)所述音频特性检测的方法还为根据所述i通道当前帧的所述非静音概率和所述语音概率判断当前帧的类型,即是否为噪声帧、语音帧、无噪环境音帧,其中,是于相关判决的经验值,Ambient为无噪环境音帧,Noise为噪音帧,Speech为语音帧。主音源判定,主音源判定子模块232根据当前帧的数值和判定结果来确定从那一路提取的当前帧作为当前位置帧的主音源。判定方法如下:1)当某一路为Speech语音帧,而另一路为Ambient无噪环境音帧或者Noise噪音帧时,确定该路作为当前位置帧的主数据通路;2)当某一路为Ambient无噪环境音帧,而另一路为Noise噪音帧时,确定该路作为当前位置帧的主数据通路;3)当两路均为同一种类帧时,确定数值最大的通道作为当前位置帧的主数据通路。主音源补偿,确定当前位置帧的主音源后,补偿子模块从另一路提取有效数据,对主音源进行语音分量补偿。语音分量补偿方法为:1)利用不同通道有效音频数据在频域进行全频谱的子带加权叠加补偿;2)利用有效的低频子带数据相关特性进行频谱复制操作,补偿高频子带数据。噪音消除,补偿过后的音频数据中,仍然包含少量噪声数据,降噪子模块234根据主数据通路语音帧前后关联的噪音帧获得噪声频谱特性,并对语音帧在频域上对噪声频谱成分进行有效抑制,从而得到较纯净的有效语音数据。输出信号,把最终生成的有效语音数据推送给终端设备。

导入主音频数据,调取存储器中存储的环境判定数据,把主音频数据与环境判定数据进行比对,并确定主音频输入时周边的噪音环境。从存储器中调取环境噪音数据,并与主音频数据进行单帧比对。去掉主音频数据单帧中与环境噪音数据相同的音频数据。生成有效的不带有噪音的音频数据。

为了更好地理解本实用新型,以上结合本实用新型的具体实施例做了详细描述,但并非是对本实用新型的限制。凡是依据本实用新型的技术实质对以上实施例所做的任何简单修改,均仍属于本实用新型技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

可能以许多方式来实现本实用新型的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本实用新型的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本实用新型的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本实用新型实施为记录在记录介质中的程序,这些程序包括用于实现根据本实用新型的方法的机器可读指令。因而,本实用新型还覆盖存储用于执行根据本实用新型的方法的程序的记录介质。

本实用新型的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本实用新型限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本实用新型的原理和实际应用,并且使本领域的普通技术人员能够理解本实用新型从而设计适于特定用途的带有各种修改的各种实施例。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1