本发明属于生物启发式计算与仿生传感器交叉领域,具体涉及一种生物听觉启发的声音脉冲编码与识别方法及系统。
背景技术:
1、人工神经网络(ann)已被广泛应用于声音识别任务,然而人工神经网络的能量需求是巨大的。脉冲神经网络(snn)作为第三代人工神经网络,以脉冲的形式对信息进行处理。脉冲形式的信息表现为时间点上的离散事件。脉冲神经网络通过脉冲编码将连续的信息转变为离散的脉冲事件,在脉冲出现的时候才进行计算,从而大大降低了能耗。snn不仅能显著降低系统功耗,还更接近生物神经系统的信息处理方式。如何将声音信息合理的编码成脉冲信号是脉冲神经网络具有好性能的前提。
2、目前对于声音信息的脉冲编码方法主要速率编码和时间编码。速率编码表现为脉冲的发放频率与声音信号的强度成正比。时间编码表现为用脉冲发放的延迟时间反映声音能量特征,能量越强脉冲发放时刻越早。然而这些编码方法与真实的生物听觉差距较大,在生物学解释上存在较大不足,难以真实反映生物听觉过程中的复杂编码机制。因此,如何设计出一种既低功耗又具备生物学解释性的合理脉冲编码方法,成为制约snn在声音识别领域进一步发展的关键问题。在生物听觉过程中,声音经过外耳、中耳传导到内耳,特别是在耳蜗内的柯蒂氏器中,柯蒂氏器是初级听觉感受器,由毛细胞,支持细胞,螺旋神经元细胞构成,其中毛细胞是主要的听觉感受器,声音刺激会引起毛细胞上的纤毛进行机械位移,从而触发细胞膜上的机械敏感离子通道的开放或关闭,引起膜电位的变化并触发动作电位的产生,实现声音信号向神经信号的转换。这一过程不仅涉及频率和强度的编码,同时也整合了时间和空间维度的信息,从而实现了高效、精细的声音处理。迄今为止,尚未有完整的系统能够直接从生物听觉响应中提取启发,构建出一套完整且合理的脉冲编码方法。
技术实现思路
1、本发明目的在于针对现有技术的不足,提出一种生物听觉启发的声音脉冲编码与识别方法及系统。
2、本发明的目的是通过以下技术方案来实现的:一种生物听觉启发的声音脉冲编码与识别方法,包括以下步骤:
3、(1)采用生物听觉感受器作为敏感元件,并配置有多电极阵列及优化后的腔室构建得到仿生听觉传感芯片,用于在声音刺激下记录电生理响应;
4、(2)利用所述仿生听觉传感芯片检测不同频率和不同强度纯音刺激下的响应模式;
5、(3)采用优化算法调整神经元模型参数,基于神经元模型将在不同频率和强度下产生的脉冲发放模式输出与所述仿生听觉传感芯片记录的响应数据进行拟合,构建仿生听觉编码算法,通过对声音信号进行预处理和特征提取,得到的声音频率和强度信息作为仿生听觉编码算法输入,得到编码后的脉冲输出,实现将连续的声音信号编码为离散的脉冲信号;
6、(4)构建基于脉冲神经网络的声音识别网络,将步骤(3)中得到的脉冲信号输入所述网络,实现对声音的识别。
7、进一步地,所述生物听觉感受器为从生物听觉系统中提取的细胞或组织,包括柯蒂氏器、耳蜗、内耳类器官、毛细胞或螺旋神经节细胞中的任一者,生物听觉感受器培养在多电极阵列表面,生物听觉感受器与电极表面贴合。
8、进一步地,所述仿生听觉传感芯片包括生物听觉感受器、多电极阵列以及优化尺寸腔室,其中所述腔室通过声学仿真或实验反馈确定最佳尺寸,以提供生物听觉感受器所需的液体离子环境及理想声学条件;生物听觉感受器能够在声音刺激下产生细胞外动作电位,通过多电极阵列采集相应的电位信号,用于反应生物听觉感受器对声学刺激的响应模式。
9、进一步地,响应模式为发放率、发放间隔和同步性中的一种或多种。
10、进一步地,所述声音刺激为纯音刺激,其频率包括100 hz、500 hz、1000 hz、2000hz、3000 hz和4000 hz,强度包括60 db、70 db、80 db和90 db。
11、进一步地,步骤(2)中,使用强度相同的不同频率纯音刺激测试仿生听觉传感芯片对声音频率的响应情况,使用频率相同的不同强度纯音刺激测试仿生听觉传感器芯片对声音强度的响应情况。
12、进一步地,步骤(3)中,对连续声音信号进行预处理,包括语音活动检测、预加重及恒q变换操作,以提取声音的频率、强度及谱特征。
13、进一步地,所述仿生听觉编码算法以izhikevich神经元模型为骨架,通过退火算法、遗传算法、蚁群算法或网格搜索优化算法调整参数,使得模型输出的脉冲发放模式与仿生听觉传感芯片记录的响应数据之间的均方根误差最小化。
14、进一步地,所述声音识别网络采用基于脉冲神经网络的输入层、中间层和输出层三层结构,其中脉冲神经元为lif神经元,并在训练过程中采用梯度替代法实现反向传播。
15、另一方面,本发明还提供了一种生物听觉启发的声音脉冲编码与识别系统,该系统包括:
16、仿生听觉传感芯片构建模块,用于采用生物听觉感受器作为敏感元件,并配置有多电极阵列及优化后的腔室构建得到仿生听觉传感芯片;
17、仿生听觉响应模块,用于利用多种声音刺激测试仿生听觉传感芯片对不同频率和不同强度纯音的响应模式;
18、声音预处理与特征提取模块,用于对声音信号进行预处理和特征提取,得到的声音频率和强度信息;
19、仿生听觉编码模块,用于基于神经元模型将在不同频率和强度下产生的脉冲发放模式输出与所述仿生听觉传感芯片记录的响应数据进行拟合,构建仿生听觉编码算法;输入声音频率和强度信息,将连续的声音信号编码为离散的脉冲信号;
20、基于脉冲神经网络的声音识别模块,用于对编码后的脉冲信号进行处理,实现声音的准确识别。
21、本发明的有益效果:
22、(1)本发明方法模拟了生物听觉系统的感知过程,更加反应了生物对声音的反应;
23、(2)同时,本发明使用生物听觉感受器作为听觉感受的敏感元件构建仿生听觉传感芯片,因而能够直接获得符合生物感受声音刺激后的听觉响应;
24、(3)本发明构建的仿生听觉编码算法通过直接模拟仿生听觉传感芯片中获取的声音响应模式,将声音信息编码成脉冲信息,即具有生物合理性又具有计算可行性;
25、(4)与传统的声音识别方法对比,本发明通过对声音信号编码为离散的脉冲信号,并构建脉冲神经网络对编码后的脉冲信号进行声音识别,更加符合生物的听觉感知过程;
26、(5)本发明从仿生听觉传感芯片,仿生听觉编码,脉冲神经网络,提出了从听觉感受,转换,识别的整个仿生听觉感知系统,并且在声音识别任务中取得更好识别结果。
1.一种生物听觉启发的声音脉冲编码与识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,所述生物听觉感受器为从生物听觉系统中提取的细胞或组织,包括柯蒂氏器、耳蜗、内耳类器官、毛细胞或螺旋神经节细胞中的任一者,生物听觉感受器培养在多电极阵列表面,生物听觉感受器与电极表面贴合。
3.根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,所述仿生听觉传感芯片包括生物听觉感受器、多电极阵列以及优化尺寸腔室,其中所述腔室通过声学仿真或实验反馈确定最佳尺寸,以提供生物听觉感受器所需的液体离子环境及理想声学条件;生物听觉感受器能够在声音刺激下产生细胞外动作电位,通过多电极阵列采集相应的电位信号,用于反应生物听觉感受器对声学刺激的响应模式。
4.根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,响应模式为发放率、发放间隔和同步性中的一种或多种。
5. 根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,所述声音刺激为纯音刺激,其频率包括100 hz、500 hz、1000 hz、2000 hz、3000 hz和4000hz,强度包括60 db、70 db、80 db和90 db。
6.根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,步骤(2)中,使用强度相同的不同频率纯音刺激测试仿生听觉传感芯片对声音频率的响应情况,使用频率相同的不同强度纯音刺激测试仿生听觉传感器芯片对声音强度的响应情况。
7.根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,步骤(3)中,对连续声音信号进行预处理,包括语音活动检测、预加重及恒q变换操作,以提取声音的频率、强度及谱特征。
8.根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,所述仿生听觉编码算法以izhikevich神经元模型为骨架,通过退火算法、遗传算法、蚁群算法或网格搜索优化算法调整参数,使得模型输出的脉冲发放模式与仿生听觉传感芯片记录的响应数据之间的均方根误差最小化。
9.根据权利要求1所述的生物听觉启发的声音脉冲编码与识别方法,其特征在于,所述声音识别网络采用基于脉冲神经网络的输入层、中间层和输出层三层结构,其中脉冲神经元为lif神经元,并在训练过程中采用梯度替代法实现反向传播。
10.一种实现权利要求1所述方法的生物听觉启发的声音脉冲编码与识别系统,其特征在于,该系统包括: