一种人声自动还原系统及方法与流程

文档序号:30226563发布日期:2022-06-01 01:42阅读:115来源:国知局
一种人声自动还原系统及方法与流程

1.本发明涉及人声信号处理技术领域,尤其是涉及一种人声自动还原系统及方法。


背景技术:

2.现有使用的扩声设备大多数扩声保真度效果不明显,没有男人、女人声音的识别功能,故针对男、女人扩声时会出现比较明显的扩声差异,这种方式下会影响会议或者演讲者的效果,体验感较差。
3.故而亟需一种人声自动还原系统来解决所提出的问题。


技术实现要素:

4.基于此,有必要针对现有技术的不足,提供一种人声自动还原系统及方法,不管男的还是女的在讲话扩声时都可以较高质量还原男声或女声的声音效果。
5.为解决上述技术问题,本发明所采用的技术方案是:
6.本发明提供了一种人声自动还原系统,其包括声音采集模块、人声识别模块及信号处理模块,所述声音采集模块分别连接人声识别模块及信号处理模块,所述人声识别模块与信号处理模块连接,所述声音采集模块用于采集人声音频信号,并将人声音频信号发送给人声识别模块及信号处理模块,所述人声识别模块用于对人声音频信号进行识别,并发送音基判断信号给信号处理模块,信号处理模块根据音基判断信号选择适配的预设eq参数对人声音频信号进行调节。
7.在其中一个实施例中,所述信号处理模块包括mcu模块及音频处理模块,所述mcu模块的输入端与人声识别模块连接,所述mcu模块的输出端与音频处理模块连接,所述音频处理模块与声音采集模块连接。
8.在其中一个实施例中,所述mcu模块存储有预设eq参数,所述mcu模块基于音基判断信号选取合适的预设eq参数发送给音频处理模块。
9.在其中一个实施例中,所述人声识别模块包括男声音基判断单元及女声音基判断单元,所述男声音基判断单元及女声音基判断单元并联设置,所述音基判断信号包括男声音基判断信号及女声音基判断信号,所述男声音基判断单元用于接收人声音频信号,并将男声音基判断信号发送给信号处理模块;所述女声音基判断单元用于接收人声音频信号,并将获取的女声音基判断信号发送给信号处理模块。
10.在其中一个实施例中,所述声音采集模块包括第一比较器u3b、电阻r29、r30、r31、r32、r33、r34、r35、r36、电容c17、c18、c19、c20、c21、c22、c23及esd管d1,其中,第一比较器u3b负输入端连接电阻r33一端,电阻r33另一端与电容c19一端连接,电容c19一端与电阻r34一端、电容c21一端连接,电阻r34另一端连接电阻r32一端、电容c22一端及esd管d1一端,电阻r32另一端与电阻r30、电容c17一端连接,电阻r30另一端连接第一模拟供电电源avcc1,电容c17与电阻r29并联且电容c17另一端接地;第一比较器u3b正输入端连接电阻r35、电阻r36一端,电阻r36另一端连接参考电压vref,电阻r35另一端连接电容c23一端,电
容c23另一端与电容c21另一端、电容c22另一端及esd管d1另一端连接,且电容c23另一端接地;所述第一比较器u3b输出端连接电容c20一端、电阻r31一端及电容c18一端,电阻r31另一端及电容c18另一端分别与第一比较器u3b负输入端连接,电容c20另一端对应声音采集模块输出端mic_out,电容c22一端对应声音采集模块输入端mic_in。
11.在其中一个实施例中,所述男声音基判断单元包括电阻r1~r14、电容c1~c8、第二比较器u1a、第三比较器u1b及第一三极管q1,所述第二比较器u1a的负输入端连接电容c6一端及电阻r14一端,电容c6另一端连接电容c8一端、电阻r9一端及电阻r13一端,电阻r9一端连接声音采集模块输出端mic_out,电阻r13另一端接地,电阻r14另一端、电容c8另一端均连接第二比较器u1a输出端,所述第二比较器u1a的正输入端连接电阻r6一端及电阻r4一端,电阻r6另一端接地,电阻r4另一端连接电阻r1一端、电容c2一端、电容c3一端及第二模拟供电电源avcc2,电阻r1另一端连接电容c1一端及供电电压vcc,电容c1另一端、电容c2另一端及电容c3另一端均接地;第二比较器u1a的输出端连接电阻r8,电阻r8连接电阻r11一端、电容c5一端及电容c7一端,所述电阻r11另一端接地,所述电容c5另一端连接第三比较器u1b的负输入端及电阻r12,所述电容c7另一端及电阻r12另一端连接第三比较器u1b的输出端,所述第三比较器u1b的正输入端连接电阻r5一端及电阻r3一端,所述电阻r5另一端接地,所述电阻r3连接第二模拟供电电源avcc2;所述第三比较器u1b的输出端连接电容c4一端,所述电容c4另一端连接电阻r7一端,所述电阻r7另一端连接电阻r10一端及第一三极管q1的基极,电阻r10另一端连接第一三极管q1的集电极及电阻r2一端,电阻r2另一端连接供电电压vcc,所述第一三极管q1的发射极接地;其中,所述第一三极管q1的集电极对应男声音基判断单元的输出端dell1_det。
12.在其中一个实施例中,所述女声音基判断单元包括电阻r15~r28、电容c9~c16、第四比较器u2a、第五比较器u2b及第二三极管q3,所述第四比较器u2a的负输入端连接电容c14一端及电阻r28一端,电容c14另一端连接电容c16一端、电阻r23一端及电阻r27一端,电阻r23一端连接声音采集模块输出端mic_out,电阻r27另一端接地,电阻r28另一端、电容c16另一端均连接第四比较器u2a输出端,所述第四比较器u2a的正输入端连接电阻r20一端及电阻r18一端,电阻r20另一端接地,电阻r18另一端连接电阻r15一端、电容c10一端、电容c11一端及第二模拟供电电源avcc1,电阻r15另一端连接电容c9一端及供电电压vcc,电容c9另一端、电容c10另一端及电容c11另一端均接地;第四比较器u2a的输出端连接电阻r22,电阻r22连接电阻r25一端、电容c13一端及电容c15一端,所述电阻r25另一端接地,所述电容c13另一端连接第五比较器u2b的负输入端及电阻r26,所述电容c15另一端及电阻r26另一端连接第五比较器u2b的输出端,所述第五比较器u2b的正输入端连接电阻r19一端及电阻r17一端,所述电阻r19另一端接地,所述电阻r17连接第二模拟供电电源avcc2;所述第五比较器u2b的输出端连接电容c12一端,所述电容c12另一端连接电阻r21一端,所述电阻r21另一端连接电阻r24一端及第二三极管q3的基极,电阻r24另一端连接第二三极管q3的集电极及电阻r16一端,电阻r16另一端连接供电电压vcc,所述第二三极管q3的发射极接地;其中,所述第二三极管q3的集电极对应女声音基判断单元的输出端dell2_det。
13.本发明还提供了一种人声自动还原方法,其包括如下步骤:
14.通过声音采集模块采集并处理人声音频信号;
15.通过人声识别模块对人声音频信号进行判断,获取音基判断信号;
500hz;本发明实施例提供的一种人声自动还原系统及方法具体可以应用于智能终端上,所述一种人声自动还原系统包括声音采集模块、人声识别模块及信号处理模块,通过人声识别模块对人声音频信号进行识别获取声音性别属性对应的音基判断信号,再将人声音频信号发送给信号处理模块,信号处理模块根据音基判断信号,通过预设eq(equaliser,均衡器)参数对人声音频信号进行调节,来提升扩声音质,较高质量还原男声或女声的声音效果。以下对本实施例提供的一种人声自动还原系统及方法进行详细地说明。
36.如图1所示,本发明一种人声自动还原系统包括声音采集模块100、人声识别模块200及信号处理模块300,所述声音采集模块100分别连接人声识别模块200及信号处理模块300,所述人声识别模块200与信号处理模块300连接,所述声音采集模块100用于采集人声音频信号,并将人声音频信号发送给人声识别模块200及信号处理模块300,所述人声识别模块200用于对人声音频信号进行识别,并发送音基判断信号给信号处理模块300,信号处理模块300根据音基判断信号选择适配的预设eq参数对人声音频信号进行调节。
37.如图4所示,所述声音采集模块100包括第一比较器u3b、电阻r29、r30、r31、r32、r33、r34、r35、r36、电容c17、c18、c19、c20、c21、c22、c23及esd管d1,其中,第一比较器u3b负输入端连接电阻r33一端,电阻r33另一端与电容c19一端连接,电容c19一端与电阻r34一端、电容c21一端连接,电阻r34另一端连接电阻r32一端、电容c22一端及esd管d1一端,电阻r32另一端与电阻r30、电容c17一端连接,电阻r30另一端连接第一模拟供电电源avcc1,电容c17与电阻r29并联且电容c17另一端接地;第一比较器u3b正输入端连接电阻r35、电阻r36一端,电阻r36另一端连接参考电压vref,电阻r35另一端连接电容c23一端,电容c23另一端与电容c21另一端、电容c22另一端及esd管d1另一端连接,且电容c23另一端接地;所述第一比较器u3b输出端连接电容c20一端、电阻r31一端及电容c18一端,电阻r31另一端及电容c18另一端分别与第一比较器u3b负输入端连接,电容c20另一端对应声音采集模块100输出端mic_out,电容c22一端对应声音采集模块100输入端mic_in;所述第一比较器u3b采用芯片型号为lm358。
38.上述声音采集模块100实现原理为由麦克风接收到讲话者的人声音频信号后通过声音采集模块100输入端mic_in进入到声音采集模块100中,通过电容c22、电阻r34、电容c21组成的π型滤波器消除除人声之外的杂音频率,利用电容c19进行耦合后,再通过电组r33、电阻r31与第一比较器u3b构成负反馈运算放大单元,从而将声音采集模块100采集的人声音频信号进行放大,放大后的人声音频信号通过声音采集模块100输出端mic_out输送到人声识别模块200。
39.如图2所示,所述人声识别模块200包括男声音基判断单元210及女声音基判断单元220,所述音基判断信号包括男声音基判断信号及女声音基判断信号,所述男声音基判断单元210用于接收人声音频信号,并将男声音基判断信号发送给信号处理模块300;所述女声音基判断单元220用于接收人声音频信号,并将获取的女声音基判断信号发送给信号处理模块300。
40.如图5所示,所述男声音基判断单元210及女声音基判断单元220并联设置,所述男声音基判断单元210及女声音基判断单元220的输入端均与声音采集模块100输出端连接,所述男声音基判断单元210包括电阻r1~r14、电容c1~c8、第二比较器u1a、第三比较器u1b及第一三极管q1,所述第二比较器u1a的负输入端连接电容c6一端及电阻r14一端,电容c6
另一端连接电容c8一端、电阻r9一端及电阻r13一端,电阻r9一端连接声音采集模块100输出端mic_out,电阻r13另一端接地,电阻r14另一端、电容c8另一端均连接第二比较器u1a输出端,所述第二比较器u1a的正输入端连接电阻r6一端及电阻r4一端,电阻r6另一端接地,电阻r4另一端连接电阻r1一端、电容c2一端、电容c3一端及第二模拟供电电源avcc2,电阻r1另一端连接电容c1一端及供电电压vcc,电容c1另一端、电容c2另一端及电容c3另一端均接地;第二比较器u1a的输出端连接电阻r8,电阻r8连接电阻r11一端、电容c5一端及电容c7一端,所述电阻r11另一端接地,所述电容c5另一端连接第三比较器u1b的负输入端及电阻r12,所述电容c7另一端及电阻r12另一端连接第三比较器u1b的输出端,所述第三比较器u1b的正输入端连接电阻r5一端及电阻r3一端,所述电阻r5另一端接地,所述电阻r3连接第二模拟供电电源avcc2;所述第三比较器u1b的输出端连接电容c4一端,所述电容c4另一端连接电阻r7一端,所述电阻r7另一端连接电阻r10一端及第一三极管q1的基极,电阻r10另一端连接第一三极管q1的集电极及电阻r2一端,电阻r2另一端连接供电电压vcc,所述第一三极管q1的发射极接地;其中,所述第一三极管q1的集电极对应男声音基判断单元210的输出端dell1_det,所述第二比较器u1a及第三比较器u1b采用芯片型号均为opa1678。
41.本发明男声音基判断单元210具体工作原理如下,当人声音频信号由男性讲话者发出时,放大后的人声音频信号通过电阻r9耦合,配合电阻r13、电容c6组成第一阶低通滤波滤除高频信号,再通过电阻r14、电容c8与第二比较器u1a配合进行第二阶滤波处理,从而得到较为平缓以200hz为中心的频点信号及群组延时信号,如图7所示;如图8所示,群组延时信号通过电阻r8耦合后进入到由电容c5、电容c7、电阻r12及第三比较器u1b组成的阶跃响应电路,从而得到跳变信号变趋近于0的值,如图9所示,此时,第一三极管q1导通,进而使得男声音基判断单元210的输出端dell1_det信号变为0电平,从而获得男声音基判断信号,并将男声音基判断信号发送给信号处理模块300。
42.所述女声音基判断单元220包括电阻r15~r28、电容c9~c16、第四比较器u2a、第五比较器u2b及第二三极管q3,所述第四比较器u2a的负输入端连接电容c14一端及电阻r28一端,电容c14另一端连接电容c16一端、电阻r23一端及电阻r27一端,电阻r23一端连接声音采集模块100输出端mic_out,电阻r27另一端接地,电阻r28另一端、电容c16另一端均连接第四比较器u2a输出端,所述第四比较器u2a的正输入端连接电阻r20一端及电阻r18一端,电阻r20另一端接地,电阻r18另一端连接电阻r15一端、电容c10一端、电容c11一端及第二模拟供电电源avcc1,电阻r15另一端连接电容c9一端及供电电压vcc,电容c9另一端、电容c10另一端及电容c11另一端均接地;第四比较器u2a的输出端连接电阻r22,电阻r22连接电阻r25一端、电容c13一端及电容c15一端,所述电阻r25另一端接地,所述电容c13另一端连接第五比较器u2b的负输入端及电阻r26,所述电容c15另一端及电阻r26另一端连接第五比较器u2b的输出端,所述第五比较器u2b的正输入端连接电阻r19一端及电阻r17一端,所述电阻r19另一端接地,所述电阻r17连接第二模拟供电电源avcc2;所述第五比较器u2b的输出端连接电容c12一端,所述电容c12另一端连接电阻r21一端,所述电阻r21另一端连接电阻r24一端及第二三极管q3的基极,电阻r24另一端连接第二三极管q3的集电极及电阻r16一端,电阻r16另一端连接供电电压vcc,所述第二三极管q3的发射极接地;其中,所述第二三极管q3的集电极对应女声音基判断单元220的输出端dell2_det,所述第四比较器u2a及第五比较器u2b采用芯片型号均为opa1678。
43.本发明女声音基判断单元220具体工作原理如下,当人声音频信号由女性讲话者发出时,放大后的人声音频信号通过电阻r23耦合,配合电阻r27、电容c14组成第一阶低通滤波滤除高频信号,再通过电阻r28、电容c16与第四比较器u2a配合进行第二阶滤波处理,从而得到较为平缓以400hz为中心的频点信号及群组延时信号,如图10所示;如图11所示,群组延时信号通过电阻r8耦合后进入到由电容c13、电容c15、电阻r26及第五比较器u2b组成的阶跃响应电路,从而得到跳变信号变趋近于0的值,如图12所示,此时,第二三极管q3导通,进而使得女声音基判断单元220的输出端dell2_det信号变为0电平,从而获得女声音基判断信号,并将女声音基判断信号发送给信号处理模块300。
44.如图3所示,所述信号处理模块300包括mcu模块310及音频处理模块320,所述mcu模块310的输入端与人声识别模块200连接,具体地,mcu模块310的输入端分别与男声音基判断单元210及女声音基判断单元220连接,其中,男声音基判断单元210及女声音基判断单元220分别连接mcu模块310不同的io检测端口,使得mcu模块310可以根据io检测端口处的输入信号来获取音基判断信号对应的声音性别属性结果;所述mcu模块310的输出端与音频处理模块320连接,所述音频处理模块320与声音采集模块100连接,所述mcu模块310存储有预设eq参数,所述mcu模块310基于音基判断信号选取合适的预设eq参数发送给音频处理模块320,声音采集模块100将人声音频信号发送给音频处理模块320,音频处理模块320将人声音频信号根据预设eq参数进行调节处理,获取人声音频调节声音,进而来提升人声音频信号的扩声音质,较高质量还原男声或女声的声音效果。
45.当男声音基判断单元210通过其对应的io检测端口发送男声音基判断信号给mcu模块310时,mcu模块310判断对应的人声音频信号为男性讲话者;mcu模块310判断出声音性别属性后,将男声对应的预设eq参数发送给音频处理模块320,音频处理模块320对人声音频信号进行调节处理,获取人声音频调节声音,进而来提升人声音频信号的扩声音质,较高质量还原男声或女声的声音效果。
46.本实施例中,音频处理模块320对人声音频信号进行调节处理的具体过程为:当人声音频信号处于150hz-300hz频段时,音频处理模块320对该人声音频信号进行3db的增益提升,由于这个频段是男生的低音基音频率,如果这段频率缺乏,音色会显得发软、发飘,语音变得软绵绵;当人声音频信号处于300hz-500hz频段时,音频处理模块320对该人声音频信号进行1db的增益提升,这段频率幅度饱满,语音有力度,如果这段频率幅度不足,声音会显得空洞,不坚实;当人声音频信号处于500hz-1khz频段时,音频处理模块320对该人声音频信号进行1db的增益提升,这个频段人声的音基频率点,这段频率丰满,人声的轮廓明朗,整体感好,如果这段频率不足,语音会产生一种收缩感;通过对男声主要的中低音频段进行预设eq参数调节,使得男性在不同场景讲话都会适配当时的情感表达,同时有效还原男声或女声的声音效果。
47.当女声音基判断单元220通过其对应的io检测端口发送女声音基判断信号给mcu模块310时,mcu模块310判断对应的人声音频信号为女性讲话者;mcu模块310判断出声音性别属性后,将女声对应的预设eq参数发送给音频处理模块320,音频处理模块320对人声音频信号进行调节处理,获取人声音频调节声音,进而来提升人声音频信号的扩声音质,较高质量还原女声或女声的声音效果。
48.本实施例中,当mcu模块310判断对应的人声音频信号为女性讲话者时,音频处理
模块320对人声音频信号进行调节处理的具体过程为:当人声音频信号处于300hz-500hz频段时,音频处理模块320对该人声音频信号进行1db的增益提升,这段频率幅度饱满,语音有力度,如果这段频率幅度不足,声音会显得空洞,不坚实;当人声音频信号处于500hz-1khz频段时,音频处理模块320对该人声音频信号进行1db的增益提升,这段频率丰满,人声的轮廓明朗,整体感好,如果这段频率不足,语音会产生一种收缩感;当人声音频信号处于1khz-2khz频段时,音频处理模块320对该人声音频信号进行1db的增益提升,这段频率范围通透感明显,顺畅感强,如果这段平吕缺乏,音色松散且音色脱节;通过对女声主要的中高音频段进行预设eq参数调节,使得女性在不同场景讲话都会适配当时的情感表达,同时有效还原女声或女声的声音效果。
49.如图6所示,根据上述本发明一种人声自动还原系统,本发明提供了一种人声自动还原方法,该方法中涉及的声音采集模块100、人声识别模块200及信号处理模块300可以与上述一种人声自动还原系统实施例阐述的技术特征相同,并能产生相同的技术效果。本发明一种人声自动还原方法,通过人声识别模块200对人声音频信号进行识别获取声音性别属性对应的音基判断信号,再将人声音频信号发送给信号处理模块300,信号处理模块300根据音基判断信号,通过预设eq参数对人声音频信号进行调节,来提升扩声音质,较高质量还原男声或女声的声音效果。
50.图6是本发明实施例提供的一种人声自动还原方法的流程示意图,如图6所示,该一种人声自动还原方法,包括步骤s110-步骤s130,具体如下:
51.步骤s110、通过声音采集模块100采集并处理人声音频信号;声音采集模块100对采集的人声音频信号进行处理,获取处理后的人声音频信号。
52.步骤s120、通过人声识别模块200对人声音频信号进行判断,获取音基判断信号;所述音基判断信号包括男声音基判断信号及女声音基判断信号,所述人声识别模块200包括男声音基判断单元210及女声音基判断单元220,所述男声音基判断单元210用于接收人声音频信号,并将男声音基判断信号发送给信号处理模块300;所述女声音基判断单元220用于接收人声音频信号,并将获取的女声音基判断信号发送给信号处理模块300。
53.步骤s130、基于音基判断信号,信号处理模块300根据预设eq参数对人声音频信号进行调节,获取人声音频调节声音,来提升人声音频信号的扩声音质,较高质量还原男声或女声的声音效果。
54.具体地,所述信号处理模块300包括mcu模块310及音频处理模块320,男声音基判断单元210及女声音基判断单元220分别连接mcu模块310不同的io检测端口,使得mcu模块310可以根据io检测端口处的输入信号来获取音基判断信号对应的声音性别属性结果。
55.在一个实施例中,所述步骤s130的方法,具体操作包括:
56.当男声音基判断单元210通过其对应的io检测端口发送男声音基判断信号给mcu模块310时,mcu模块310判断对应的人声音频信号为男性讲话者;mcu模块310判断出声音性别属性后,将男声对应的预设eq参数发送给音频处理模块320,音频处理模块320对人声音频信号进行调节处理,获取人声音频调节声音,进而来提升人声音频信号的扩声音质,较高质量还原男声或女声的声音效果。
57.在另一实施例中,所述步骤s130的方法,具体操作包括:
58.当女声音基判断单元220通过其对应的io检测端口发送女声音基判断信号给mcu
模块310时,mcu模块310判断对应的人声音频信号为女性讲话者;mcu模块310判断出声音性别属性后,将女声对应的预设eq参数发送给音频处理模块320,音频处理模块320对人声音频信号进行调节处理,获取人声音频调节声音,进而来提升人声音频信号的扩声音质,较高质量还原女声或女声的声音效果。
59.综上所述,本发明一种人声自动还原系统及方法通过人声识别模块200对人声音频信号进行识别获取声音性别属性对应的音基判断信号,再将人声音频信号发送给信号处理模块300,信号处理模块300根据音基判断信号,通过预设eq参数对人声音频信号进行调节,来提升扩声音质,较高质量还原男声或女声的声音效果。
60.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1