基于自适应语音强度调节的智能电话装置的制作方法

文档序号：28601891发布日期：2022-01-22 11:27阅读：105来源：国知局

1.本发明涉及电话语音通信技术领域，更为具体的，涉及一种基于自适应语音强度调节的智能电话装置。

背景技术：

2.电话语音通信一直以来都是重要的通信手段。在当前电话情况下，说话方距离话筒的距离大小不一致，或者说话声音由于各种原因忽大忽小，接收方收到的语音强度会存在忽大忽小，影响通话体验。当前设备不具备自适应语音强度调节功能。

技术实现要素：

3.本发明的目的在于克服现有技术的不足，提供一种基于自适应语音强度调节的智能电话装置，解决了电话通话中由于距离变化等原因造成的语音强度不稳定问题，持续学习形成语音舒适区，利用智能自适应语音强度调节方法对语音进行积累学习，对语音强度进行智能调整，提升电话用户体验。
4.本发明的目的是通过以下方案实现的：
5.一种基于自适应语音强度调节的智能电话装置，包括语音模块和电源模块，语音模块与电源模块连接；以及设置有语音强度舒适区学习模块和智能自适应语音强度模块的处理器，该处理器与语音模块连接。
6.进一步地，所述语音强度舒适区学习模块用于语音强度舒适区的构造及相关参数的更新；所述智能自适应语音强度模块用于根据所述语音强度舒适区对采样周期内的采样点的语音强度进行优化调整，以达到舒适语音强度输出的效果。
7.进一步地，所述语音模块用于语音的采集输入和输出。
8.进一步地，所述语音强度舒适区学习模块，通过数据积累和机器学习识别出语音强度舒适区间；每个语音采样周期t里面有n个语音采样点，语音强度舒适区学习模块针对接收方在每个语音采样周期t里面的n个语音采样点进行语音强度舒适区学习调整，对不在语音强度舒适区的语音进行语音强度的调整，最终调整到语音强度舒适区内。
9.进一步地，所述智能自适应语音强度模块，针对接收方在每个语音采样周期t里面的n个语音采样点进行调整到语音强度舒适区的调整过程，当每个周期完成了语音强度舒适区学习模块处理之后，利用智能自适应语音强度模块进行当前采样点的语音强度调整。
10.进一步地，所述语音强度舒适区学习模块包括：
11.第一学习调整模块，用于执行第一学习调整流程：当vb《＝vmin时，则vmin减小10个单位语音强度v_unit，即vmin_new＝vmin
–
10*v_unit)；vmax减小5个单位语音强度调整量v_unit，即vmax_new＝vmax
–
5*v_unit)，最后将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，更新v_span的值，完成语音强度舒适区上下边界的更新；
12.第二学习调整模块，用于执行第二学习调整流程：当va《vmin且vmin《vb《vmax时，则vmin保持不变，即vmin_new＝vmin；vmax减小2个单位语音强度v_unit，即vmax_new＝
vmax
–
2*v_unit；若本场景调整后的v_span_new小于v_minspan，则本次调整周期不更新vmax与vmin的值，及语音强度舒适区上下边界保持不变，若本场景调整后的v_span_new大于或者等于v_minspan，则将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，v_span的值更新为v_span_new的值，完成语音强度舒适区上下边界的更新；
13.第三学习调整模块，用于执行第三学习调整流程：当va》vmin且vb《vmax时，则vmin增加1个单位语音强度v_unit，即vmin_new＝vmin+v_unit；vmax减小1个单位语音强度调整量v_unit，即vmax_new＝vmax
–
v_unit；若本场景调整后的v_span_new小于v_minspan，则本次调整周期不更新vmax与vmin的值，及语音强度舒适区上下边界保持不变，若本场景调整后的v_span_new大于或者等于v_minspan，则将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，v_span的值更新为v_span_new的值，完成语音强度舒适区上下边界的更新；
14.第四学习调整模块，用于执行第四学习调整流程：当vmin《va《vmax且vb》vmax时，则vmin增加2个单位语音强度v_unit，即vmin_new＝vmin+2*v_unit；vmax保持不变，即vmax_new＝vmax；若本场景调整后的v_span_new小于v_minspan，则本次调整周期不更新vmax与vmin的值，及语音强度舒适区上下边界保持不变，若本场景调整后的v_span_new大于或者等于v_minspan，则将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，v_span的值更新为v_span_new的值，完成语音强度舒适区上下边界的更新；
15.第五学习调整模块，用于执行第五学习调整流程：当va》＝vmax时，则vmax增大10个单位语音强度v_unit，即vmax_new＝vmax+10*v_unit；vmin增大5个单位语音强度调整量v_unit，即vmin_new＝vmin+5*v_unit，最后将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，更新v_span的值，完成语音强度舒适区上下边界的更新；
16.第六学习调整模块，用于执行第六学习调整流程：当va《＝vmin且vb》＝vmax时，则vmin减小1个单位语音强度v_unit，即vmin_new＝vmin-v_unit；vmax增加1个单位语音强度调整量v_unit，即vmax_new＝vmax+v_unit，最后将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，更新v_span的值，完成语音强度舒适区上下边界的更新；
17.第七学习调整模块，用于执行第七学习调整流程：本采样周期内80％样点的语音强度都小于2％的v_sysmax(v_sysmax＝1000v_unit)，即超过80％的样点在20v_unit以内的，则视为静音场景，在本周期内不调整舒适区上下边界，且不对语音进行语音强度调整。
18.进一步地，当v_curspan《＝v_span_new时，所述智能自适应语音强度模块包括：
19.第一调整模块，当va《＝vmin_new时，本周期所有样点整体增大(vmin_new-va)的语音强度；
20.第二调整模块，当va》＝vmin_new且vb《＝vmax_new时，本周期所有样点整体语音强度调整为0，即不进行调整；
21.第三调整模块，当vb》＝vmax_new时，本周期所有样点整体减小(vb-vmax_new)的语音强度。
22.进一步地，当v_curspan》v_span_new时，所述智能自适应语音强度模块包括：
23.第四调整模块，用于执行第四调整流程：用于执行第一调整流程：当va》＝vmin_new时，本周期所有样点整体减小(va-vmin_new)的语音强度；
24.第五调整模块，用于执行第五调整流程：用于执行第二调整流程：当va《＝vmin_
new且vb》＝vmax_new时，本周期所有样点整体语音强度调整为0，即不进行调整；
25.第六调整模块，用于执行第六调整流程：用于执行第三调整流程：当vb《＝vmax_new时，本周期所有样点整体增大(vmax_new-vb)的语音强度。
26.本发明的有益效果包括：
27.本发明解决了电话通话中由于距离变化等原因造成的语音强度不稳定问题，持续学习形成语音舒适区，利用智能自适应语音强度调节方法对语音进行积累学习，对语音强度进行智能调整到语音强度舒适区间，提升电话用户体验。
附图说明
28.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
29.图1为本发明实施例的装置功能结构示意图；
30.图2为本发明实施例的语音强度舒适区学习模块的流程图；
31.图3为本发明实施例的语音强度舒适区学习模块的场景一示意图；
32.图4为本发明实施例的语音强度舒适区学习模块的场景二示意图；
33.图5为本发明实施例的语音强度舒适区学习模块的场景三示意图；
34.图6为本发明实施例的语音强度舒适区学习模块的场景四示意图；
35.图7为本发明实施例的语音强度舒适区学习模块的场景五示意图；
36.图8为本发明实施例的语音强度舒适区学习模块的场景六示意图；
37.图9为本发明实施例的智能自适应语音强度模块的流程图；
38.图10为本发明实施例的智能自适应语音强度模块中，当va《＝vmin_new时，采样点调整前示意图；
39.图11为本发明实施例的智能自适应语音强度模块中，当va《＝vmin_new时，采样点调整后示意图；
40.图12为本发明实施例的智能自适应语音强度模块中，当va》＝vmin_new且vb《＝vmax_new时，采样点调整方案示意图；
41.图13为本发明实施例的智能自适应语音强度模块中，当vb》＝vmax_new时，采样点调整前示意图；
42.图14为本发明实施例的智能自适应语音强度模块中，当vb》＝vmax_new时，采样点调整后示意图；
43.图15为本发明实施例的智能自适应语音强度模块中，当va》＝vmin_new时，采样点调整前示意图；
44.图16为本发明实施例的智能自适应语音强度模块中，当va》＝vmin_new时，采样点调整后示意图；
45.图17为本发明实施例的智能自适应语音强度模块中，当va《＝vmin_new且vb》＝vmax_new时，采样点调整方案示意图；
46.图18为本发明实施例的智能自适应语音强度模块中，当vb《＝vmax_new时，采样点
调整前示意图；
47.图19为本发明实施例的智能自适应语音强度模块中，当vb《＝vmax_new时，采样点调整后示意图；
48.术语解释
49.每个语音采样周期t里面有n个语音采样点；
50.用“v”来表示语音采样点的语音强度；
51.用“v_unit”表示单位语音强度，0为语音强度系统最小可测量值，用“v_sysmin”表示，1000倍单位语音强度大小的语音强度值为语音强度系统最大可测量值，用“v_sysmax”表示，即“v_sysmax”＝1000*v_unit,该系统的整体采样量程范围是0到1000v_unit；
52.用“vmin”表示语音强度舒适区的下边界值，用“vmax”表示语音强度舒适的上边界值，设定vmin的初始值设置为第一次语音采样点中语音强度最小的语音强度，设定vmax的初始值设置为第一次语音采样点中语音强度最大的语音强度，用“vmin_new”为本次调整周期调整更新后的vmin的值，用“vmax_new”为本次调整周期调整更新后的vmax的值。
[0053]“v_span”表示当前语音的强度舒适区的跨度范围，即vmax与vmin的差值：vmax-vmin；
[0054]“v_span_new”表示更新后的语音的强度舒适区的跨度范围，即vmax_new与vmin_new的差值：vmax_new-vmin_new；
[0055]“v_minspan”代表最小语音强度舒适区跨度范围，取值为语音强度系统最大可测量值v_sysmax的20％，即200*v_unit。
[0056]
根据语音强度ts周期内n个采样点按照语音强度进行排序，a采样点代表tc周期内语音强度最低值va的采样点，b采样点代表tc周期内语音强度最高值vb的采样点，从b点到a点的采样点的语音强度是递减的。h点为a点与b点n个采样点的中间采样点，即h点与b点之间包含了n/2个样点数，h点对应的语音强度为vh。min点为语音强度舒适区的下边界值vmin对应的采样点，max点为语音强度舒适区的下边界值vmax对应的采样点。“v_curspan”表示本周期语音采样点的跨度范围，即vb与va的差值更新后的vb
–
va。
具体实施方式
[0057]
本说明书中所有实施例公开的所有特征，或隐含公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合和/或扩展、替换。
[0058]
如图1所示，基于自适应语音强度调节的智能电话装置，包含处理器、语音模块、电源模块；处理器包括语音强度舒适区学习模块和智能自适应语音强度模块，语音强度舒适区学习模块主要负责语音强度舒适区的构造及相关参数的更新，智能自适应语音强度模块主要负责根据语音强度舒适区，对本采样周期的采样点的语音强度进行优化调整，已达到舒适语音强度输出的效果，语音模块主要完成语音的采集输入和输出。
[0059]
(1)语音强度舒适区学习模块
[0060]
通过数据积累，不断机器学习可以识别日常舒适的语音强度大小区间，即语音强度舒适区间，根据不在语音强度舒适区的语音进行语音强度的加权调整，最终调整到语音强度舒适区内。
[0061]
每个语音采样周期t里面有n个语音采样点。语音强度舒适区学习模块就是针对接
收方在每个语音采样周期t里面的n个语音采样点进行语音强度舒适区学习调整。语音强度舒适区学习模块流程图，如图2所示。在具体实施例中，调整流程如下说明：
[0062]
场景一：
[0063]
当vb《＝vmin时，则vmin减小10个单位语音强度v_unit，即vmin_new＝vmin
–
10*v_unit)；vmax减小5个单位语音强度调整量v_unit，即vmax_new＝vmax
–
5*v_unit)，最后将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，更新v_span的值，完成语音强度舒适区上下边界的更新，调整细节如图3所示。
[0064]
场景二：
[0065]
当va《vmin且vmin《vb《vmax时，则vmin保持不变，即vmin_new＝vmin；vmax减小2个单位语音强度v_unit，即vmax_new＝vmax
–
2*v_unit。
[0066]
若本场景调整后的v_span_new小于v_minspan,则本次调整周期不更新vmax与vmin的值，及语音强度舒适区上下边界保持不变，若本场景调整后的v_span_new大于或者等于v_minspan，则将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，v_span的值更新为v_span_new的值，完成语音强度舒适区上下边界的更新，调整细节如图4所示。
[0067]
场景三：
[0068]
当va》vmin且vb《vmax时,则vmin增加1个单位语音强度v_unit，即vmin_new＝vmin+v_unit；vmax减小1个单位语音强度调整量v_unit，即vmax_new＝vmax
–
v_unit。
[0069]
若本场景调整后的v_span_new小于v_minspan,则本次调整周期不更新vmax与vmin的值，及语音强度舒适区上下边界保持不变，若本场景调整后的v_span_new大于或者等于v_minspan，则将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，v_span的值更新为v_span_new的值，完成语音强度舒适区上下边界的更新，调整细节如图5所示。
[0070]
场景四：
[0071]
当vmin《va《vmax且vb》vmax时,则vmin增加2个单位语音强度v_unit，即vmin_new＝vmin+2*v_unit；vmax保持不变，即vmax_new＝vmax。
[0072]
若本场景调整后的v_span_new小于v_minspan,则本次调整周期不更新vmax与vmin的值，及语音强度舒适区上下边界保持不变，若本场景调整后的v_span_new大于或者等于v_minspan，则将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，v_span的值更新为v_span_new的值，完成语音强度舒适区上下边界的更新，调整细节如图6所示。
[0073]
场景五：
[0074]
当va》＝vmax时，则vmax增大10个单位语音强度v_unit，即vmax_new＝vmax+10*v_unit；vmin增大5个单位语音强度调整量v_unit，即vmin_new＝vmin+5*v_unit，最后将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，更新v_span的值，完成语音强度舒适区上下边界的更新，调整细节如图7所示。
[0075]
场景六：
[0076]
当va《＝vmin且vb》＝vmax时,则vmin减小1个单位语音强度v_unit，即vmin_new＝vmin-v_unit；vmax增加1个单位语音强度调整量v_unit，即vmax_new＝vmax+v_unit，最后
将vmin的值更新为vmin_new的值，将vmax的值更新为vmax_new的值，更新v_span的值，完成语音强度舒适区上下边界的更新，调整细节如图8所示。
[0077]
场景七：
[0078]
本采样周期内80％样点的语音强度都小于2％的v_sysmax(v_sysmax＝1000v_unit)，即超过80％的样点在20v_unit以内的，则视为静音场景，在本周期内不调整舒适区上下边界，且不对语音进行语音强度调整。
[0079]
(2)智能自适应语音强度模块
[0080]
智能自适应语音强度模块：针对接收方在每个语音采样周期t里面的n个语音采样点进行调整到语音强度舒适区的调整过程。当每个周期完成了语音强度舒适区学习模块处理之后，需要进行当前采样点的语音强度调整。
[0081]
智能自适应语音强度模块流程图，如图9所示。在具体实施例中，具体调整流程如下：
[0082]
当v_curspan《＝v_span_new时，按照以下三种情况进行调整：
[0083]
《1》当va《＝vmin_new时，本周期所有样点整体增大(vmin_new-va)的语音强度；调整前示意图如图10所示，调整后示意图如图11所示。
[0084]
《2》当va》＝vmin_new且vb《＝vmax_new时，本周期所有样点整体语音强度不进行调整；调整方案示意图如图12所示。
[0085]
《3》当vb》＝vmax_new时，本周期所有样点整体减小(vb-vmax_new)的语音强度；调整前示意图如图13所示，调整后示意图如图14所示。
[0086]
当v_curspan》v_span_new时，按照以下三种情况进行调整：
[0087]
《1》当va》＝vmin_new时，本周期所有样点整体减小(va-vmin_new)的语音强度；调整前示意图如图15所示，调整后示意图如图16所示。
[0088]
《2》当va《＝vmin_new且vb》＝vmax_new时,本周期所有样点整体语音强度不进行调整；调整方案示意图如图17所示。
[0089]
《3》当vb《＝vmax_new时，本周期所有样点整体增大(vmax_new-vb)的语音强度；调整前示意图如图18所示，调整后示意图如图19所示。
[0090]
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
[0091]
上述技术方案只是本发明的一种实施方式，对于本领域内的技术人员而言，在本发明公开了应用方法和原理的基础上，很容易做出各种类型的改进或变形，而不仅限于本发明上述具体实施方式所描述的方法，因此前面描述的方式只是优选的，而并不具有限制性的意义。
[0092]
除以上实例以外，本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例，各个实施例的特征可以互换或替换，本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邱春毓;廖蓉晖;杨龙剑;许志强;杨宏;康敏;李鉴
技术所有人：中国电子科技集团公司第三十研究所
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！