一种AI平台的AI语音速率调整方法及系统与流程

文档序号：42294788发布日期：2025-06-27 18:30阅读：51来源：国知局

本发明涉及自然语言处理，更具体地说，本发明涉及一种ai平台的ai语音速率调整方法及系统。

背景技术：

1、随着人工智能技术的快速发展，ai语音交互已成为人机交互的重要方式，广泛应用于智能助手、客服系统、教育平台等多个领域。然而，现有ai语音交互系统在语音速率调整方面仍存在明显不足，难以实现真正的个性化体验。

2、传统的ai语音系统通常采用固定的语音速率设置，无法适应不同用户的语速偏好。虽然一些系统允许用户手动调整语音速率，但这种静态的调整方式要求用户不断尝试不同设置，过程繁琐且体验不佳。用户往往需要多次进入设置界面，反复调整语音速率，直到找到相对舒适的速度，这大大降低了交互的流畅性和用户满意度。

技术实现思路

1、为了克服现有技术的交互的流畅性不高的问题，本发明提出了一种ai平台的ai语音速率调整方法及系统，用于解决上述问题。

2、本发明提供如下技术方案：

3、一种ai平台的ai语音速率调整方法，包括：

4、获取ai平台中用户与ai对话的历史数据，所述历史数据包括用户行为数据和用户反馈数据，其中所述用户反馈数据分为优、良、中和差四个等级；

5、对用户行为数据进行特征提取，得到对应的行为特征；从所述历史数据中筛选出用户反馈为优和良的数据子集，并提取该数据子集对应的行为特征，形成标准特征组；

6、基于所述标准特征组，计算得到标准行为特征；

7、在ai与用户实时对话过程中，采集当前的用户行为数据，并对当前的用户行为数据进行特征提取，得到对应的行为特征记为实时行为特征；

8、计算所述实时行为特征与所述标准行为特征之间的特征偏差量；

9、获取当前ai语音的实时语音速率，并根据所述实时语音速率和所述特征偏差量，对所述ai语音速率进行动态调整。

10、优选的，所述用户行为数据包括用户说话速率、用户停顿频率及时长、打断ai频率和重复提问频率，其中，用户说话速率通过计算单位时间内用户输入的字符数或语音识别后的字数获取；用户停顿频率及时长通过检测用户语音输入过程中的无声段并统计其出现次数和持续时间获取；打断ai频率通过检测用户在ai语音输出未完成时发起的语音输入或操作行为的次数获取；重复提问频率，通过语义分析识别用户连续输入内容中表达相同或相似意图的次数获取。

11、优选的，所述对用户行为数据进行特征提取，得到对应的行为特征包括：

12、对用户说话速率数据进行时间窗口分段，计算每个窗口内的平均速率、速率变化标准差和速率变化趋势，得到用户语速特征；

13、对用户停顿数据进行统计分析，计算平均停顿时长、停顿频率和停顿分布模式，得到用户停顿特征；

14、对打断ai频率数据进行时序分析，计算单位时间内打断次数和打断时机分布，得到用户打断特征；

15、对重复提问频率数据进行模式识别，计算重复提问的时间间隔，得到用户重复特征；

16、将所述用户语速特征、用户停顿特征、用户打断特征和用户重复特征进行特征向量化处理，形成用户行为特征。

17、优选的，所述基于标准特征组计算得到标准行为特征的步骤包括：

18、对标准特征组中的各行为特征进行归一化处理，使各特征值分布在相同数值区间；

19、计算归一化后的各行为特征的均值，得到初步标准行为特征；

20、对所述初步标准行为特征进行加权处理，其中权重系数根据对应行为特征与用户满意度的相关性确定；

21、将加权处理后的特征向量作为标准行为特征。

22、优选的，所述权重系数的获取步骤包括：

23、从历史数据中提取包含所有用户反馈等级的数据样本；

24、将用户反馈等级按照优、良、中和差从大到小，转换为不同的数值分数；

25、计算每种行为特征与用户反馈分数的皮尔逊相关系数，得到各特征的相关性强度；

26、将皮尔逊相关系数标准化处理，转换为0到1之间的值；计算每种特征在不同反馈等级样本中的方差比率；

27、将标准化后的相关系数与方差比率进行加权平均，得到各特征的综合重要性得分；

28、对综合重要性得分进行归一化处理，使所有权重系数之和为1，得到最终的权重系数。

29、优选的，所述特征偏差量的获取步骤包括：

30、对实时行为特征进行归一化处理，使其与标准行为特征处于相同数值区间；

31、计算归一化后的实时行为特征与标准行为特征之间的欧氏距离，得到特征距离值；

32、基于特征距离值计算特征方向向量，表明实时行为特征相对于标准行为特征的偏离方向；

33、根据特征方向向量和特征距离值，将特征偏差量映射到-1到1之间的范围，其中正值表示用户行为特征快于标准行为特征，负值表示用户行为特征慢于标准行为特征，绝对值表示偏离程度。

34、优选的，所述根据实时语音速率和特征偏差量对ai语音速率进行动态调整的步骤包括：

35、获取预设的最大语音速率和最小语音速率；

36、使用公式计算当前语音速率在最大最小语音速率范围内的相对位置系数β，式中，vd为实时语音速率，vmax为最大语音速率，vmin为最小语音速率；

37、获取特征偏差量θ；

38、当θ为正值时，通过公式λ＝(1-β)×θ，获取速率调整系数λ；

39、当θ为负值时，通过公式λ＝β×θ，获取速率调整系数λ；

40、通过公式vt＝vd×(1+λ)计算调整后的语音速率vt；

41、将语音速率由vd平滑调整至vt。

42、本发明还提供一种ai平台的ai语音速率调整系统，用于实现一种ai平台的ai语音速率调整方法，包括：

43、历史数据获取模块，用于获取ai平台中用户与ai对话的历史数据，所述历史数据包括用户行为数据和用户反馈数据，其中所述用户反馈数据分为优、良、中和差四个等级；

44、特征处理模块，用于对用户行为数据进行特征提取，得到对应的行为特征；从所述历史数据中筛选出用户反馈为优和良的数据子集，并提取该数据子集对应的行为特征，形成标准特征组；

45、标准特征计算模块，用于基于所述标准特征组，计算得到标准行为特征；

46、实时特征采集模块，用于在ai与用户实时对话过程中，采集当前的用户行为数据，并对当前的用户行为数据进行特征提取，得到对应的行为特征记为实时行为特征；

47、特征偏差分析模块，用于计算所述实时行为特征与所述标准行为特征之间的特征偏差量；

48、语音速率调整模块，用于获取当前ai语音的实时语音速率，并根据所述实时语音速率和所述特征偏差量，对所述ai语音速率进行动态调整。

49、本发明提供了一种ai平台的ai语音速率调整方法及系统，具备以下有益效果：

50、首先，通过采集用户说话速率、停顿频率等多维行为数据，建立了全面的用户交互行为模型，避免了传统方法仅依赖单一参数的局限性，能够更准确地捕捉用户的交互习惯和偏好。其次，通过筛选用户反馈为优和良的数据形成标准特征组，本方案建立了以用户满意度为导向的标准行为特征模型，确保了语音速率调整的方向始终符合用户期望，解决了传统系统与用户需求脱节的问题。第三，本方案能够实时计算用户当前行为特征与标准特征之间的偏差量，准确判断用户行为是快于还是慢于标准特征，并据此自动调整ai语音速率，无需用户手动设置即可获得匹配其交互习惯的语音体验。最后，本方案采用平滑调整机制并设置合理的速率范围，确保语音速率变化的连续性和自然性，避免了突兀变化对用户体验的负面影响。

51、综上所述，本技术方案实现了ai语音速率与用户交互习惯的自动匹配，消除了用户需要反复手动调整的烦琐过程，显著提升了ai语音交互的自然性和用户满意度。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：崔楠楠,马腾祥,孟莹莹
技术所有人：京盟世纪（北京）科技有限公司
我是此专利的发明人

上一篇：基于机器视觉的缝纫机动刀智能分拣装置的制作方法
下一篇：一种金属铸造用压铸模具温度控制方法与流程

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！