一种基于AI的影音角色识别方法及系统与流程

文档序号：33947602发布日期：2023-04-26 09:02阅读：40来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明属于影音角色识别，尤其涉及一种基于ai的影音角色识别方法及系统。

背景技术：

1、在影音制作行业中，谈话人与被谈话人的声音虽然能够被有效分辨，但是系统无法分别谈话人和被谈话人是谁，容易造成人员辨别混乱，角色辨别出错容易对谈话内容造成干扰，也影响ai影音角色的制作。

技术实现思路

1、本发明的目的在于：为了解决系统无法分别谈话人和被谈话人是谁，容易造成人员辨别混乱，角色辨别出错容易对谈话内容造成干扰，也影响ai影音角色的制作的问题，而提出的一种基于ai的影音角色识别方法及系统。

2、为了实现上述目的，本发明采用了如下技术方案：

3、一种基于ai的影音角色识别方法及系统，包括角色验证模块、语音解析模块和对比识别模块，所述对比识别模块包括在语音解析模块内，语音解析模块与角色验证模块双向电性连接；

4、语音解析模块包括语音采集模块、语音传输模块、文本转换模块、检索模块和神经网络角色库，语音采集模块的输出端与语音传输模块的输入端电性连接，语音传输模块的输出端与文本转换模块的输入端电性连接，文本转换模块的输出端与检索模块的输入端电性连接，检索模块的输入端与神经网络角色库的输出端电性连接。

5、作为上述技术方案的进一步描述：

6、所述语音解析模块还包括角色特征对比筛选模块、角色识别模块和音质分析模块，检索模块的输出端与角色特征对比筛选模块的输入端电性连接，角色特征对比筛选模块的的输出端与对比识别模块的输入端电性连接，对比识别模块的输出端与角色识别模块的输入端电性连接。

7、作为上述技术方案的进一步描述：

8、所述音质分析模块包括音调检测模块和音色检测模块。

9、作为上述技术方案的进一步描述：

10、所述对比识别模块包括符合角色信息调取模块、角色语音调取模块、角色语音音质解析模块、对比模块、相似概率测算模块和存储模块。

11、作为上述技术方案的进一步描述：

12、所述符合角色信息调取模块的输出端与角色语音调取模块的输入端电性连接，角色语音调取模块的输出端与角色语音音质解析模块的输入端电性连接。

13、作为上述技术方案的进一步描述：

14、所述角色语音音质解析模块的输出端与对比模块的输入端电性连接，对比模块的输出端与相似概率测算模块的输入端电性连接，相似概率测算模块的输出端与存储模块的输入端电性连接。

15、作为上述技术方案的进一步描述：

16、所述角色验证模块包括语音混乱组合模块、文本音质信息收集模块、信息传输模块、检索结果调取模块、角色二次筛选模块、两次筛选角色信息确定模块、文本音质信息导入模块、相似概率对比模块和角色确定模块。

17、作为上述技术方案的进一步描述：

18、所述语音混乱组合模块的输出端与文本音质信息收集模块的输入端电性连接，文本音质信息收集模块的输出端与信息传输模块的输入端电性连接，信息传输模块的输出端与检索结果调取模块的输入端电性连接。

19、作为上述技术方案的进一步描述：

20、所述检索结果调取模块的输出端与角色二次筛选模块的输入端电性连接，角色二次筛选模块的输出端与两次筛选角色信息确定模块的输入端电性连接，两次筛选角色信息确定模块的输出端与文本音质信息导入模块的输入端电性连接，文本音质信息导入模块的输出端与相似概率对比模块的输入端电性连接，相似概率对比模块的输出端与角色确定模块的输入端电性连接。

21、综上所述，由于采用了上述技术方案，本发明的有益效果是：

22、1、本发明中，通过设置语音解析模块，其中语音采集模块能够谈话人与被谈话人的语音信息，并通过语音传输模块传输给文本转换模块，文本转换模块将语音转换为文本信息后，将文本信息传输给检索模块，检索模块调取神经网络角色库里的信息，匹配相对应的文本信息，并将对应文本信息的角色信息导出，导出的角色信息可能为多个，而音质分析模块能够从语音传输模块获取音质信息，同时音调检测模块和音色检测模块能够分别对音质和音调进行检测，与神经网络角色库内的调取角色的音调和音色做匹配，最后经过角色特征比对筛选模块筛选出几个合适的角色，最后将角色信息传递给对比识别模块，经过对比识别模块对比后由角色识别模块确定角色人员，有效提高了谈话人与被谈话人角色识别的正确率。

23、2、本发明中，通过设置对比识别模块，其中符合角色信息调取模块调取符合角色的信息，随后角色语音调取模块调取对应角色的历史语音信息，角色语音音质解析模块解析角色语音的音质信息和音色信息，并与获取的谈话人与被谈话人的语音信息做对比，最后相似概率测算模块测算谈话人与被谈话人的语音信息与哪位角色的语音信息匹配度最高，随后将角色的信息存储至存储模块内。

24、3、本发明中，通过设置角色验证模块，其中语音混乱组合模块调取语音采集模块采集的信息，并将采集的语音信息混合后重新组合，而文本音质信息收集模块采集重新组合后的信息后通过信息传输模块传输至检索结果调取模块内，检索结果调取模块从神经网络角色库内调取对应的角色信息，并将信息导入至角色二次筛选模块内，角色二次筛选模块能够将根据两者信息进行二次筛选，并将一次筛选和二次筛选的角色全部导入至两次筛选角色信息确定模块内，随后文本音质信息导入模块能够将角色混乱后的声音导入，最后经过相似概率对比模块进行对比后，两次筛选后确定同一角色后，最后角色确定模块确定筛选的角色。

技术特征：

1.一种基于ai的影音角色识别方法及系统，包括角色验证模块、语音解析模块和对比识别模块，其特征在于，所述对比识别模块包括在语音解析模块内，语音解析模块与角色验证模块双向电性连接；

2.根据权利要求1所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述语音解析模块还包括角色特征对比筛选模块、角色识别模块和音质分析模块，检索模块的输出端与角色特征对比筛选模块的输入端电性连接，角色特征对比筛选模块的的输出端与对比识别模块的输入端电性连接，对比识别模块的输出端与角色识别模块的输入端电性连接。

3.根据权利要求2所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述音质分析模块包括音调检测模块和音色检测模块。

4.根据权利要求1所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述对比识别模块包括符合角色信息调取模块、角色语音调取模块、角色语音音质解析模块、对比模块、相似概率测算模块和存储模块。

5.根据权利要求4所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述符合角色信息调取模块的输出端与角色语音调取模块的输入端电性连接，角色语音调取模块的输出端与角色语音音质解析模块的输入端电性连接。

6.根据权利要求5所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述角色语音音质解析模块的输出端与对比模块的输入端电性连接，对比模块的输出端与相似概率测算模块的输入端电性连接，相似概率测算模块的输出端与存储模块的输入端电性连接。

7.根据权利要求1所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述角色验证模块包括语音混乱组合模块、文本音质信息收集模块、信息传输模块、检索结果调取模块、角色二次筛选模块、两次筛选角色信息确定模块、文本音质信息导入模块、相似概率对比模块和角色确定模块。

8.根据权利要求7所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述语音混乱组合模块的输出端与文本音质信息收集模块的输入端电性连接，文本音质信息收集模块的输出端与信息传输模块的输入端电性连接，信息传输模块的输出端与检索结果调取模块的输入端电性连接。

9.根据权利要求8所述的一种基于ai的影音角色识别方法及系统，其特征在于，所述检索结果调取模块的输出端与角色二次筛选模块的输入端电性连接，角色二次筛选模块的输出端与两次筛选角色信息确定模块的输入端电性连接，两次筛选角色信息确定模块的输出端与文本音质信息导入模块的输入端电性连接，文本音质信息导入模块的输出端与相似概率对比模块的输入端电性连接，相似概率对比模块的输出端与角色确定模块的输入端电性连接。

技术总结
本发明公开了一种基于AI的影音角色识别方法及系统，属于影音角色识别技术领域，包括角色验证模块、语音解析模块和对比识别模块，所述对比识别模块包括在语音解析模块内，语音解析模块与角色验证模块双向电性连接，语音解析模块包括语音采集模块、语音传输模块、文本转换模块、检索模块和神经网络角色库。本发明中，通过设置语音解析模块，其中语音采集模块能够谈话人与被谈话人的语音信息，并通过语音传输模块传输给文本转换模块，文本转换模块将语音转换为文本信息后，检索模块调取神经网络角色库里的信息，最后将角色信息传递给对比识别模块，经过对比识别模块对比后由角色识别模块确定角色人员，有效提高了谈话人与被谈话人角色识别的正确率。

技术研发人员：邓宇翔,李韩,刘宁,庞文刚,刘艾军
受保护的技术使用者：联通沃音乐文化有限公司
技术研发日：
技术公布日：2024/1/11

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邓宇翔李韩刘宁庞文刚刘艾军
技术所有人：联通在线信息科技有限公司
我是此专利的发明人

上一篇：一种建立SLB连接的方法、电子设备和通信系统与流程
上一篇：一种吸入器自动装配设备的制作方法