面向远程会议场景的语音分离与段落归属方法及系统与流程

文档序号：43411147发布日期：2025-10-17 19:00阅读：29来源：国知局

本发明涉及语音识别，具体涉及面向远程会议场景的语音分离与段落归属方法及系统。

背景技术：

1、在现代远程办公与协作日益普及的背景下，远程会议已成为团队沟通、项目汇报与业务协商的重要形式。然而，在多方同时参与的会议场景中，由于发言存在交叉、重叠与频繁切换，传统的语音识别与转录系统往往难以准确区分发言人身份与对应的语义结构，特别是在争议讨论、观点碰撞等复杂语境下，语音内容的归属与逻辑划分更显混乱。这不仅影响了会议记录的完整性与可读性，也大幅增加了后期人工整理与归档的负担。

技术实现思路

1、本申请提供了面向远程会议场景的语音分离与段落归属方法及系统，解决了现有技术中多方会议中语音交织难以有效区分发言人及其发言内容逻辑结构，导致会议记录归属不清晰、编辑效率低下的技术问题。

2、本申请的第一个方面，提供了面向远程会议场景的语音分离与段落归属方法，所述方法包括：

3、随多方用户端入会，会议平台触发目标会议窗口的语音记录，生成会议音频；执行语音处理引擎的匹配与目标会议窗口的临时接入，根据临时接入的第一引擎，对所述会议音频执行双程语音分离处理，构建语音逻辑图谱，其中，双程语音分离处理包含基于主张-论据关系的第一逻辑图谱构建，与基于主线-争议点的第二逻辑图谱构建；根据临时接入的第二引擎，匹配目标会议模板，并根据所述语音逻辑图谱执行基于自动化会议记录排版的语音片段归属，生成目标会议记录；对所述目标会议记录进行平台数据库存储，以权限设置进行调取管理。

4、本申请的第二个方面，提供了面向远程会议场景的语音分离与段落归属系统，所述系统包括：

5、音频生成模块：随多方用户端入会，会议平台触发目标会议窗口的语音记录，生成会议音频；语音处理模块：执行语音处理引擎的匹配与目标会议窗口的临时接入，根据临时接入的第一引擎，对所述会议音频执行双程语音分离处理，构建语音逻辑图谱，其中，双程语音分离处理包含基于主张-论据关系的第一逻辑图谱构建，与基于主线-争议点的第二逻辑图谱构建；记录生成模块：根据临时接入的第二引擎，匹配目标会议模板，并根据所述语音逻辑图谱执行基于自动化会议记录排版的语音片段归属，生成目标会议记录；管理模块：对所述目标会议记录进行平台数据库存储，以权限设置进行调取管理。

6、本申请中提供的一个或多个技术方案，至少具有如下技术效果或优点：

7、随多方用户端入会，会议平台触发目标会议窗口的语音记录，生成会议音频。接着，执行语音处理引擎的匹配与目标会议窗口的临时接入，根据临时接入的第一引擎，对会议音频执行双程语音分离处理，构建语音逻辑图谱，其中，双程语音分离处理包含基于主张-论据关系的第一逻辑图谱构建，与基于主线-争议点的第二逻辑图谱构建。然后，根据临时接入的第二引擎，匹配目标会议模板，并根据语音逻辑图谱执行基于自动化会议记录排版的语音片段归属，生成目标会议记录。最后，对目标会议记录进行平台数据库存储，以权限设置进行调取管理。解决了现有技术中多方会议中语音交织难以有效区分发言人及其发言内容逻辑结构，导致会议记录归属不清晰、编辑效率低下的技术问题，实现了远程会议语音内容的双程语义逻辑分离与结构化归属，提高会议记录准确性与自动排版效率的技术效果。

技术特征：

1.面向远程会议场景的语音分离与段落归属方法，其特征在于，所述方法包括：

2.如权利要求1所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，执行语音处理引擎的匹配之前，语音处理引擎阵列的构建，包括：

3.如权利要求2所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，执行语音处理引擎的匹配，包括：

4.如权利要求2所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，对所述会议音频执行双程语音分离处理之前，包括：

5.如权利要求4所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，对所述会议音频执行双程语音分离处理，包括：

6.如权利要求4所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，匹配目标会议模板，包括：

7.如权利要求6所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，根据所述语音逻辑图谱执行基于自动化会议记录排版的语音片段归属，包括：

8.如权利要求1所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，对所述目标会议记录进行平台数据库存储，以权限设置进行调取管理，包括：

9.如权利要求2所述的面向远程会议场景的语音分离与段落归属方法，其特征在于，若为多并发会议，对所述语音处理引擎阵列进行平台算力的动态均衡分配。

10.面向远程会议场景的语音分离与段落归属系统，其特征在于，用于实施权利要求1-9任意一项所述的面向远程会议场景的语音分离与段落归属方法，所述系统包括：

技术总结
本发明公开了面向远程会议场景的语音分离与段落归属方法及系统，涉及语音识别技术领域。所述方法包括：会议平台触发目标会议窗口的语音记录，生成会议音频；根据第一引擎，对会议音频执行双程语音分离处理，构建语音逻辑图谱；根据第二引擎，匹配目标会议模板，并根据语音逻辑图谱执行基于自动化会议记录排版的语音片段归属，生成目标会议记录；对目标会议记录进行平台数据库存储，以权限设置进行调取管理。解决了现有技术中多方会议中语音交织难以有效区分发言人及其发言内容逻辑结构，导致会议记录归属不清晰、编辑效率低下的技术问题，实现了远程会议语音内容的双程语义逻辑分离与结构化归属，提高会议记录准确性与自动排版效率的技术效果。

技术研发人员：张国强,宋晓磊
受保护的技术使用者：北京联讯星烨科技有限公司
技术研发日：
技术公布日：2025/10/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张国强,宋晓磊
技术所有人：北京联讯星烨科技有限公司
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！