基于音频信息的文本归纳方法、装置、设备及介质与流程

文档序号：38406751发布日期：2024-06-21 20:52阅读：133来源：国知局

本申请涉及人工智能，尤其涉及一种基于音频信息的文本归纳方法、装置、设备及介质。

背景技术：

1、客户关系管理系统是指利用软件、硬件和网络技术，为企业建立一个客户信息收集、管理、分析和利用的信息系统。以客户数据的管理为核心，记录企业在市场营销和销售过程中和客户发生的各种交互行为，以及各类有关活动的状态，提供各类数据模型，为后期的分析和决策提供支持。

2、由于客户关系管理系统拥有大量的销售和客户之间的音频信息，所以如何能够准确获知这些音频信息中的重要信息是需要亟需解决的问题。而现有方式采用的方式是将这些音频信息直接转换为文本，然而由于音频信息中存在大量的背景噪声，导致无法准确的转换到文本，并且由于存在大量的音频信息，导致所转换地文本也是存在大量内容，导致无法准确获知音频信息中归纳的信息，使得增加了信息处理的时间成本。

技术实现思路

1、本申请实施例的目的在于提出一种基于音频信息的文本归纳方法、装置、设备及介质，以提高音频转换文本的准确性，并实现准确获知音频信息中归纳的信息，降低信息处理的时间成本。

2、为了解决上述技术问题，本申请实施例提供一种基于音频信息的文本归纳方法，包括：

3、获取待转换音频，并对所述待转换音频进行预分割处理，得到标签序列；

4、将所述标签序列基于预设边界进行切割，并将切割后的标签序列进行语音片段的合并，得到多个目标语音片段；

5、将所述目标语音片段转换为文本，并将转换后的文本与对应的目标语音片段进行对齐，得到存在时间间隔片段的标记文本；

6、对所述标记文本中的敏感信息进行加密，得到加密后的标签文件；

7、调用大语音模型基于预设的提示词对所述加密后的标记文本进行识别和归纳处理，得到目标归纳文本。

8、为了解决上述技术问题，本申请实施例提供一种基于音频信息的文本归纳装置，包括：

9、音频预分割单元，用于获取待转换音频，并对所述待转换音频进行预分割处理，得到标签序列；

10、标签序列切割单元，用于将所述标签序列基于预设边界进行切割，并将切割后的标签序列进行语音片段的合并，得到多个目标语音片段；

11、语音片段转换单元，用于将所述目标语音片段转换为文本，并将转换后的文本与对应的目标语音片段进行对齐，得到存在时间间隔片段的标记文本；

12、敏感信息加密单元，用于对所述标记文本中的敏感信息进行加密，得到加密后的标签文件；

13、标记文本归纳单元，用于调用大语音模型基于预设的提示词对所述加密后的标记文本进行识别和归纳处理，得到目标归纳文本。

14、为解决上述技术问题，本发明采用的一个技术方案是：提供一种计算机设备，包括，一个或多个处理器；存储器，用于存储一个或多个程序，使得一个或多个处理器实现上述任意一项所述的基于音频信息的文本归纳方法。

15、为解决上述技术问题，本发明采用的一个技术方案是：一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意一项所述的基于音频信息的文本归纳方法。

16、本发明实施例提供了一种基于音频信息的文本归纳方法、装置、设备及介质。其中，方法包括：获取待转换音频，并对所述待转换音频进行预分割处理，得到标签序列；将所述标签序列基于预设边界进行切割，并将切割后的标签序列进行语音片段的合并，得到多个目标语音片段；将所述目标语音片段转换为文本，并将转换后的文本与对应的目标语音片段进行对齐，得到存在时间间隔片段的标记文本；对所述标记文本中的敏感信息进行加密，得到加密后的标签文件；调用大语音模型基于预设的提示词对所述加密后的标记文本进行识别和归纳处理，得到目标归纳文本。本发明实施例对待转换音频进行预分割，有利于提高音频转换文本的准确性，同时本申请实施例将转换的文本与对应的语音片段进行对齐，并基于提示词对文本进行识别和归纳，有利于准确获知音频信息中归纳的信息，从而有利于降低信息处理的时间成本。

技术特征：

1.一种基于音频信息的文本归纳方法，其特征在于，包括：

2.根据权利要求1所述的基于音频信息的文本归纳方法，其特征在于，所将所述标签序列基于预设边界进行切割，并将切割后的标签序列进行语音片段的合并，得到多个目标语音片段，包括：

3.根据权利要求1所述的基于音频信息的文本归纳方法，其特征在于，所述获取待转换音频，并对所述待转换音频进行预分割处理，得到标签序列，包括：

4.根据权利要求3所述的基于音频信息的文本归纳方法，其特征在于，所述对所述初始语音序列进行端点检测和静音识别，得到所述标签序列，包括：

5.根据权利要求1所述的基于音频信息的文本归纳方法，其特征在于，所述将所述目标语音片段转换为文本，并将转换后的文本与对应的目标语音片段进行对齐，得到存在时间间隔片段的标记文本，包括：

6.根据权利要求1所述的基于音频信息的文本归纳方法，其特征在于，所述对所述标记文本中的敏感信息进行加密，得到加密后的标签文件，包括：

7.根据权利要求1至6任一项所述的基于音频信息的文本归纳方法，其特征在于，所述获取待转换音频，并对所述待转换音频进行预分割处理，得到标签序列之前，所述方法还包括：

8.一种基于音频信息的文本归纳装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于音频信息的文本归纳方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于音频信息的文本归纳方法。

技术总结
本申请涉及一种基于音频信息的文本归纳方法、装置、设备及介质，其中方法包括：获取待转换音频，并对待转换音频进行预分割处理，得到标签序列；将标签序列基于预设边界进行切割，并将切割后的标签序列进行语音片段的合并，得到多个目标语音片段；将目标语音片段转换为文本，并将转换后的文本与对应的目标语音片段进行对齐，得到存在时间间隔片段的标记文本；对标记文本中的敏感信息进行加密，得到加密后的标签文件；调用大语音模型基于预设的提示词对加密后的标记文本进行识别和归纳处理，得到目标归纳文本。本申请提高了音频转换文本的准确性，实现准确获知音频信息中归纳的信息，降低了信息处理的时间成本。

技术研发人员：宋坤远,郑志杰
受保护的技术使用者：深圳市和讯华谷信息技术有限公司
技术研发日：
技术公布日：2024/6/20

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋坤远,郑志杰
技术所有人：深圳市和讯华谷信息技术有限公司
我是此专利的发明人

上一篇：一种连接可靠便捷的电池模组安装结构的制作方法
下一篇：一种测绘用测绘仪定位装置的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！