一种基于直播间用户行为网络的语言模型增强方法及系统与流程

文档序号：37339387发布日期：2024-03-18 18:07阅读：11来源：国知局

本申请实施例涉及计算机，尤其涉及一种基于直播间用户行为网络的语言模型增强方法及系统。

背景技术：

1、目前，随着直播应用不断发展，其拥有的功能越来越多样，用户在端内参与互动的方式也逐渐增多。用户可以进入自己喜欢的直播间，对主播进行打赏，在直播间上麦、发送弹幕，与其他直播间成员进行互动等。想要对用户特征进行更好的理解，常见的方式是利用语言模型分析用户的语音和发表的文字。

2、但是，对于偏娱乐的直播场景，用户的文字表达随意，文字偏短，表达的信息碎片化，其中充斥着大量的噪音。常规的语言模型难以对这些文字进行精准分析，导致对用户和直播间内容理解不充分，语言分析效果偏差。

技术实现思路

1、本申请实施例提供一种基于直播间用户行为网络的语言模型增强方法及系统，能够提升语言模型分析精度，解决直播场景下用户语言分析误差偏大的技术问题。

2、在第一方面，本申请实施例提供了一种基于直播间用户行为网络的语言模型增强方法，包括：

3、基于直播间信息、用户标识信息、用户行为信息及用户文本信息构建用户行为网络；

4、基于用户行为网络进行实体嵌入表征训练，输出对应用户文本信息的文本向量；

5、根据文本向量构建对应用户文本信息的相似文本数据集，基于相似文本数据集进行语言模型增强训练。

6、在第二方面，本申请实施例提供了一种基于直播间用户行为网络的语言模型增强系统，包括：

7、网络构建模块，配置为基于直播间信息、用户标识信息、用户行为信息及用户文本信息构建用户行为网络；

8、实体嵌入模块，配置为基于用户行为网络进行实体嵌入表征训练，输出对应用户文本信息的文本向量；

9、模型增强模块，配置为根据文本向量构建对应用户文本信息的相似文本数据集，基于相似文本数据集进行语言模型增强训练。

10、在第三方面，本申请实施例提供了一种基于直播间用户行为网络的语言模型增强设备，包括：

11、存储器以及一个或多个处理器；

12、所述存储器，配置为存储一个或多个程序；

13、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面所述的基于直播间用户行为网络的语言模型增强方法。

14、在第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令在由计算机处理器执行时配置为执行如第一方面所述的基于直播间用户行为网络的语言模型增强方法。

15、在第五方面，本申请实施例提供了一种计算机程序产品，所述计算机程序产品中包含有指令，当指令在计算机或处理器上运行时，使得计算机或处理器执行如第一方面所述的基于直播间用户行为网络的语言模型增强方法。

16、本申请实施例通过基于直播间信息、用户标识信息、用户行为信息及用户文本信息构建用户行为网络；基于用户行为网络进行实体嵌入表征训练，输出对应用户文本信息的文本向量；根据文本向量构建对应用户文本信息的相似文本数据集，基于相似文本数据集进行语言模型增强训练。采用上述技术手段，通过构建用户行为网络进行实体嵌入表征训练，以根据文本向量表征精准挖掘相似文本数据集，实现不同来源相似样本的扩充，以此进行语言模型训练，可以增强语言模型在不同上下文场景的内容理解能力，对用户行为和文字表达进行精准的语言分析，提升语言模型应用效果。

技术特征：

1.一种基于直播间用户行为网络的语言模型增强方法，其特征在于，包括：

2.根据权利要求1所述的基于直播间用户行为网络的语言模型增强方法，其特征在于，所述基于所述用户行为网络进行实体嵌入表征训练，包括：

3.根据权利要求2所述的基于直播间用户行为网络的语言模型增强方法，其特征在于，所述输出对应所述用户文本信息的文本向量，包括：

4.根据权利要求1所述的基于直播间用户行为网络的语言模型增强方法，其特征在于，所述根据所述文本向量构建对应所述用户文本信息的相似文本数据集，包括：

5.根据权利要求1所述的基于直播间用户行为网络的语言模型增强方法，其特征在于，所述基于所述相似文本数据集进行语言模型增强训练，包括：

6.根据权利要求5所述的基于直播间用户行为网络的语言模型增强方法，其特征在于，在基于所述相似文本数据集进行语言模型增强训练之后，还包括：

7.一种基于直播间用户行为网络的语言模型增强系统，其特征在于，包括：

8.一种基于直播间用户行为网络的语言模型增强设备，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令在由计算机处理器执行时配置为执行如权利要求1-6任一所述的基于直播间用户行为网络的语言模型增强方法。

10.一种计算机程序产品，其特征在于，所述计算机程序产品中包含有指令，当所述指令在计算机或处理器上运行时，使得所述计算机或处理器执行如权利要求1-6任一所述的基于直播间用户行为网络的语言模型增强方法。

技术总结
本申请实施例公开了一种基于直播间用户行为网络的语言模型增强方法及系统。本申请实施例提供的技术方案，通过基于直播间信息、用户标识信息、用户行为信息及用户文本信息构建用户行为网络；基于用户行为网络进行实体嵌入表征训练，输出对应用户文本信息的文本向量；根据文本向量构建对应用户文本信息的相似文本数据集，基于相似文本数据集进行语言模型增强训练。采用上述技术手段，通过构建用户行为网络进行实体嵌入表征训练，以根据文本向量表征精准挖掘相似文本数据集，实现不同来源相似样本的扩充，以此进行语言模型训练，可以增强语言模型在不同上下文场景的内容理解能力，对用户行为和文字表达进行精准的语言分析，提升语言模型应用效果。

技术研发人员：刘海东
受保护的技术使用者：广州安思创信息技术有限公司
技术研发日：
技术公布日：2024/3/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘海东
技术所有人：广州安思创信息技术有限公司
我是此专利的发明人

上一篇：具有扭转式卡扣的线缆或线束支架的制作方法
上一篇：一种储能系统功率调节方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。