本申请实施例涉及计算机,尤其涉及一种基于直播间用户行为网络的语言模型增强方法及系统。
背景技术:
1、目前,随着直播应用不断发展,其拥有的功能越来越多样,用户在端内参与互动的方式也逐渐增多。用户可以进入自己喜欢的直播间,对主播进行打赏,在直播间上麦、发送弹幕,与其他直播间成员进行互动等。想要对用户特征进行更好的理解,常见的方式是利用语言模型分析用户的语音和发表的文字。
2、但是,对于偏娱乐的直播场景,用户的文字表达随意,文字偏短,表达的信息碎片化,其中充斥着大量的噪音。常规的语言模型难以对这些文字进行精准分析,导致对用户和直播间内容理解不充分,语言分析效果偏差。
技术实现思路
1、本申请实施例提供一种基于直播间用户行为网络的语言模型增强方法及系统,能够提升语言模型分析精度,解决直播场景下用户语言分析误差偏大的技术问题。
2、在第一方面,本申请实施例提供了一种基于直播间用户行为网络的语言模型增强方法,包括:
3、基于直播间信息、用户标识信息、用户行为信息及用户文本信息构建用户行为网络;
4、基于用户行为网络进行实体嵌入表征训练,输出对应用户文本信息的文本向量;
5、根据文本向量构建对应用户文本信息的相似文本数据集,基于相似文本数据集进行语言模型增强训练。
6、在第二方面,本申请实施例提供了一种基于直播间用户行为网络的语言模型增强系统,包括:
7、网络构建模块,配置为基于直播间信息、用户标识信息、用户行为信息及用户文本信息构建用户行为网络;
8、实体嵌入模块,配置为基于用户行为网络进行实体嵌入表征训练,输出对应用户文本信息的文本向量;
9、模型增强模块,配置为根据文本向量构建对应用户文本信息的相似文本数据集,基于相似文本数据集进行语言模型增强训练。
10、在第三方面,本申请实施例提供了一种基于直播间用户行为网络的语言模型增强设备,包括:
11、存储器以及一个或多个处理器;
12、所述存储器,配置为存储一个或多个程序;
13、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的基于直播间用户行为网络的语言模型增强方法。
14、在第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在由计算机处理器执行时配置为执行如第一方面所述的基于直播间用户行为网络的语言模型增强方法。
15、在第五方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中包含有指令,当指令在计算机或处理器上运行时,使得计算机或处理器执行如第一方面所述的基于直播间用户行为网络的语言模型增强方法。
16、本申请实施例通过基于直播间信息、用户标识信息、用户行为信息及用户文本信息构建用户行为网络;基于用户行为网络进行实体嵌入表征训练,输出对应用户文本信息的文本向量;根据文本向量构建对应用户文本信息的相似文本数据集,基于相似文本数据集进行语言模型增强训练。采用上述技术手段,通过构建用户行为网络进行实体嵌入表征训练,以根据文本向量表征精准挖掘相似文本数据集,实现不同来源相似样本的扩充,以此进行语言模型训练,可以增强语言模型在不同上下文场景的内容理解能力,对用户行为和文字表达进行精准的语言分析,提升语言模型应用效果。
1.一种基于直播间用户行为网络的语言模型增强方法,其特征在于,包括:
2.根据权利要求1所述的基于直播间用户行为网络的语言模型增强方法,其特征在于,所述基于所述用户行为网络进行实体嵌入表征训练,包括:
3.根据权利要求2所述的基于直播间用户行为网络的语言模型增强方法,其特征在于,所述输出对应所述用户文本信息的文本向量,包括:
4.根据权利要求1所述的基于直播间用户行为网络的语言模型增强方法,其特征在于,所述根据所述文本向量构建对应所述用户文本信息的相似文本数据集,包括:
5.根据权利要求1所述的基于直播间用户行为网络的语言模型增强方法,其特征在于,所述基于所述相似文本数据集进行语言模型增强训练,包括:
6.根据权利要求5所述的基于直播间用户行为网络的语言模型增强方法,其特征在于,在基于所述相似文本数据集进行语言模型增强训练之后,还包括:
7.一种基于直播间用户行为网络的语言模型增强系统,其特征在于,包括:
8.一种基于直播间用户行为网络的语言模型增强设备,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在由计算机处理器执行时配置为执行如权利要求1-6任一所述的基于直播间用户行为网络的语言模型增强方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品中包含有指令,当所述指令在计算机或处理器上运行时,使得所述计算机或处理器执行如权利要求1-6任一所述的基于直播间用户行为网络的语言模型增强方法。