基于大数据平台的在线会话处理方法、系统及程序产品与流程

文档序号:34664324发布日期:2023-07-05 12:43阅读:29来源:国知局
基于大数据平台的在线会话处理方法、系统及程序产品与流程

本技术涉及大数据,具体而言,涉及一种基于大数据平台的在线会话处理方法、系统及程序产品。


背景技术:

1、随着大数据平台技术和ai技术的迭代发展,会话文本情感分析技术已被广泛应用在会话文本情感分析任务中,以对大量的会话文本信息进行意见挖掘、倾向性分析等操作。

2、然而,在相关技术中,会话文本情感分析方案一般是通过神经网络模型进行全局语义信息提取并进行情感标签分类实现,但是发明人经过仔细研究发现,该方案可能会忽略局部会话文本段的细节特征,导致一部分具备情感分析意义的语义向量丢失,从而难以保证会话文本情感分析精确度,也进一步影响后续页面会话过程中的智能化程度。


技术实现思路

1、为了至少克服现有技术中的上述不足,本技术的目的在于提供一种基于大数据平台的在线会话处理方法、系统及程序产品。

2、第一方面,本技术提供一种基于大数据平台的在线会话处理方法,应用于大数据在线平台系统,所述方法包括:

3、搜集用于会话文本情感分析学习的目标待学习在线会话文本序列;所述目标待学习在线会话文本序列包括基础待学习在线会话文本序列以及所述基础待学习在线会话文本序列对应的扩展待学习在线会话文本序列,所述扩展待学习在线会话文本序列是对所述基础待学习在线会话文本序列进行文本词编码向量扩展更新生成的;

4、基于所述目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络;所述会话文本情感分析网络包括特征选择单元、目标注意力感知单元以及文本情感标签分类单元;

5、分析所述更新后的会话文本情感分析网络是否满足学习终止条件,在满足学习终止条件时,将所述更新后的会话文本情感分析网络确定为目标会话文本情感分析网络;所述目标会话文本情感分析网络用于对目标用户在大数据在线平台中的在线会话文本进行会话文本情感分析,生成对应的会话文本情感分析结果;

6、基于所述会话文本情感分析结果向所述目标用户所对应的在线会话页面推送对应的页面会话反馈数据。

7、在第一方面的一种可能的实施方式中,所述基于所述目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络,包括:

8、基于网络权重参数初始化的会话文本情感分析网络的特征选择单元以及所述特征选择单元的第一特征选择函数信息,对所述目标待学习在线会话文本序列中的每个目标待学习在线会话文本进行特征选择,获得每个所述目标待学习在线会话文本对应的文本结构选择特征;所述特征选择单元的第一特征选择函数信息包括局部感知野参数和/或权值共享参数,其中,所述局部感知野参数被配置于感知所述目标待学习在线会话文本中的局部文本结构特征向量,所述权值共享参数被配置于感知所述目标待学习在线会话文本中的局部共享特征向量;

9、基于所述会话文本情感分析网络的目标注意力感知单元,对每个所述目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各所述目标待学习在线会话文本对应的目标显著会话文本段;

10、基于所述会话文本情感分析网络的文本情感标签分类单元,对每个所述目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度。

11、在第一方面的一种可能的实施方式中,所述目标注意力感知单元包括多个整体注意力感知单元;

12、其中,所述基于所述会话文本情感分析网络的目标注意力感知单元,对每个所述目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各所述目标待学习在线会话文本对应的目标显著会话文本段,包括:

13、针对每个所述整体注意力感知单元,基于各所述目标待学习在线会话文本对应的文本结构选择特征,确定所述整体注意力感知单元对应的各候选会话文本特征,并基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段;

14、确定各所述目标待学习在线会话文本对应的当前注意力感知次数,并分析所述当前注意力感知次数是否不小于门限次数;

15、当所述当前注意力感知次数小于门限次数时,将所述当前注意力感知次数增加1次,以及将各所述候选会话文本特征对应的标的显著会话文本段确定为下一个整体注意力感知单元所对应的各候选会话文本特征,并执行所述基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段,以及确定各所述目标待学习在线会话文本对应的当前注意力感知次数,并分析所述当前注意力感知次数是否不小于门限次数的操作;所述整体注意力感知单元为所述下一个整体注意力感知单元;

16、当所述当前注意力感知次数不小于门限次数时,将各所述候选会话文本特征对应的标的显著会话文本段确定为各所述目标待学习在线会话文本对应的目标显著会话文本段。

17、在第一方面的一种可能的实施方式中,每个所述整体注意力感知单元均包括对应的整体注意力语义编码子单元以及对应的整体注意力语义融合子单元;

18、其中,所述基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段,包括:

19、基于所述整体注意力感知单元对应的整体注意力语义编码子单元以及网络权重参数初始化的所述整体注意力语义编码子单元的第二特征选择函数信息,对每个所述候选会话文本特征进行注意力语义特征编码,获得每个所述候选会话文本特征对应的中间显著会话文本段;所述整体注意力语义编码子单元的第二特征选择函数信息包括注意力局部感知野参数和/或注意力权值共享参数;

20、基于所述整体注意力感知单元对应的整体注意力语义融合子单元,对每个所述候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个所述候选会话文本特征对应的语义融合显著文本段;

21、对每个所述候选会话文本特征对应的中间显著会话文本段以及对应的语义融合显著文本段进行汇聚,获得各所述候选会话文本特征对应的标的显著会话文本段。

22、在第一方面的一种可能的实施方式中,所述基于所述整体注意力感知单元对应的整体注意力语义融合子单元,对每个所述候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个所述候选会话文本特征对应的语义融合显著文本段,包括:

23、将各所述候选会话文本特征加载到所述整体注意力感知单元对应的整体注意力语义融合子单元,以使所述整体注意力语义融合子单元的每一语义融合层进行下述步骤:

24、针对每个所述候选会话文本特征,对所述候选会话文本特征进行文本保留迁移,获得所述候选会话文本特征对应的多个迁移会话文本特征,并对每个所述迁移会话文本特征中的各文本语句关键词执行进行关键词位置置乱,获得每个所述迁移会话文本特征对应的各置乱后文本语句关键词;所述候选会话文本特征以及每个所述迁移会话文本特征均包括对应的多个文本语句关键词,且每个所述迁移会话文本特征中的各所述文本语句关键词均与所述候选会话文本特征中的各所述文本语句关键词相匹配;

25、针对每个所述候选会话文本特征的各所述迁移会话文本特征,提取所述迁移会话文本特征对应的每个所述置乱后文本语句关键词的前后文语义向量信息,并基于每个所述置乱后文本语句关键词的前后文语义向量信息,对各所述置乱后文本语句关键词进行关键词置乱还原,获得所述迁移会话文本特征对应的各还原文本语句关键词;每个所述置乱后文本语句关键词的前后文语义向量信息包括该置乱后文本语句关键词与在所述迁移会话文本特征中的任一其它置乱后文本语句关键词之间的前后文语义关系信息;

26、针对每个所述候选会话文本特征,基于预置的所述候选会话文本特征中的每个所述文本语句关键词的第一词向量信息、其对应的每个所述迁移会话文本特征中的每个所述还原文本语句关键词的第二词向量信息、所述候选会话文本特征的第一词语义影响系数以及其对应的每个所述迁移会话文本特征的第二词语义影响系数,对所述候选会话文本特征中的每个所述文本语句关键词进行融合,获得所述候选会话文本特征的各语义融合文本语句关键词;

27、针对每个所述候选会话文本特征,基于所述候选会话文本特征中的每个所述语义融合文本语句关键词对应的前后文语义向量信息,对每个所述语义融合文本语句关键词进行注意力语义融合,获得所述候选会话文本特征的各目标融合文本语句关键词,并基于所述候选会话文本特征的各所述目标融合文本语句关键词,确定所述候选会话文本特征对应的候选语义融合显著文本段;

28、在得到各所述候选会话文本特征对应的候选语义融合显著文本段之后,判断是否存在下一个语义融合层;

29、当存在下一个语义融合层时,将各所述候选会话文本特征对应的候选语义融合显著文本段确定为所述下一个语义融合层对应的各候选会话文本特征以及将对应的各候选会话文本特征加载到所述下一个语义融合层,并执行所述针对每个所述候选会话文本特征,对所述候选会话文本特征进行文本保留迁移,获得所述候选会话文本特征对应的多个迁移会话文本特征的操作;

30、当不存在下一个语义融合层时,将各所述候选会话文本特征对应的候选语义融合显著文本段确定为各所述候选会话文本特征对应的语义融合显著文本段。

31、在第一方面的一种可能的实施方式中,所述基于所述会话文本情感分析网络的文本情感标签分类单元,对每个所述目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度,包括:

32、针对每个所述目标待学习在线会话文本对应的目标显著会话文本段,基于所述会话文本情感分析网络的文本情感标签分类单元,对所述目标显著会话文本段中的每个会话文本语句单元进行文本情感标签置信度映射,获得所述目标显著会话文本段的各所述会话文本语句单元的情感标签映射置信度,并基于所述目标显著会话文本段的各所述会话文本语句单元的情感标签映射置信度,确定所述目标显著会话文本段的目标情感标签映射置信度;

33、对得到的每个所述目标待学习在线会话文本对应的目标显著会话文本段的目标情感标签映射置信度执行规则化输出,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度。

34、在第一方面的一种可能的实施方式中,所述目标待学习在线会话文本中的各所述目标待学习在线会话文本包括所述基础待学习在线会话文本序列中的各基础待学习在线会话文本以及所述扩展待学习在线会话文本序列中的各扩展待学习在线会话文本;

35、其中,所述分析所述更新后的会话文本情感分析网络是否满足学习终止条件,包括:

36、基于每个所述基础待学习在线会话文本的目标文本情感分类置信度、每个所述扩展待学习在线会话文本的目标文本情感分类置信度、每个所述基础待学习在线会话文本的第一先验文本情感标注信息以及每个所述扩展待学习在线会话文本的第二先验文本情感标注信息,计算所述更新后的会话文本情感分析网络的目标loss值,并分析所述目标loss值是否不大于设定loss值;

37、当所述目标loss值不大于设定loss值时,确定所述更新后的会话文本情感分析网络满足学习终止条件。

38、第二方面,本技术实施例还提供一种大数据在线平台系统,所述大数据在线平台系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序结合该处理器加载并执行以实现以上第一方面的基于大数据平台的在线会话处理方法。

39、第三方面,本技术实施例提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于被处理器执行时,以实现以上第一方面的基于大数据平台的在线会话处理方法。

40、第四方面,本技术实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,以实现以上第一方面的基于大数据平台的在线会话处理方法。

41、本技术实施例至少具有以下有益效果:

42、本技术实施例能够基于目标待学习在线会话文本序列对会话文本情感分析网络进行网络权重参数更新,在更新后的会话文本情感分析网络满足学习终止条件时,将更新后的会话文本情感分析网络确定为目标会话文本情感分析网络,由此可以依据目标会话文本情感分析网络的特征选择和注意力感知部分来提取候选会话文本特征的整体和局部文本语义信息,比较于相关技术中仅全局语义信息提取可以解析出更具备有区分性的语义信息,这样即使会话文本段在语义向量编码流程中存在细节信息遗漏,也能够尽可能保留具备情感分析意义的语义向量,由此可以提高会话文本情感分析精确度,进而提高后续页面会话过程中的智能化程度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1