理赔文本生成方法和装置、电子设备及存储介质与流程

文档序号:37449454发布日期:2024-03-28 18:32阅读:9来源:国知局
理赔文本生成方法和装置、电子设备及存储介质与流程

本技术涉及金融科技领域,尤其涉及一种理赔文本生成方法和装置、电子设备及存储介质。


背景技术:

1、在保险领域中,保险理赔往往会涉及大量复杂材料。在智能理赔流程中,常常需要在理赔材料录入环节对复杂的文本内容、图像内容等进行内容识别。但是在这个内容识别过程中常常会由于保险理赔材料的质量不佳等原因造成识别错误,会较大程度地影响到生成的理赔文本的准确性。

2、目前,大多数文本生成方法依赖于样本集的数量和质量,在纠错过程中往往缺乏对文本语义信息的分析,会导致文本纠错效果不佳等问题,不利于提高生成的理赔文本的准确性。


技术实现思路

1、本技术实施例的主要目的在于提出一种理赔文本生成方法、理赔文本生成装置、电子设备及存储介质,旨在提高生成的理赔文本的准确性。

2、为实现上述目的,本技术实施例的第一方面提出了一种理赔文本生成方法,所述方法包括:

3、获取原始理赔数据,其中,所述原始理赔数据包括图像数据、文本数据、以及音频数据;

4、对所述图像数据、所述文本数据、以及所述音频数据进行文本转换,得到原始理赔文本,其中,所述原始理赔文本包括文字字符;

5、对所述原始理赔文本进行字符分割,得到多个所述文字字符;

6、基于预设的字形编码网络对所述文字字符进行字形识别,得到所述文字字符的字形向量特征;

7、基于预设的语义编码网络对所述文字字符进行字义识别,得到所述文字字符的字义向量特征;

8、基于预设的字音编码网络对所述文字字符进行字音识别,得到所述文字字符的字音向量特征;

9、对所述字形向量特征、所述字义向量特征、以及所述字音向量特征进行选择性特征融合,得到融合特征向量;

10、基于所述融合特征向量对所述原始理赔文本进行文本更新,得到目标理赔文本。

11、在一些实施例,所述基于预设的字形编码网络对所述文字字符进行字形识别,得到所述文字字符的字形向量特征,包括:

12、针对每个所述文字字符,对所述文字字符进行图像生成,得到所述文字字符的字符图像;

13、基于所述字形编码网络对所述字符图像进行字形特征抽取,得到所述字形向量特征。

14、在一些实施例,所述基于预设的语义编码网络对所述文字字符进行字义识别,得到所述文字字符的字义向量特征,包括:

15、基于所述语义编码网络的嵌入层对所述文字字符进行嵌入处理,得到字符嵌入特征;

16、基于所述语义编码网络将所述字符嵌入特征映射到预设的语义向量空间,得到所述字义向量特征。

17、在一些实施例,所述基于预设的字音编码网络对所述文字字符进行字音识别,得到所述文字字符的字音向量特征,包括:

18、基于所述字音编码网络对所述文字字符进行字音特征抽取,得到所述字符的拼音特征和声调特征;

19、对所述拼音特征和所述声调特征进行特征拼接,得到所述字音向量特征。

20、在一些实施例,所述对所述字形向量特征、所述字义向量特征、以及所述字音向量特征进行选择性特征融合,得到融合特征向量,包括:

21、对所述字形向量特征进行特征评分,得到第一特征评分数据,对所述字义向量特征进行特征评分,得到第二特征评分数据,并对所述字音向量特征进行特征评分,得到第三特征评分数据;

22、基于所述第一特征评分数据、所述第二特征评分数据、所述第三特征评分数据对所述字形向量特征、所述字义向量特征、以及所述字音向量特征进行选择性特征融合,得到所述融合特征向量。

23、在一些实施例,所述基于所述第一特征评分数据、所述第二特征评分数据、所述第三特征评分数据对所述字形向量特征、所述字义向量特征、以及所述字音向量特征进行特征融合,得到所述融合特征向量,包括:

24、在所述第一特征评分数据、所述第二特征评分数据、所述第三特征评分数据中,确定的目标特征评分数据;

25、基于所述目标特征评分数据,在所述字形向量特征、所述字义向量特征、以及所述字音向量特征中,确定目标向量特征;

26、基于所述目标向量特征进行特征融合,得到所述融合特征向量。

27、在一些实施例,所述基于所述融合特征向量对所述原始理赔文本进行文本更新,得到目标理赔文本,包括:

28、基于所述融合特征向量对所述文字字符进行错误评分,得到所述文字字符的错误评分数据;

29、针对所述原始理赔文本,对所述错误评分数据大于预设阈值的所述文字字符进行修正,得到所述目标理赔文本。

30、为实现上述目的,本技术实施例的第二方面提出了一种理赔文本生成装置,所述装置包括:

31、数据获取模块,用于获取原始理赔数据,其中,所述原始理赔数据包括图像数据、文本数据、以及音频数据;

32、文本转换模块,用于对所述图像数据、所述文本数据、以及所述音频数据进行文本转换,得到原始理赔文本,其中,所述原始理赔文本包括文字字符;

33、分割模块,用于对所述原始理赔文本进行字符分割,得到多个所述文字字符;

34、字形识别模块,用于基于预设的字形编码网络对所述文字字符进行字形识别,得到所述文字字符的字形向量特征;

35、字义识别模块,用于基于预设的语义编码网络对所述文字字符进行字义识别,得到所述文字字符的字义向量特征;

36、字音识别模块,用于基于预设的字音编码网络对所述文字字符进行字音识别,得到所述文字字符的字音向量特征;

37、特征融合模块,用于对所述字形向量特征、所述字义向量特征、以及所述字音向量特征进行选择性特征融合,得到融合特征向量;

38、更新模块,用于基于所述融合特征向量对所述原始理赔文本进行文本更新,得到目标理赔文本。

39、为实现上述目的,本技术实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。

40、为实现上述目的,本技术实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。

41、本技术提出的理赔文本生成方法、理赔文本生成装置、电子设备及存储介质,其通过获取原始理赔数据,其中,原始理赔数据包括图像数据、文本数据、以及音频数据;对图像数据、文本数据、以及音频数据进行文本转换,得到原始理赔文本,能够使原始理赔文本包含多种模态的语义内容。进一步地,对原始理赔文本进行字符分割,得到多个文字字符,能够实现在字符级别的文本处理。进一步地,基于预设的字形编码网络对文字字符进行字形识别,得到文字字符的字形向量特征;基于预设的语义编码网络对文字字符进行字义识别,得到文字字符的字义向量特征;基于预设的字音编码网络对文字字符进行字音识别,得到文字字符的字音向量特征,能够较为方便地提取到文字字符的多种模态的向量特征,提高了特征多样性。进一步地,对字形向量特征、字义向量特征、以及字音向量特征进行选择性特征融合,得到融合特征向量,能够灵活地对多种模态的向量特征进行融合,使融合特征向量包含字音、字形、字义中的多种信息。最后,基于融合特征向量对原始理赔文本进行文本更新,得到目标理赔文本,能够提高生成的理赔文本的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1