基于保险知识图谱的保险客户风险识别方法、装置、设备及介质与流程

文档序号:36480677发布日期:2023-12-25 10:36阅读:55来源:国知局
基于保险知识图谱的保险客户风险识别方法与流程

本公开涉及人工智能,尤其是一种基于保险知识图谱的保险客户风险识别方法、装置、设备及介质。


背景技术:

1、现有的保险客户风险识别,通常是基于规则,以及业务人员的个人经验来识别的,难以具有泛化性,同时业务人员的业务水平参差不齐,也使得保险客户风险识别常常面临各种真实风险深度隐藏,无法准确地识别的问题。

2、保险知识图谱是基于人工智能领域的知识图谱技术,面向保险代理人、客户和保单等信息构建的应用于保险行业的知识图谱。由于保险领域的特殊性,保险具有长时间变化特征,又具有短时间变化特征,存在保险代理人与客户的多对多关系,同时也会有保险代理人、客户、保险公司和保险产品的多对多关系,特别是由于出行购买飞机延误险等,多种长期保险、短期保险等信息复杂多样,另外客户个人的家庭关系也会随着时间的变化而变化,故保险知识图谱存在复杂多变的情况。同时由于保险知识图谱中保存了客户的风险事件,使得通过基于多种模态的保险知识图谱中复杂关系来预测客户潜在风险成为了可能。


技术实现思路

1、(一)要解决的技术问题

2、有鉴于此,本公开的主要目的在于提供一种基于保险知识图谱的保险客户风险识别方法、装置、设备及介质,以提高保险客户风险识别的准确率。

3、(二)技术方案

4、本公开的第一方面,提供了一种基于保险知识图谱的保险客户风险识别方法,包括:构建多模态的保险知识图谱;从保险知识图谱中提取客户节点的特征;对提取的客户节点的特征进行融合,得到每个客户节点的特征结果n维向量e;对客户节点的特征结果n维向量e进行聚合,得到每个客户类别的中心点,根据客户类别的中心点确认客户所属类别;针对属于同一类别的客户,计算任一客户与该类别中其他客户之间的两两相似度,对计算的相似度结果进行排序,并将排序结果作为客户风险的推荐列表。

5、在一些实施例中,所述构建多模态的保险知识图谱,包括:构建多模态的保险知识图谱g=(,v,z,r),将长时间稳定关系与短时间经常变化的关系统一表示在一个保险知识图谱内;其中,v表示保险知识图谱中节点的集合,z表示保险知识图谱中三元组{实体节点、关系、实体节点}的集合,r表示保险知识图谱中关系的集合;其中,保险知识图谱至少包括客户节点、保单节点、保险公司节点和中介公司节点这些不同类型的节点,每种类型的节点进一步包括图片特征、文本特征、数值特征和结构特征这些特征属性。

6、在一些实施例中,所述客户节点包括但不限于以下特征属性信息:节点id、姓名、性别、照片、个人id、客户出险记录和客户风险;所述保单节点包括但不限于以下特征属性信息:保险公司名称、保险单名称、投保人、被保人和节点id。

7、在一些实施例中,针对客户节点的图片特征,所述从保险知识图谱中提取客户节点的特征,包括:采用标准的预训练resnet神经网络,从保险知识图谱中提取客户节点的图片特征,客户节点的图片特征至少包括保单图片和客户信息图片,其中客户信息图片由客户代理人提供。

8、在一些实施例中,所述标准的预训练resnet神经网络,其残差网络参数为80层,将第80层网络的输出作为该客户节点的图片特征:ev=resnet80(img),其中ev为客户节点的图片特征,img为输入的单张图片。

9、在一些实施例中,针对客户节点的文本特征,所述从保险知识图谱中提取客户节点的特征,包括:采用预训练语言模型bert,计算保险知识图谱中客户节点所有使用文本描述的语义特征:eu=bert(userdesc),其中eu为客户节点所有使用文本描述的语义特征,userdesc为客户描述,具体为客户节点的所有属性集合。

10、在一些实施例中,所述预训练语言模型bert是google公司在2018年推出的基于transformer架构的大规模文本预训练模型,所述使用文本描述的语义特征至少包括保险单的关键信息、客户的家庭简介、客户的家庭关系简介和客户的风险描述。

11、在一些实施例中,针对客户节点的数值特征,所述从保险知识图谱中提取客户节点的特征,是使用如下公式来计算客户节点的数值特征:ed=∑log2(xi),其中ed为客户节点的数值特征,xi为该客户的第i个特征数值。可选地,所述客户节点的数值特征至少包括年龄、邮政编码、金额和收入。

12、在一些实施例中,针对客户节点的结构特征,所述从保险知识图谱中提取客户节点的特征,是采用基于图学习随机游走的特征提取方法实现的。可选地,所述采用基于图学习随机游走的特征提取方法,是将图卷积网络的层数设置为30,客户节点的结构特征es=gcn30(kg),其中es为客户节点的结构特征,kg为客户在知识图谱中的结构关系矩阵。

13、在一些实施例中,所述对提取的客户节点的特征进行融合,得到每个客户节点的特征结果n维向量e,是采用基于注意力的融合机制实现的,具体包括:基于注意力的融合机制对提取的客户节点的特征进行融合:

14、(αv,αu,αd,αs)=softmax(atev,ateu,ated,ates,)

15、其中,αv是softmax(atev),αu是softmax(ateu),αd是softmax(ated),αs是softmax(ates),,softmax是基于注意力的融合机制的融合函数,α是注意力系数,at是通过神经网络学习的注意力向量,ev为客户节点的图片特征,eu为客户节点所有使用文本描述的语义特征,ed为客户节点的数值特征,es为客户节点的结构特征;

16、融合后得到每个客户节点的特征结果n维向量e:

17、e=αvev+αueu+αded+αses。

18、在一些实施例中,所述对客户节点的特征结果n维向量e进行聚合,得到每个客户类别的中心点,根据客户类别的中心点确认客户所属类别,包括:采用dbscan聚类算法对客户节点的特征结果n维向量e进行计算,得到客户的类别数量n=dbscan(e),然后将客户的类别数量n作为先验参数,使用k-means算法,对知识图谱客户节点的向量重新聚类,得到每个客户类别的中心点center=k-means(e,n),接着根据客户类别的中心点确认客户所属类别。

19、在一些实施例中,所述计算任一客户与该类别中其他客户之间的两两相似度,对于客户i采用以下计算公式:

20、

21、其中,θ为客户i与该类别中其他客户之间的两两相似度,ei是第i个客户的特征向量,avg(ei)是第i个客户的特征向量的均值,ej是第j个客户的特征向量,avg(ej)是第j个客户的特征向量的均值,i和j均是客户的序号。

22、本公开的另一方面,提供了一种基于保险知识图谱的保险客户风险识别装置,包括:保险知识图谱构建模块,用于构建多模态的保险知识图谱;特征提取模块,用于从保险知识图谱中提取客户节点的特征;特征融合模块,用于对提取的客户节点的特征进行融合,得到每个客户节点的特征结果n维向量e;向量聚合模块,用于对客户节点的特征结果n维向量e进行聚合,得到每个客户类别的中心点,根据客户类别的中心点确认客户所属类别;相似度计算及推荐模块,用于针对属于同一类别的客户,计算任一客户与该类别中其他客户之间的两两相似度,对计算的相似度结果进行排序,并将排序结果作为客户风险的推荐列表。

23、本公开的又一方面,提供了一种基于保险知识图谱的保险客户风险识别设备,包括:一个或多个处理器;存储器,其存储有计算机可执行程序,该程序在被所述处理器执行时,使得所述处理器实现所述的基于保险知识图谱的保险客户风险识别方法。

24、本公开的再一方面,提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令被执行时实现所述的基于保险知识图谱的保险客户风险识别方法。

25、本公开的再一方面,提供了一种计算机程序产品,包括:计算机可执行指令,所述指令被执行时用于实现所述的基于保险知识图谱的保险客户风险识别方法。

26、(三)有益效果

27、从上述技术方案可以看出,本公开提供的基于保险知识图谱的保险客户风险识别方法、装置、设备及介质,相对于现有技术具有以下有益效果:

28、1、本公开提供的基于保险知识图谱的保险客户风险识别方法、装置、设备及介质,通过构建应用于保险领域的多模态保险知识图谱,将长时间稳定关系与短时间经常变化的关系统一表示在一个保险知识图谱内,并通过从保险知识图谱中提取客户节点的特征,对客户节点的特征进行融合、聚合及相似度计算,综合利用全面的信息进行风险的发现与识别,大大提高了保险客户风险识别的准确率。

29、2、本公开提供的基于保险知识图谱的保险客户风险识别方法、装置、设备及介质,相较于传统的其他风险推荐方法,具备可解释性,突破了之前传统矩阵因式分解算法的难以解释问题,使得完全没有技术基础的保险代理人完全可以更为生动的解释风险的来源和案例,大大提升了客户体验和满意度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1