一种用户风险分析方法、系统、电子设备及介质与流程

文档序号:25524001发布日期:2021-06-18 20:12阅读:78来源:国知局
一种用户风险分析方法、系统、电子设备及介质与流程

本发明涉及人工智能技术领域,特别是涉及一种用户风险分析方法、系统、电子设备及介质。



背景技术:

用户在日常的生活、工作、休息或者体检过程中,会产生大量的用户数据,这些用户数据往往隐藏着用户的健康、潜在风险等各种风险特征信息,不同类型的用户数据存在复杂关联性、多耦合性以及非显性,因此缺乏通过对表象的用户数据进行处理来获取深层次的风险特征信息的挖掘方法和通过风险特征信息对用户的风险进行评估和控制的方法。



技术实现要素:

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种用户风险分析方法、系统、电子设备及介质,用于解决现有技术中对表象的用户数据进行分析的问题。

为实现上述目的及其他相关目的,本发明提供一种用户风险分析方法,包括:

获取用户数据,所述用户数据包括若干个数据元素,将各个所述数据元素与对应的参考数据进行对比,确定多维数据元素,所述多维数据元素至少包括以下之一:达标数据元素、超标数据元素、未达标数据元素;

在特征矩阵中确定若个干所述数据元素对应的矩阵元素的位置,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中;

将所述多维数据元素对应的所述特征矩阵输入神经网络单元中进行训练,获取分析模型;

将待分析的特征矩阵输入所述分析模型,获取风险特征向量,并通过所述风险特征向量确定用户风险期望值。

可选的,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述达标元素载入到所述特征矩阵的矩阵元素中;

根据所述参考数据确定参考插值,通过第一绝对值和第二绝对值的比值,获取达标参数,其中,所述第一绝对值为所述达标数据元素与参考插值的差值的绝对值,所述第二绝对值为所述参考数据中两个端点值的差值的绝对值;

将所述达标参数载入到所述特征矩阵的矩阵元素中,获取第一特征矩阵。

可选的,所述参考插值为所述参考数据中两个端点值之间的中位数或者平均值。

可选的,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述超标数据元素载入到所述特征矩阵的矩阵元素中;

通过第三绝对值和第二绝对值的比值,获取超标指数,并通过超标指数和对数确定超标参数,其中,所述第二绝对值为所述参考数据中两个端点值的差值的绝对值,所述第三绝对值为所述超标数据元素与一所述参考数据的端点值的差值的绝对值;

将所述超标参数载入到所述特征矩阵的矩阵元素中,获取第二特征矩阵。

可选的,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述未达标数据元素载入到所述特征矩阵的矩阵元素中;

通过第四绝对值和第二绝对值的比值,获取未达标指数,并通过未达标指数和对数确定未达标参数,其中,所述第二绝对值为所述参考数据中两个端点值的差值的绝对值,所述第四绝对值为所述未达标数据元素与一所述参考数据的端点值的差值的绝对值;

将所述未达标参数载入到所述特征矩阵的矩阵元素中,获取第三特征矩阵。

可选的,将所述多维数据元素对应的所述特征矩阵输入神经网络单元中进行训练,获取分析模型的步骤包括:

所述神经网络单元包括第一神经网络、第二神经网络和第三神经网络,将所述达标数据元素对应的特征矩阵输入第一神经网络,将所述超标数据元素对应的特征矩阵输入第二神经网络,将未达标数据元素对应的特征矩阵输入第三神经网络;

将所述第一神经网络、所述第二神经网络和所述第三神经网络的输出值进行拼接,获取所述神经网络单元的输出值,所述神经网络单元的输出值为用户风险预测值;

通过平均绝对误差损失函数对所述神经网络单元进行训练,提高所述用户风险预测值的置信度,当所述置信度达到预设值时,获取分析模型。

可选的,所述第一神经网络、所述第二神经网络和所述第三神经网络均包括:输入层、隐藏层和输出层。

一种用户风险分析系统,包括:

采集模块,用于获取用户数据,所述用户数据包括若干个数据元素,将各个所述数据元素与对应的参考数据进行对比,确定多维数据元素,所述多维数据元素至少包括以下之一:达标数据元素、超标数据元素以及未达标数据元素;

预处理模块,用于在特征矩阵中确定若个干所述数据元素对应的矩阵元素的位置,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中;

模型模块,用于将所述多维数据元素对应的所述特征矩阵输入神经网络单元中进行训练,获取分析模型;

分析模块,用于将待分析的特征矩阵输入所述分析模型,获取风险特征向量,并通过所述风险特征向量确定用户风险期望值;

所述采集模块、所述预处理模块、所述模型模块和所述分析模块之间信号连接。

一种电子设备,其特征在于,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述电子设备执行一个或多个所述的方法。

一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行一个或多个所述的方法。

如上所述,本发明的用户风险分析方法、系统、电子设备及介质,具有以下有益效果:

通过对多维数据元素进行耦合分析,获取多维数据元素与用户风险之间的关联关系以及量化指标。

附图说明

图1显示为本发明实施例的用户风险分析方法的流程示意图。

图2显示为本发明实施例的特征矩阵的结构示意图。

图3显示为本发明实施例的特征矩阵处理的流程示意图。

图4显示为本发明实施例的用户风险分析系统的结构示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。

需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。

发明人发现在用户的日常生活、工作、体检或者体测中会产生大量的用户数据,获取用户数据的方式也日益增多,例如,可以从体脂称、可穿戴设备中获取,又例如,可以从用户历史的体检或者体测数据中获取,用户数据中的数据元素一般对应有参考数据,以便于量化地衡量数据元素的状态是达标、超标或者未达标,通过对多维数据元素进行耦合分析,获取多维数据元素与用户风险之间的关联关系以及量化指标,由于达标数据元素、超标数据元素以及未达标数据元素对该关联关系以及量化指标的影响权重各不相同,因此,通过对达标数据元素、超标数据元素以及未达标数据元素的采集、挖掘和分析,来获取具有较高置信度的用户风险预测值。请参考图1,本发明提供一种用户风险分析方法,包括:

s1:获取用户数据,所述用户数据包括若干个数据元素,每个用户id对应的用户数据均包括若干种类的数据元素,若干种类的所述数据元素与该用户息息相关,将各个所述数据元素与对应的参考数据进行对比,确定多维数据元素,所述多维数据元素至少包括以下之一:达标数据元素、超标数据元素、未达标数据元素,例如,用户数据中的数据元素包括离散的不同种类,而离散的不同种类的数据元素之间没有直接的、显性的关联关系,因此需要对不同用户数据的数据元素进行分类、处理以及分析,发明人还发现超标数据元素以及未达标数据元素对用户风险的影响相对较大,而达标数据元素对用户风险的影响相对较小;

s2:在特征矩阵中确定若个干所述数据元素对应的矩阵元素的位置,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中,分别将达标数据元素、超标数据元素、未达标数据元素进行矩阵化,并通过矩阵化的多维数据元素来承载用户数据深层次的特征信息;

s3:将所述多维数据元素对应的所述特征矩阵输入神经网络单元中进行训练,获取分析模型,由于达标数据元素、超标数据元素、未达标数据元素对用户风险的影响各不相同,通过输入多维数据来进行耦合分析,提高风险预测的置信度;

s4:将待分析的特征矩阵输入所述分析模型,获取风险特征向量,并通过所述风险特征向量确定用户风险期望值。

发明人在研究中发现一些参考数据的取值较为宽泛,虽然数据元素处于达标状态,但是可能较为接近参考数据的端点,当存在多个数据元素接近参考数据的端点的情况发生时,用户的风险概率也可能相对较高,但并不能从表象的打标数据元素中获得用户风险的影响指标,为了从达标数据元素中获取达标数据对用户风险的关联关系以及影响权重,发明人提出了对达标数据元素进行处理的方法,在一些实施过程中,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述达标数据元素d载入到所述特征矩阵的矩阵元素中,特征矩阵的结构请参阅图2,例如,a11、……、a1n、……、amn可以为达标数据元素,可以是超标数据元素或者未达标数据元素,特征矩阵的大小可视数据元素的容量而定,当数据元素的容量不足时,可将未载入的矩阵元素填充0,每个特征矩阵的矩阵元素可载入一类型的数据元素,例如,达标数据元素、超标数据元素或者未达标数据元素;

根据所述参考数据确定参考插值a,通过第一绝对值b和第二绝对值c的比值b/c,获取达标参数d=b/c,其中,所述第一绝对值b为所述达标数据元素a与参考插值a的差值的绝对值,所述第二绝对值c为所述参考数据中两个端点值e和f的差值的绝对值,c=|e-f|;

将所述达标参数d载入到所述特征矩阵的矩阵元素中,获取第一特征矩阵,并将其余矩阵元素载入0。

为了更能直观地反应出达标数据元素的特征信息,可选取所述参考数据中两个端点值之间的中位数或者平均值作为所述参考插值,例如,当参考数据为离散数据集时,可选取中位数作为参考插值,又例如,当参考数据为连续数据集时,可选取平均值作为参考插值。

发明人在研究中发现超标数据中的超标程度或者超标比例对用户风险的影响往往并非线性变化的过程,因此,发明人提供一种对超标数据元素进行处理的方法,处理后的超标数据元素中更能够体现出超标数据元素超标程度或者超标比例对用户风险的影响。示例性地说明,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述超标数据元素l载入到所述特征矩阵的矩阵元素中;

通过第三绝对值h和第二绝对值c的比值h/c,获取超标指数g=h/c,并通过超标指数g和对数,该对数可选取自然对数e(e≈2.7182818284)确定超标参数eg,也可视超标数据元素的重要性选择合适的对数,该对数还可以选择π为底的对数,其中,所述第二绝对值c为所述参考数据中两个端点值e和f的差值的绝对值,c=|e-f|,所述第三绝对值h为所述超标数据元素l与一所述参考数据的端点值的差值e或者f的绝对值,所述h=|l-e|或者h=|l-f|;

可将所述超标参数eg载入到所述特征矩阵的矩阵元素中,获取第二特征矩阵,并将其余矩阵元素载入0。通过对超标数据元素的超标比例进行指数化运算,来获得超标数据元素对用户风险影响的显性结果,并达到增大超标数据元素对用户风险影响权值的目的,提高用户风险预测的精确性和置信度。

发明人在研究中还发现未达标数据中的未达标程度或者未达标比例对用户风险的影响往往并非线性变化的过程,且未达标数据与用户风险状态具有较强的关联性,因此,发明人提供一种对未达标数据元素进行处理的方法,并且处理后的未达标数据元素中更能够体现出未达标数据元素未达标程度或者未达标比例对用户风险的影响。将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述未达标数据元素z载入到所述特征矩阵的矩阵元素中;

通过第四绝对值x和第二绝对值c的比值x/c,获取未达标指数y=x/c,并通过未达标指数y和对数,该对数可选取自然对数e(e≈2.7182818284)确定超标参数eg,也可视未达标数据元素的重要性选择合适的对数,该对数还可以选择π为底的对数,其中,所述第二绝对值c为所述参考数据中两个端点值e和f的差值的绝对值,所述第四绝对值x为所述未达标数据元素z与一所述参考数据的端点值e或者f的差值的绝对值,所述x=|z-e|或者h=|z-f|;

可将所述未达标参数ey载入到所述特征矩阵的矩阵元素中,获取第三特征矩阵,并将其余矩阵元素载入0。

为了进一步地对多维数据元素进行耦合分析,通过机器学习的方法对多维数据元素对应的特征矩阵进行训练,并从中学习,获取与用户风险相关的风险特征向量,请参阅图4,将所述多维数据元素对应的所述特征矩阵输入神经网络单元中进行训练,获取分析模型的步骤包括:

所述神经网络单元包括第一神经网络10、第二神经网络20和第三神经网络30,将所述达标数据元素对应的特征矩阵输入第一神经网络10,将所述超标数据元素对应的特征矩阵输入第二神经网络20,将未达标数据元素对应的特征矩阵输入第三神经网络30;

将所述第一神经网络10、所述第二神经网络20和所述第三神经网络30的输出值进行拼接,获取所述神经网络单元的输出值,所述神经网络单元的输出值为用户风险预测值,在获取所述神经网络单元的输出值之前,还可以将拼接的第一神经网络10、所述第二神经网络20和所述第三神经网络30的输出值输入第四神经网络40中;

通过平均绝对误差损失函数对所述神经网络单元进行训练,提高所述用户风险预测值的置信度,当所述置信度达到预设值时,获取分析模型,其中,平均绝对误差损失函数(meanabsoluteerror/mae)是一类常用的损失函数,也称为l1loss损失函数。

为了便于对特征矩阵进行训练和耦合分析,所述第一神经网络、所述第二神经网络和所述第三神经网络均包括:输入层10、隐藏层20和输出层30。进一步的,第四神经网络40也包括输入层、隐藏层和输出层。隐藏层包括多层且每次均包括多个神经元节点,通过平均绝对值误差损失函数分别对所述第一神经网络、所述第二神经网络、所述第三神经网络以及第四神经网络的隐藏层进行训练,通过多次正向传播和反向传播的迭代训练,调整各个隐藏层神经元节点输入的权重值,获取优化后的用户风险预测值,当用户风险预测值达到较高的置信度时,该用户风险预测值即可能够衡量用户风险的概况。

通过所述风险特征向量确定用户风险期望值的数学表达为:

其中,所述风险特征向量为i维向量(ti),i≥1且i为正整数,ti为第i年用户风险概率值,xi为第i年风险理赔期望值,q为增益系数,m为用户风险期望值。用户可以通过风险特征向量来获取未来一段时间内预测的风险状况,例如,通过i维向量来反馈第1年、2年、3年、……、i年的用户风险期望值,进而对自己预期的风险状况进行合理评估、做出更进一步的健康检测或者身体检测或者做出对应性的干预决策。

请参阅图4,本发明还提供一种用户风险分析系统,包括:

采集模块,用于获取用户数据,所述用户数据包括若干个数据元素,将各个所述数据元素与对应的参考数据进行对比,确定多维数据元素,所述多维数据元素至少包括以下之一:达标数据元素、超标数据元素以及未达标数据元素;

预处理模块,用于在特征矩阵中确定若个干所述数据元素对应的矩阵元素的位置,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中;

模型模块,用于将所述多维数据元素对应的所述特征矩阵输入神经网络单元中进行训练,获取分析模型;

分析模块,用于将待分析的特征矩阵输入所述分析模型,获取风险特征向量,并通过所述风险特征向量确定用户风险期望值;

所述采集模块、所述预处理模块、所述模型模块和所述分析模块之间信号连接。通过对多维数据元素进行耦合分析,获取多维数据元素与用户风险之间的关联关系以及量化指标。

可选的,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述达标元素载入到所述特征矩阵的矩阵元素中;

根据所述参考数据确定参考插值,通过第一绝对值和第二绝对值的比值,获取达标参数,其中,所述第一绝对值为所述达标数据元素与参考插值的差值的绝对值,所述第二绝对值为所述参考数据中两个端点值的差值的绝对值;

将所述达标参数载入到所述特征矩阵的矩阵元素中,获取第一特征矩阵。

可选的,所述参考插值为所述参考数据中两个端点值之间的中位数或者平均值。

可选的,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述超标数据元素载入到所述特征矩阵的矩阵元素中;

通过第三绝对值和第二绝对值的比值,获取超标指数,并通过超标指数和对数确定超标参数,其中,所述第二绝对值为所述参考数据中两个端点值的差值的绝对值,所述第三绝对值为所述超标数据元素与一所述参考数据的端点值的差值的绝对值;

将所述超标参数载入到所述特征矩阵的矩阵元素中,获取第二特征矩阵。

可选的,将所述多维数据元素分别载入到所述特征矩阵的矩阵元素中的步骤,包括:

将所述未达标数据元素载入到所述特征矩阵的矩阵元素中;

通过第四绝对值和第二绝对值的比值,获取未达标指数,并通过未达标指数和对数确定未达标参数,其中,所述第二绝对值为所述参考数据中两个端点值的差值的绝对值,所述第四绝对值为所述未达标数据元素与一所述参考数据的端点值的差值的绝对值;

将所述未达标参数载入到所述特征矩阵的矩阵元素中,获取第三特征矩阵。

可选的,将所述多维数据元素对应的所述特征矩阵输入神经网络单元中进行训练,获取分析模型的步骤包括:

所述神经网络单元包括第一神经网络、第二神经网络和第三神经网络,将所述达标数据元素对应的特征矩阵输入第一神经网络,将所述超标数据元素对应的特征矩阵输入第二神经网络,将未达标数据元素对应的特征矩阵输入第三神经网络;

将所述第一神经网络、所述第二神经网络和所述第三神经网络的输出值进行拼接,获取所述神经网络单元的输出值,所述神经网络单元的输出值为用户风险预测值;

通过平均绝对误差损失函数对所述神经网络单元进行训练,提高所述用户风险预测值的置信度,当所述置信度达到预设值时,获取分析模型。

可选的,所述第一神经网络、所述第二神经网络和所述第三神经网络均包括:输入层、隐藏层和输出层。

本发明实施例提供一种电子设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述电子设备执行一个或多个所述的方法。本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本发明实施例还提供一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行中一个或多个所述的方法。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1