本发明涉及大数据,尤其涉及一种数据处理的方法、装置、电子设备和存储介质。
背景技术:
1、近年来,随着各领域经济和技术的快速发展,小微企业的数量越来越大,所以小微企业的贷款数量也越来越多,因小微企业自身风险较大,所以对于小微企业的贷款风险监控成为重要问题。相关技术中,通常是使用风险模型来对贷款风险进行监控,但是小微企业可以使用的样本数据较少,所以样本不平衡很容易导致风险模型准确性较低,从而导致风险监控效果较低。
技术实现思路
1、有鉴于此,本发明实施例提供一种数据处理的方法、装置、电子设备和存储介质,能够解决可以使用的样本数据较少,所以样本不平衡很容易导致风险模型准确性较低,导致风险监控效果较低的问题。
2、为实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理的方法。
3、本发明实施例的一种数据处理的方法包括:响应于数据处理指令,获取对应的机构标识,以采集所述机构标识关联的交易数据;
4、识别所述交易数据中各交易的描述字段,调用预设的生成模型,生成各所述交易的文本特征,以及调用预设的计算模型,计算各所述交易的语义特征;
5、对每个所述交易,将对应的文本特征和所述语义特征拼接,得到待定特征向量;获取所述交易的结构化交易信息,以提取所述交易对应预设交易维度的参数值,将所述参数值与所述待定特征向量拼接,确定为所述交易对应的特征向量;
6、将各所述交易的特征向量输入预设的评估模型,确定所述机构标识对应的评估结果,并执行对应的处理程序。
7、在一个实施例中,所述调用预设的生成模型,生成各所述交易的文本特征,包括:
8、对每个所述描述字段值,对所述描述字段值分词,以得出对应的各分词,并生成各所述分词对应的词向量;将各所述分词与预设关键词集合匹配,确定各所述分词的关键度,以基于各所述分词的关键度和所述词向量生成所述交易的文本特征向量。
9、在又一个实施例中,
10、所述调用预设的计算模型,计算所述交易的语义特征,包括:
11、对每个所述描述字段值,将所述描述字段值分词,以得出对应的各分词,将各所述分词与预设语义库匹配,以确定各所述分词对应的语义标签;基于各所述分词对应的语义标签计算所述交易的语义特征值。
12、在又一个实施例中,所述语义特征包括情感特征;基于各所述分词对应的语义标签计算所述交易的语义特征值,包括:
13、对每个所述描述字段值,基于各所述分词的情感标签确定各所述分词的情感得分,以将各所述情感得分和所述分词的情感权重计算所述交易的情感特征值。
14、在又一个实施例中,
15、将各所述情感得分和所述分词的情感权重计算所述交易的情感特征值,包括:
16、对每个所述描述字段值,基于所述描述字段值所包括分词的情感得分和情感权重计算对应交易的感情值,以基于所述情感值所属的预设区间确定对应交易的情感特征值。
17、在又一个实施例中,在确定所述企业标识对应的评估结果之后,还包括:
18、响应于所述评估结果异常,触发预设的报警事件,并调用预设报告模板生成对应的评估报告,将所述评估报告发送至监控端。
19、为实现上述目的,根据本发明实施例的另一方面,提供了一种数据处理的装置。
20、本发明实施例的一种数据处理的装置包括:采集单元,用于响应于数据处理指令,获取对应的机构标识,以采集所述机构标识关联的交易数据;
21、计算单元,用于识别所述交易数据中各交易的描述字段,调用预设的生成模型,生成各所述交易的文本特征,以及调用预设的计算模型,计算各所述交易的语义特征;
22、融合单元,用于对每个所述交易,将对应的文本特征和所述语义特征拼接,得到待定特征向量;获取所述交易的结构化交易信息,以提取所述交易对应预设交易维度的参数值,将所述参数值与所述待定特征向量拼接,确定为所述交易对应的特征向量;
23、评估单元,用于将各所述交易的特征向量输入预设的评估模型,确定所述机构标识对应的评估结果,并执行对应的处理程序。
24、在一个实施例中,所述计算单元,具体用于:
25、对每个所述描述字段值,对所述描述字段值分词,以得出对应的各分词,并生成各所述分词对应的词向量;将各所述分词与预设关键词集合匹配,确定各所述分词的关键度,以基于各所述分词的关键度和所述词向量生成所述交易的文本特征向量。
26、在又一个实施例中,所述计算单元,具体用于:
27、对每个所述描述字段值,将所述描述字段值分词,以得出对应的各分词,将各所述分词与预设语义库匹配,以确定各所述分词对应的语义标签;基于各所述分词对应的语义标签计算所述交易的语义特征值。
28、在又一个实施例中,所述语义特征包括情感特征;
29、所述计算单元,具体用于:
30、对每个所述描述字段值,基于各所述分词的情感标签确定各所述分词的情感得分,以将各所述情感得分和所述分词的情感权重计算所述交易的情感特征值。
31、在又一个实施例中,所述计算单元,具体用于:
32、对每个所述描述字段值,基于所述描述字段值所包括分词的情感得分和情感权重计算对应交易的感情值,以基于所述情感值所属的预设区间确定对应交易的情感特征值。
33、在又一个实施例中,所述装置还包括:
34、触发单元,用于响应于所述评估结果异常,触发预设的报警事件,并调用预设报告模板生成对应的评估报告,将所述评估报告发送至监控端。
35、为实现上述目的,根据本发明实施例的再一个方面,提供了一种电子设备。
36、本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例提供的数据处理的方法。
37、为实现上述目的,根据本发明实施例的又一个方面,提供了一种计算机可读介质。
38、本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例提供的数据处理的方法。
39、为实现上述目的,根据本发明实施例的又一个方面,提供了一种计算机程序产品。
40、本发明实施例的一种计算机程序产品,包括计算机程序,所述程序被处理器执行时实现本发明实施例提供的数据处理的方法。
41、上述发明中的一个实施例具有如下优点或有益效果:本发明实施例中,响应数据处理指令时,可以先获取企业标识关联的交易数据,从中提取各交易的描述字段,以可以确定描述字段对应的文本特征和语义特征,即从文本含义和语义含义的维度对交易数据进行分析;进而可以提取出加以数据中的结构化信息,并将其和文本特征和语义特征,以确定出交易数据的特征向量,从而输入预设的评估模型中进行评估。如此本发明实施例中,对于企业的交易数据,可以从多个维度进行多模态的特征分析和融合,再输入评估模型中进行评估,以提高评估的准确性,从而可以避免因样本数量较少而导致企风险评估结果准确性较低、风险监控效果较低的问题。
42、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。