一种目标对象评分方法及系统与流程

文档序号:29692160发布日期:2022-04-16 12:04阅读:108来源:国知局
一种目标对象评分方法及系统与流程

1.本技术涉及金融科技领域,具体而言,涉及一种目标对象评分方法及系统。


背景技术:

2.根据现有的全面风险管理的相关文件精神和要求。为智能、客观、高效的评价分行管理者对风险管理的落实情况,激励银行管理决策者牢牢守住银行风险防控的底线。已经建立了一些全面风险的实施评价方法,现存的评价方法大多已人工评分为主,由于待评分材料种类繁多数量较大,使得相关技术中银行经理的履职能力的评估,存在准确性低,稳定性差的问题。
3.针对相关技术中银行经理的履职能力的评估,存在准确性低,稳定性差的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本技术的主要目的在于提供一种目标对象评分方法及系统,以解决相关技术中银行经理的履职能力进行评估,存在准确性低,稳定性差的问题。
5.为了实现上述目的,根据本技术的一个方面,提供了一种目标对象评分方法。该方法包括:确定第一评分材料与第二评分材料之间的文本相似度,其中,所述第一评分材料为对第一目标对象进行评分后得到的材料,所述第一目标对象为已评分的目标对象,所述第二评分材料为对第二目标对象进行评分的材料;根据所述第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定所述第二目标对象与其他目标对象的评分点相似度,其中,所述其他目标对象包括所述第一目标对象;根据所述文本相似度和所述评分点相似度,以及所述第一目标对象的总评分,确定所述第二目标对象的总评分。
6.可选的,确定第一评分材料与第二评分材料之间的文本相似度之前,所述方法还包括:确定多个维度的评分点,并确定所述评分点评分的关键词;通过文字识别技术提取所述第一评分材料的第一文本;根据所述评分点的关键词,确定所述第一文本命中的所述关键词的数量和频率;根据命中的所述关键词的数量和频率确定所述第一目标对象对多个维度的评分点的评分;根据所述多个维度的评分点的评分,确定所述第一目标对象的评分。
7.可选的,确定第一评分材料与第二评分材料之间的文本相似度包括:确定所述第一文本和所述第二评分材料的第二文本的词频特征;根据所述词频特征进行特征向量化,得到特征向量;根据所述第一文本和所述第二文本的特征向量,确定所述第一文本和所述第二文本的文本相似度。
8.可选的,确定所述第一文本和所述第二文本的词频特征包括:对所述第一文本和所述第二文本进行分词处理,得到多个分词,以及每个分词的词频率;对多个分词进行去重合并,得到处理后的分词;根据处理后的分词的词频率,采用词频-逆文本频率,确定所述第一文本和所述第二文本的词频特征。
9.可选的,根据所述第二评分材料的评估时间,确定所述第二目标对象的评分点相
似度包括:通过所述第二目标对象的第二评分材料的评估时间,与其他的目标对象的评分材料的评估时间,确定所述第二目标对象与其他的目标对象之间的时间距离;根据所述时间距离,所述第二目标对象的第二评分材料对所述评分点的评分,以及所述其他的目标对象对所述评分点的评分,确定所述评分点相似度。
10.可选的,根据所述第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定所述第二目标对象与其他目标对象的评分点相似度包括:根据所述文本相似度的第一权重,和所述评分点相似度的第二权重,确定第一目标对象和所述第二目标对象的评分相似度;根据所述评分相似度和所述第一目标对象的总评分,确定所述第二目标对象的总评分。
11.可选的,根据所述文本相似度和所述评分点相似度,以及所述第一目标对象的总评分,确定所述第二目标对象的总评分之后,所述方法还包括:确定所述第二目标对象在预设时间段内对每个评分点的得分,以及平均得分;通过稳定性分析模型,根据所述得分和所述平均得分,确定所述第二目标对象在所述预设时间段内对所述评分点的稳定性参数。
12.可选的,根据所述文本相似度和所述评分点相似度,以及所述第一目标对象的总评分,确定所述第二目标对象的总评分之后,所述方法还包括:将所述第二目标对象的总评分发送给包括所述第二目标对象的多个预设对象。
13.为了实现上述目的,根据本技术的另一方面,提供了一种目标对象评分装置。该装置包括:文本相似度确定模块,确定第一评分材料与第二评分材料之间的文本相似度,其中,所述第一评分材料为对第一目标对象进行评分后得到的材料,所述第一目标对象为已评分的目标对象,所述第二评分材料为对第二目标对象进行评分的材料;评分点相似度确定模块,根据所述第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定所述第二目标对象与其他目标对象的评分点相似度,其中,所述其他目标对象包括所述第一目标对象;总评分确定模块,根据所述文本相似度和所述评分点相似度,以及所述第一目标对象的总评分,确定所述第二目标对象的总评分。
14.根据本技术的另一方面,还提供了一种计算机可读存储介质,所述处存储介质用于存储程序,其中,所述程序执行上述中任意一项所述的目标对象评分方法。
15.根据本技术的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述中任意一项所述的目标对象评分方法。
16.通过本技术,采用以下步骤:确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分的材料;根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度,其中,其他目标对象包括第一目标对象;根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分,通过已评分的第一目标对象的评分材料,利用第二目标对象与第一目标对象的评分材料的文本相似度和由目标对象评估时间确定的评分点相似度对第二目标对象进行总评分,达到了利用文本相似度以及评分点相似度对评分对象进行快速精确评分的目的,实现了提高履职能力评估效率以及评估质量的
技术效果,进而通过本技术,解决了相关技术中银行经理的履职能力进行评估,存在准确性低,稳定性差的问题。
附图说明
17.构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
18.图1是根据本技术实施例提供的一种目标对象评分方法的流程图;
19.图2是根据本技术实施方式提供的系统总体的示意图;
20.图3是根据本技术实施方式提供的参评机构主要参评者参评材料的示意图;
21.图4是根据本技术实施方式提供的参评机构文档内容扫描结果的示意图;
22.图5-1是根据本技术实施方式提供的一种被评价者评分点得分树状图;
23.图5-2是根据本技术实施方式提供的另一种被评价者评分点得分树状图;
24.图6是根据本技术实施方式提供的相似度关联打分算法流程图;
25.图7是根据本技术实施例提供的一种目标对象评分装置的示意图;
26.图8是根据本技术实施例提供的一种电子设备的示意图。
具体实施方式
27.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
28.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
29.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
30.需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
31.下面结合优选的实施步骤对本发明进行说明,图1是根据本技术实施例提供的一种目标对象评分方法的流程图,如图1所示,该方法包括如下步骤:
32.步骤s101,确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分的材料;
33.步骤s102,根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估
时间,确定第二目标对象与其他目标对象的评分点相似度,其中,其他目标对象包括第一目标对象;
34.步骤s103,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分。
35.通过上述步骤,确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分的材料;根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度,其中,其他目标对象包括第一目标对象;根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分,通过已评分的第一目标对象的评分材料,利用第二目标对象与第一目标对象的评分材料的文本相似度和由目标对象评估时间确定的评分点相似度对第二目标对象进行总评分,达到了利用文本相似度以及评分点相似度对评分对象进行快速精确评分的目的,实现了提高履职能力评估效率以及评估质量的技术效果,进而通过本技术,解决了相关技术中银行经理的履职能力进行评估,存在准确性低,稳定性差的问题。
36.上述目标对象可以指全面风险履职评价者或其他需要进行履职评价的评价者,上述目标对象可以进行履职能力的强弱,履职能力的稳定性进行评估,上述第一目标对象可以指已进行履职评价的已评分的目标对象,上述第二目标对象为待评分的目标对象,上述第一目标对象的已评分项目可以作为第二目标对象进行评分的依据。
37.上述第一评分材料可以是第一目标对象进行评分后得到的材料,包括履职措施、履职制度、履职规定、会议纪要、分析报告、上会审议材料、邮件等。上述第二评分材料可以是第二目标对象进行评分后得到的材料,可以通过对评分材料的文本进行文字识别,文字识别技术进行扫描、确定评分点、评分点关键词,可以将文本材料进行分词、去重合并、计算特征值、计算余弦相似度的过程计算第一目标对象与第二目标对象的第一评分材料与第二评分材料的文本相似度。进而通过利用第一目标对象已经得到的评分和第一目标对象和第二目标对象的文本相似度计算得到第二目标对象的文本相似度的评分,通过此方法对第二目标对象的第二评分材料可以进行初步的评分,不再一直使用传统的效率较低的人工评分。
38.上述评分点相似度可以将评估时间与其他目标对象的评分材料引入第二目标对象的评分依据中,对第二目标对象进行进一步评价。通过引入评分点相似度可以提高目标对象的评估的准确性,由于每个目标对象对评分点的打分可能存在不相同的情况,通过第二目标对象的第二评分材料的评估时间,与其他的目标对象的评分材料的评估时间,可以确定第二目标对象与其他的目标对象之间的时间距离,根据时间距离,第二目标对象的第二评分材料对评分点的评分,以及其他的目标对象对评分点的评分,确定评分点相似度。
39.可以通过分别设置文本相似度与评分点相似度的权重确定第二目标对象的总评评分,还可以根据通过预设时间段内的每个评分点的得分,以及平均得分进行对目标对象的履职能力稳定性进行分析。
40.利用第二目标对象与第一目标对象的评分材料的文本相似度和由目标对象评估时间确定的评分点相似度对第二目标对象进行总评分,达到了利用文本相似度以及评分点
相似度对评分对象进行快速精确评分的目的,实现了提高履职能力评估效率以及评估质量的技术效果,进而通过本技术,解决了相关技术中银行经理的履职能力进行评估,存在准确性低,稳定性差的问题。
41.可选的,确定第一评分材料与第二评分材料之间的文本相似度之前,方法还包括:确定多个维度的评分点,并确定评分点评分的关键词;通过文字识别技术提取第一评分材料的第一文本;根据评分点的关键词,确定第一文本命中的关键词的数量和频率;根据命中的关键词的数量和频率确定第一目标对象对多个维度的评分点的评分;根据多个维度的评分点的评分,确定第一目标对象的评分。
42.确定第一评分材料与第二评分材料之间的文本相似度之前,还可以确定多个维度的评分点,可以从文件类型维度,时间序列维度、机构层级维度等多个维度确定评分点,还可以确定评分点评分的关键词,上述评分点关键词可以由评价者为每个评分点建立一个或多个关键词。
43.通过文字识别技术可以提取第一评分材料的第一文本,系统启动自动评分后,可以从第一评分材料的文本自动查找文本中字段与关键词的的匹配情况,通过上述匹配情况可以确定第一文本命中的关键词的数量和频率;根据命中的关键词的数量和频率可以确定第一目标对象对多个维度的评分点的评分,根据多个维度的评分点的评分,可以确定第一对象的评分。
44.具体的,文件类型维度:措施、制度、规定、会议纪要、分析报告、上会审议材料、邮件等;时间序列维度:参评机构历史报送过的所有材料,包括前期报送后又删除的材料。系统仅展示参评机构最新报送的材料。系统应记录每次更新评分点、参评机构更新报送资料、参评机构管理员、评价者管理员发起评分、汇总评分等操作的时间点;机构层级维度:系统应能记录负责报送材料的人员所属的机构层级;文件、时间、机构层级维度收集的材料可以作为评价者对参评机构被评价者进行履职能力打分的辅助性参考。
45.通过根据命中的关键词的数量和频率确定第一目标对象对多个维度的评分点的评分,达到了对目标对象进行全面评分的目的,实现了提高评分准确率的技术效果。
46.可选的,确定第一评分材料与第二评分材料之间的文本相似度包括:确定第一文本和第二评分材料的第二文本的词频特征;根据词频特征进行特征向量化,得到特征向量;根据第一文本和第二文本的特征向量,确定第一文本和第二文本的文本相似度。
47.确定第一评分材料与第二评分材料之间的文本相似度,可以根据文本中出现的关键词的频率以及关键词的重要性确定第一文本和第二评分材料的第二文本的词频特征,可以按照词频特征将文本材料中的每句话转化成特征矩阵,得到特征向量,通过第一文本和第二文本的特征向量进行计算,可以确定第一文本和第二文本的文本相似度。
48.通过将文本材料的词频特征进行特征向量化,达到了将文本进行数字化处理的目的,实现了提高文本材料处理速度的技术效果。
49.可选的,确定第一文本和第二文本的词频特征包括:对第一文本和第二文本进行分词处理,得到多个分词,以及每个分词的词频率;对多个分词进行去重合并,得到处理后的分词;根据处理后的分词的词频率,采用词频-逆文本频率,确定第一文本和第二文本的词频特征。
50.上述词频特征可以通过对第一文本材料与第二文本材料进行处理得到,可以对第
一文本和第二文本进行分词处理,上述分词处理可以将文本材料句子中可以成词的词语扫描出来,实现对句子的精确切开,对长词还可以再次切分得到多个分词,计算每一个分词组合的最大概率,可以通过动态规划上述分词得到每个分词的词频率,为避免词频作为权重过于简单,可以采用词频-逆文本频率确定第一文本和第二文本的词频特征。
51.具体的,关键词计算相似度的过程:(1)分词:因为上传的材料是中文,所以采用jieba分词,通过dictionary对输入文本串生成一个有向无环图,按照字典dag{位置,[有效图的末尾索引]},根据有向无环图的生成的词切片,计算出每一种分词组合的最大概率,采用动态规划算法可以得到一个基于字典的每个词频率的最优解。(2)去重合并:对于分词后重复的词语进行删除、统计。(3)计算特征值:tf-idf算法(term frequency-inverse document frequency),即:“词频-逆文本频率”。由tf和idf两部分组成。tf为词频,当前文本中词出现的频率;idf为一个词的权重,也即该词在所有文本中出现的频率,如果一个词在很多文本中出现,那么它的idf应该很低。将tf与idf相乘就得到一个tf-idf的数值。某个词对评价者上传的文本重要性越高tf-idf的值就越大。引入idf就避免词频作为权重过于简单。
[0052]
通过对文本材料进行分词、去重合并、采用词频-逆文本频率,达到了准确获取第一文本和第二文本的词频特征的目的,实现了提高文本词频特征提取的准确性的技术效果。
[0053]
可选的,根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度包括:通过第二目标对象的第二评分材料的评估时间,与其他的目标对象的评分材料的评估时间,确定第二目标对象与其他的目标对象之间的时间距离;根据时间距离,第二目标对象的第二评分材料对评分点的评分,以及其他的目标对象对评分点的评分,确定评分点相似度。
[0054]
由于每个目标对象对评分点的打分可能存在不相同的情况,因此可以将评估时间引入对评分材料的评价中,通过第二目标对象的第二评估时间与其他的目标对象的评分材料的评估时间,可以确定第二目标对象与其他的目标对象之间的时间距离;根据时间距离,第二目标对象的第二评分材料对评分点的评分,以及其他的目标对象对评分点的评分,可以确定评分点相似度。
[0055]
具体的,在计算履职者评分相似度时分别引入“评分点流行度”和“时间跨度”的概念。因为每个履职者对每个评分点的打分不一样,因此,定义评分点的评分点流行度公式(3),因为评分点流行度脱离了时间距离的概念显得意义比较小,所以需要引入评价者“时间距离”的定义。时间距离定义如公式(4),因此本发明提出来一种考虑时间距离的评分点流行度相似度(即上述评分点相似度)计算算法如公式(5),公式(6)。
[0056]
对第二目标对象的评分引入评分点相似度的评价指标,达到了对第二目标对象评分进行进一步精确的目的,实现了提高对目标对象的评价精确性的技术效果。
[0057]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分包括:根据文本相似度的第一权重,和评分点相似度的第二权重,确定第一目标对象和第二目标对象的评分相似度;根据评分相似度和第一目标对象的总评分,确定第二目标对象的总评分。
[0058]
通过第二评分材料与第一评分材料的文本相似度,第二评分材料与其他目标对象
的评分材料的评分点相似度,以及第一目标对象的总评分,根据文本相似度的第一权重,评分点相似度的第二权重,确定第一目标对象和第二目标对象的评分相似度,根据评分相似度和第一目标对象的总评分,可以确定第二目标对象的总评分。
[0059]
根据文本相似度评分和评分点相似度,计算第二目标对象的总评分,达到了对目标对象进行综合评分的目的,实现了提高目标对象的评估结果准确性的技术效果。
[0060]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:确定第二目标对象在预设时间段内对每个评分点的得分,以及平均得分;通过稳定性分析模型,根据得分和平均得分,确定第二目标对象在预设时间段内对评分点的稳定性参数。
[0061]
根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,还可以对目标对象的的履职能力的稳定性进行分析,可以通过对第二目标对象在预设时间段内对每个评分点的得分,以及第二目标对象在预设时间段内每个评分点的平均得分对履职能力的稳定性进行分析,可以通过稳定性分析模型,根据评分点得分和评分点的平均得分,确定第二目标对象在预设时间段内对评分点的履职稳定性。
[0062]
具体的,对于每个时期被评价者分值我们会有一个履职稳定性分析:也即,在一定履职周期区间范围内评价者对于某个评分点的履职能力是否具有稳定性。如下是稳定性分析模型(stability_model)f(u,i)表示履职能力被评价者u,对评分点i的稳定性分析值。其中表示在履职评价时间内各个时间段对于评分点i的得分,表示该履职评价者在内对于评分点i的平均得分。通过此模型会对评价者履职周期内对于每个评分点履职能力的稳定性进行分析,f(u,i)的值越小表示履职能力评价者u对评分点i的职责履职能力越稳定。
[0063]
通过对第二目标对象的稳定性进行分析,达到了对目标对象进行稳定性评估的目的,实现了对目标对象的综合能力进行准确评估的技术效果。
[0064]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:将第二目标对象的总评分发送给包括第二目标对象的多个预设对象。
[0065]
可以将第二目标对象的总评分由系统通过邮件或其他分享方式发送给包括第二目标对象的多个预设对象,预设对象可以是参评机构的参评者,发送内容可以包括文本相似与评分有效率确定的总评分和履职能力稳定性分析要素等,方便参评者对近期全面风险管理进行总结,为后续提升全面风险管理能力提供引导。
[0066]
通过将第二目标对象的总评分发送给包括第二目标对象的多个预设对象,达到了让多个对象共同总结分析的目的,实现了目标对象间共同进步的技术效果。
[0067]
本技术实施例提供的目标对象评分方法,确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分的材料;根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度,其中,其他目标对象包括第一目标对象;根据文本相似度和评分点
相似度,以及第一目标对象的总评分,确定第二目标对象的总评分,通过已评分的第一目标对象的评分材料,利用第二目标对象与第一目标对象的评分材料的文本相似度和由目标对象评估时间确定的评分点相似度对第二目标对象进行总评分,达到了利用文本相似度以及评分点相似度对评分对象进行快速精确评分的目的,实现了提高履职能力评估效率以及评估质量的技术效果,进而通过本技术,解决了相关技术中银行经理的履职能力进行评估,存在准确性低,稳定性差的问题。
[0068]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0069]
需要说明的是,本技术还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
[0070]
本实施方式提供了一种融合稳定性分析的多维度全面风险履职能力智能评分方案,旨在建立完备的评分、评价体系,从“主动防”、“智能控”、“全面管”的角度,实现对各分行领导者“主体责任”、“管理责任”、“直接责任”等的客观评价方法。
[0071]
本实施方式建立了涵盖“信息收集层”、“数据整合层”、“智能评分层”、“结果视图层”的分层式架构系统。在“信息收集层”内建立管理制度、会议纪要、审议材料、风险报告、其他证明材料的收集流程;在“数据整合层”中按时间、机构分类存储各类证明材料;在“智能评分层”中设计评分分值、评分标准,建立“人工+智能”的评分体系;在“结果视图层”中展示各机构全面风险实施评价结果,支持分项评分结果展示,根据评分结果采用稳定性分析算法,对各机构的全面风险管理能力提升提出建议。
[0072]
图2是根据本技术实施方式提供的系统总体的示意图,如图2所示,本技术实施方式提供的系统具体分为“信息收集层”、“数据整合层”、“智能评分层”、“结果展示层”等切面。每一个切面层会对应不同的切分点,信息收集层主要是收集用户的基本信息,数据整合成用来存储多维度数据,方便参评者与被参评将来查询历史材料。智能评分层为该系统的核心主要分为人工打分和智能评分两个。智能评分采用算法评分和人工辅助评分的方式进行。
[0073]
图3是根据本技术实施方式提供的参评机构主要参评者参评材料的示意图,如图3所示,能够比较直观、简洁地看到履职能力被评价的文件提要总结、得分等主要信息。
[0074]
全面风险履职评价者可以为每个评分点建立一个或多个关键词,系统为每个关键词建立一个变量,如x1-x3,系统启动自动评分后,自动查找该项评分点的“内容提要”、“文件名”、“支持材料”等字段与关键词的匹配情况。对于支持材料内容,采用光学字符识别技术提取支持材料中的文本内容。
[0075]
一是人工评分。系统根据是否提供证明材料自动评分,参评者只要上传了证明材料人工给予评分,未上传证明材料不得分。
[0076]
二是智能+人工辅助评分。对于上传了证明材料的通过光学字符识别扫描证明材料的关键字,通过余弦相似度计算材料之间的相似度,通过相似度给予关联评分。例如,图4是根据本技术实施例提供的参评机构文档内容扫描结果的示意图,以清晰地看出文档内容的关键词,每个段落的关键点等内容,比如“风险管控”、“一道防线”、“二道防线”、“直接责任”等关键词进行标注。
[0077]
具体技术要点如下:
[0078]
关键词计算相似度的过程1:分词,2:去重合并3:计算特征值(tf-idf算法)4:特征向量化5:计算余弦相似度。
[0079]
(1)分词:因为上传的材料是中文,所以采用jieba分词(即结巴分词),通过dictionary(字典)对输入文本串生成一个有向无环图,按照字典dag{位置,[有效图的末尾索引]},根据有向无环图的生成的词切片,计算出每一种分词组合的最大概率,采用动态规划算法可以得到一个基于字典的每个词频率的最优解。
[0080]
(2)去重合并:对于分词后重复的词语进行删除、统计。
[0081]
(3)计算特征值:tf-idf算法(term frequency-inverse document frequency),即:“词频-逆文本频率”。由tf和idf两部分组成。tf(term frequency)为词频,当前文本中词出现的频率;idf(inverse document frequency)为一个词的权重,也即该词在所有文本中出现的频率,如果一个词在很多文本中出现,那么它的idf应该很低。将tf与idf相乘就得到一个tf-idf的数值。某个词对评价者上传的文本重要性越高tf-idf的值就越大。引入idf就避免词频作为权重过于简单。
[0082]
(4)特征向量化:对于被评价者上传的文本材料中的每句话进行转化成特征矩阵。从而为后续的余弦相似度计算做准备。
[0083]
(5)计算余弦相似度:计算特征向量之间的余弦相似度,从而得到评价者之间的相似程度,余弦相似度越大,表明相似程度越高。余弦相似度计算公式如下:
[0084][0085]
其中,cos(θ)履职评价者u对履职评价者v的余弦相似度,xi表示履职评价者u对评分点i的得分,yi表示履职评价者v对评分点i的得分,a表示履职评价者u的文本材料的特征向量,b表示履职评价者v的文本材料的特征向量。
[0086]
图5-1是根据本技术实施方式提供的一种被评价者评分点得分树状图,图5-2是根据本技术实施方式提供的另一种被评价者评分点得分树状图,如图5-1和图5-2所示,每个参评机构参评者对于每个评分点的具体得分情况,只有总行评价者有权限查看所有参评机构参评者的得分(如图5-1),每个具体的分行只能看到自己的得分情况(如图5-2)。
[0087]
图6是根据本技术实施方式提供的相似度关联打分算法流程图,如图6所示,为文本相似度的计算流程。
[0088]
举例说明:两个分行主要责任人得分计算公式为:scorei=sim《i,j》*scorej±
wi(公式2)。
[0089]
其中scorei为分行i得分,scorei是履职评价者所有的i个评分点的平均分值,sim《i,j》表示分行i和分行j之间的相似度。wi表示全面风险履职评价者根据其他数组维度所加的得分,wi可为0。
[0090]
例如:若分行a报送的材料关键字相似度与分行b报送的材料相似度为0.8,则sim《i,j》为0.8,分行a的得分为4分,则分行b=0.8*4=3.2。若全面风险履职评价者对系统智能评分不满意可以对wi进行客观打分。
[0091]
一种考虑时间距离的评分点流行度相似度(即上述评分点相似度)计算算法:
[0092]
众所周知,世界上所有事物之间都是相互影响,正如互不相干的两个人也存在可以忽略不计的万有引力,履职能力被评价者之间亦是如此。为缓解评分偏置,考虑到其他履职者对自身评分的影响,尽量减少评分误差,在计算履职者评分相似度时分别引入“评分点流行度”和“时间跨度”的概念。
[0093]
因为每个履职者对每个评分点的打分不一样,因此,定义评分点itemi的评分点流行度公式为:
[0094][0095]
其中,score
u,i
表示履职者u对评分点i的得分,为所有用户对某个评分i的打分之和,n为参与打分的履职者总和。
[0096]
因为评分点流行度流行度脱离了时间距离的概念显得意义比较小,所以需要引入评价者“时间距离”的定义。时间距离定义如下:
[0097]
td=|t
u,i-t
v,i
|
ꢀꢀꢀ
公式(4)
[0098]
其中为履职者u对评分点i的首次得分时间,表示履职者v对评分点i的首次得分时间。类比某物品的流行度随着时间的推移可能会逐渐减弱。
[0099]
因此本发明提出来一种考虑时间距离的评分点流行度相似度计算算法:
[0100][0101]
也即:
[0102][0103]
其中,item
u,i
表示履职评价者u对评分点i的得分,item
v,i
表示履职评价者v对评分点i的得分,n为评分点的数量。评分点的评分点流行度,td即上述评价者“时间距离”,和td在公式(4)和公式(5)中已经做了说明。
[0104]
数据多维度:
[0105]
文件类型维度:措施、制度、规定、会议纪要、分析报告、上会审议材料、邮件等。
[0106]
时间序列维度:参评机构历史报送过的所有材料,包括前期报送后又删除的材料。系统仅展示参评机构最新报送的材料。系统应记录每次更新评分点、参评机构更新报送资料、参评机构管理员、评价者管理员发起评分、汇总评分等操作的时间点。
[0107]
机构层级维度:系统应能记录负责报送材料的人员所属的机构层级。
[0108]
文件、时间、机构层级维度收集的材料可以作为评价者对参评机构被评价者进行
履职能力打分的辅助性参考。
[0109]
对于每个时期被评价者分值我们会有一个履职稳定性分析:也即,在一定履职周期区间范围内评价者对于某个评分点的履职能力是否具有稳定性。如下是稳定性分析模型(stability_model)。
[0110]
f(u,i)表示履职能力被评价者u,对评分点i的稳定性分析值。其中xi表示在履职评价时间[t1,tn]内各个时间段对于评分点i的得分,表示该履职评价者在[t1,tn]内对于评分点i的平均得分。通过此模型会对评价者履职周期内对于每个评分点履职能力的稳定性进行分析,f(u,i)的值越小表示履职能力评价者u对评分点i的职责履职能力越稳定。
[0111]
对于最后得分会由系统通过邮件方式自动推送给参评机构参评者,包括其中的履职能力稳定性分析等要素,对于每一个履职评分点,若之前被评价者评分高,经过一段时间的工作,采用智能评分模型得出的分数也同样高,表名该评价者在相对应的评分点工作方面履职能力强,履职能力稳定。反之履职能力比较弱,这样方便参评者对近期全面风险管理进行总结,为后续提升全面风险管理能力提供引导。
[0112]
表1为参评机构的履职规范表,如表1所示,方便总行和分行参评者进行查看履职规范情况。
[0113]
表1参评机构的履职规范表
[0114][0115]
本实施方式的优势在于不用评价者对上传材料的每个人都进行打分,对于关键字相似的可以进行关联打分,提高打分效率。稳定性分析有利于被评价者进行总结,进而提高履职能力。数据多维度进行评价避免采用单一维度为评价带来局限性。可以将此方法应用到不同的领域,例如:绩效考核评价系统。智能评分阶段若评价者主观意识系统评分与实际有差距,可以进行人工辅助打分。对于评价结果系统会通过邮件的形式通知给被评价者,从而完成了由数据收集、分析、建模、通知的全流程闭环。
[0116]
本实施方式解决了全面风险管理在各分支机构和附属机构的落地实施情况评价问题,提高全面风险管理者对金融风险防控的意识,通过前期信息收集到多维度数据整合,采用智能评分模型对被评价者的履职能力进行打分,并对于评分点相似的用户采用相似度计算模型进行关联打分,融合稳定性分析算法,对结果分数进行稳定性分析,为全面风险管理者加强后续加强风险防控提供支持。
[0117]
本技术实施例还提供了一种目标对象评分装置,需要说明的是,本技术实施例的目标对象评分装置可以用于执行本技术实施例所提供的用于目标对象评分方法。以下对本技术实施例提供的目标对象评分装置进行介绍。
[0118]
图7是根据本技术实施例的目标对象评分装置的示意图。如图7所示,该装置包括:文本相似度确定模块70,评分点相似度确定模块72,总评分确定模块74,下面对该装置进行详细说明。
[0119]
文本相似度确定模块70,确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分的材料;评分点相似度确定模块72,与上述文本相似度确定模块相连,根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度,其中,其他目标对象包括第一目标对象;总评分确定模块74,与上述评分点相似度确定模块相连,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分。
[0120]
本技术实施例提供的目标对象评分装置,通过文本相似度确定模块70确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分的材料;评分点相似度确定模块72根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度,其中,其他目标对象包括第一目标对象;总评分确定模块74根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分通过已评分的第一目标对象的评分材料,利用第二目标对象与第一目标对象的评分材料的文本相似度和由目标对象评估时间确定的评分点相似度对第二目标对象进行总评分,达到了利用文本相似度以及评分点相似度对评分对象进行快速精确评分的目的,实现了提高履职能力评估效率以及评估质量的技术效果,进而通过本技术,解决了相关技术中银行经理的履职能力进行评估,存在准确性低,稳定性差的问题。
[0121]
可选的,确定第一评分材料与第二评分材料之间的文本相似度之前,方法还包括:确定多个维度的评分点,并确定评分点评分的关键词;通过文字识别技术提取第一评分材料的第一文本;根据评分点的关键词,确定第一文本命中的关键词的数量和频率;根据命中的关键词的数量和频率确定第一目标对象对多个维度的评分点的评分;根据多个维度的评分点的评分,确定第一目标对象的评分。
[0122]
可选的,确定第一评分材料与第二评分材料之间的文本相似度包括:确定第一文本和第二评分材料的第二文本的词频特征;根据词频特征进行特征向量化,得到特征向量;根据第一文本和第二文本的特征向量,确定第一文本和第二文本的文本相似度。
[0123]
可选的,确定第一文本和第二文本的词频特征包括:对第一文本和第二文本进行
分词处理,得到多个分词,以及每个分词的词频率;对多个分词进行去重合并,得到处理后的分词;根据处理后的分词的词频率,采用词频-逆文本频率,确定第一文本和第二文本的词频特征。
[0124]
可选的,根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度包括:通过第二目标对象的第二评分材料的评估时间,与其他的目标对象的评分材料的评估时间,确定第二目标对象与其他的目标对象之间的时间距离;根据时间距离,第二目标对象的第二评分材料对评分点的评分,以及其他的目标对象对评分点的评分,确定评分点相似度。
[0125]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分包括:根据文本相似度的第一权重,和评分点相似度的第二权重,确定第一目标对象和第二目标对象的评分相似度;根据评分相似度和第一目标对象的总评分,确定第二目标对象的总评分。
[0126]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:确定第二目标对象在预设时间段内对每个评分点的得分,以及平均得分;通过稳定性分析模型,根据得分和平均得分,确定第二目标对象在预设时间段内对评分点的稳定性参数。
[0127]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:将第二目标对象的总评分发送给包括第二目标对象的多个预设对象。
[0128]
所述目标对象评分装置包括处理器和存储器,上述文本相似度确定模块70,评分点相似度确定模块72,总评分确定模块74等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0129]
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决了相关技术中银行经理的履职能力进行评估,存在准确性低,稳定性差的问题。
[0130]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
[0131]
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述目标对象评分方法。
[0132]
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述目标对象评分方法。
[0133]
如图8所示,本技术实施例提供了一种电子设备80,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分后得到的材料;根据第二评分材料的评估时间,确定第二目标对象的评分点相似度;根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分。
[0134]
可选的,确定第一评分材料与第二评分材料之间的文本相似度之前,方法还包括:确定多个维度的评分点,并确定评分点评分的关键词;通过文字识别技术提取第一评分材料的第一文本;根据评分点的关键词,确定第一文本命中的关键词的数量和频率;根据命中的关键词的数量和频率确定第一目标对象对多个维度的评分点的评分;根据多个维度的评分点的评分,确定第一目标对象的评分。
[0135]
可选的,确定第一评分材料与第二评分材料之间的文本相似度包括:确定第一文本和第二评分材料的第二文本的词频特征;根据词频特征进行特征向量化,得到特征向量;根据第一文本和第二文本的特征向量,确定第一文本和第二文本的文本相似度。
[0136]
可选的,确定第一文本和第二文本的词频特征包括:对第一文本和第二文本进行分词处理,得到多个分词,以及每个分词的词频率;对多个分词进行去重合并,得到处理后的分词;根据处理后的分词的词频率,采用词频-逆文本频率,确定第一文本和第二文本的词频特征。
[0137]
可选的,根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度包括:通过第二目标对象的第二评分材料的评估时间,与其他的目标对象的评分材料的评估时间,确定第二目标对象与其他的目标对象之间的时间距离;根据时间距离,第二目标对象的第二评分材料对评分点的评分,以及其他的目标对象对评分点的评分,确定评分点相似度。
[0138]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分包括:根据文本相似度的第一权重,和评分点相似度的第二权重,确定第一目标对象和第二目标对象的评分相似度;根据评分相似度和第一目标对象的总评分,确定第二目标对象的总评分。
[0139]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:确定第二目标对象在预设时间段内对每个评分点的得分,以及平均得分;通过稳定性分析模型,根据得分和平均得分,确定第二目标对象在预设时间段内对评分点的稳定性参数。
[0140]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:将第二目标对象的总评分发送给包括第二目标对象的多个预设对象。
[0141]
本文中的设备可以是服务器、pc、pad、手机等。
[0142]
本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:确定第一评分材料与第二评分材料之间的文本相似度,其中,第一评分材料为对第一目标对象进行评分后得到的材料,第一目标对象为已评分的目标对象,第二评分材料为对第二目标对象进行评分的材料;根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度,其中,其他目标对象包括第一目标对象;根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分。
[0143]
可选的,确定第一评分材料与第二评分材料之间的文本相似度之前,方法还包括:确定多个维度的评分点,并确定评分点评分的关键词;通过文字识别技术提取第一评分材料的第一文本;根据评分点的关键词,确定第一文本命中的关键词的数量和频率;根据命中
的关键词的数量和频率确定第一目标对象对多个维度的评分点的评分;根据多个维度的评分点的评分,确定第一目标对象的评分。
[0144]
可选的,确定第一评分材料与第二评分材料之间的文本相似度包括:确定第一文本和第二评分材料的第二文本的词频特征;根据词频特征进行特征向量化,得到特征向量;根据第一文本和第二文本的特征向量,确定第一文本和第二文本的文本相似度。
[0145]
可选的,确定第一文本和第二文本的词频特征包括:对第一文本和第二文本进行分词处理,得到多个分词,以及每个分词的词频率;对多个分词进行去重合并,得到处理后的分词;根据处理后的分词的词频率,采用词频-逆文本频率,确定第一文本和第二文本的词频特征。
[0146]
可选的,根据第二评分材料的评估时间,以及其他目标对象的评分材料的评估时间,确定第二目标对象与其他目标对象的评分点相似度包括:通过第二目标对象的第二评分材料的评估时间,与其他的目标对象的评分材料的评估时间,确定第二目标对象与其他的目标对象之间的时间距离;根据时间距离,第二目标对象的第二评分材料对评分点的评分,以及其他的目标对象对评分点的评分,确定评分点相似度。
[0147]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分包括:根据文本相似度的第一权重,和评分点相似度的第二权重,确定第一目标对象和第二目标对象的评分相似度;根据评分相似度和第一目标对象的总评分,确定第二目标对象的总评分。
[0148]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:确定第二目标对象在预设时间段内对每个评分点的得分,以及平均得分;通过稳定性分析模型,根据得分和平均得分,确定第二目标对象在预设时间段内对评分点的稳定性参数。
[0149]
可选的,根据文本相似度和评分点相似度,以及第一目标对象的总评分,确定第二目标对象的总评分之后,方法还包括:将第二目标对象的总评分发送给包括第二目标对象的多个预设对象。
[0150]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0151]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0152]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或
多个方框中指定的功能。
[0153]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0154]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0155]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
[0156]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0157]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0158]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0159]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1