本公开主要涉及风险控制,尤其涉及基于图像识别和图计算的风险群体识别方法和系统。
背景技术:
1、保险理赔、信贷业务申请延期、展期等操作中均会要求用户提供凭证材料作为佐证。然而,凭证材料种类繁杂并且来源于不同区域与机构,凭借人工识别难度极大。在信贷逾期以及通过非法方式骗取保险等场景中,往往出现凭证材料篡改/伪造的情况。识别异常材料的常规方式主要依赖人工专家审核、图片篡改识别、图片相似度判断等方式。随着对抗升级以及群体性行为方式的发生,人工经验逐渐失效。需要一种更有效的识别手段,该手段能够通过结合图像识别能力和图算法来实现快速异常发现与精准风险群体识别。
2、由此,期望提供一种改进的基于图像识别和图计算的风险群体识别方案。
技术实现思路
1、以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在标识出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是以简化形式给出一个或多个方面的一些概念以作为稍后给出的更详细描述之序言。
2、本公开提出了一种基于图像识别和图计算的风险群体识别方法,包括:获取待检测材料的图像;从该图像中提取该待检测材料的出具方和模版;获取提取到的出具方的历史材料;确定该待检测材料的模版与该历史材料的模版是否相似;如果该待检测材料的模版与该历史材料的模版不相似,则构建该待检测材料的用户的关系图;以及对该关系图进行聚类以识别出风险群体。
3、在本公开的一实施例中,该方法还包括:在提取该待检测材料的出具方和模版之前,对该待检测材料进行初始分类。
4、在本公开的一实施例中,从该图像中提取该待检测材料的出具方和模版是通过光学字符识别(ocr)来执行的。
5、在本公开的一实施例中,获取提取到的出具方的历史材料包括以下至少一者:获取提取到的出具方的所有历史材料;或获取提取到的出具方在预定时间段内的历史材料。
6、在本公开的一实施例中,确定该待检测材料的模版与该历史材料的模版是否相似进一步包括:确定该待检测材料的模版与该历史材料的模版的相似度;如果该相似度满足预设阈值,则该待检测材料的模版与该历史材料的模版相似;以及如果该相似度不满足该预设阈值,则该待检测材料的模版与该历史材料的模版不相似。
7、在本公开的一实施例中,确定该待检测材料的模版与该历史材料的模版是否相似是基于深度学习来执行的。
8、在本公开的一实施例中,该方法进一步包括:对识别出的风险群体进行交叉审核。
9、在本公开的一实施例中,该模版包括该待检测材料的主体内容、公章、版式。
10、本公开还提出了一种基于图像识别和图计算的风险群体识别系统,包括:图像获取模块,获取待检测材料的图像;提取模块,从该图像中提取该待检测材料的出具方和模版;历史材料获取模块,获取提取到的出具方的历史材料;模版相似确定模块,确定该待检测材料的模版与该历史材料的模版是否相似;关系图构建模块,其被配置成:如果该待检测材料的模版与该历史材料的模版不相似,则构建该待检测材料的用户的关系图;以及风险群体识别模块,对该关系图进行聚类以识别出风险群体。
11、在本公开的一实施例中,该系统还包括初始分类模块,其被配置成:在提取该待检测材料的出具方和模版之前,对该待检测材料进行初始分类。
12、在本公开的一实施例中,该模版相似确定模块还被配置成:确定该待检测材料的模版与该历史材料的模版的相似度;如果该相似度满足预设阈值,则该待检测材料的模版与该历史材料的模版相似;以及如果该相似度不满足该预设阈值,则该待检测材料的模版与该历史材料的模版不相似。
13、在本公开的一实施例中,该系统还包括交叉审核模块,其被配置成对识别出的风险群体进行交叉审核。
14、本公开还提出了一种计算机可读存储介质,其存储计算机程序,该计算机程序能被处理器执行以执行前述基于图像识别和图计算的风险群体识别方法。
15、本公开的技术方案在风险控制场景中结合了基于深度学习的图像异常识别能力与图计算能力,大幅减少了识别风险群体的关系网规模,提高了计算效率并大幅减少存储与算力成本。同时,通过后置专家审核,同时发挥了机器学习的自动化识别能力与人工的交叉对比分析能力,进一步提高了风险群体的识别准确性。
1.一种基于图像识别和图计算的风险群体识别方法,包括:
2.如权利要求1所述的方法,还包括:
3.如权利要求1所述的方法,从所述图像中提取所述待检测材料的出具方和模版是通过光学字符识别(ocr)来执行的。
4.如权利要求1所述的方法,获取提取到的出具方的历史材料包括以下至少一者:
5.如权利要求1所述的方法,确定所述待检测材料的模版与所述历史材料的模版是否相似进一步包括:
6.如权利要求1所述的方法,确定所述待检测材料的模版与所述历史材料的模版是否相似是基于深度学习来执行的。
7.如权利要求1所述的方法,进一步包括:对识别出的风险群体进行交叉审核。
8.如权利要求1所述的方法,所述模版包括所述待检测材料的主体内容、公章、版式。
9.一种基于图像识别和图计算的风险群体识别系统,包括:
10.如权利要求9所述的系统,还包括初始分类模块,其被配置成:在提取所述待检测材料的出具方和模版之前,对所述待检测材料进行初始分类。
11.如权利要求9所述的系统,所述模版相似确定模块还被配置成:
12.如权利要求9所述的系统,进一步包括交叉审核模块,其被配置成对识别出的风险群体进行交叉审核。
13.一种计算机可读存储介质,其存储计算机程序,所述计算机程序能被处理器执行以执行如权利要求1-8中任一项所述的方法。