一种计算设备、计算系统的制作方法

文档序号:16977526发布日期:2019-02-26 19:09阅读:182来源:国知局
一种计算设备、计算系统的制作方法

本发明涉及大数据分析领域,尤指一种计算设备、计算系统。



背景技术:

在金融或通信行业或者网络交易、出行系统中,大数据分析经常被用来对用户的潜在真实需求进行发掘,通过计算设备和计算系统对用户的账户信息数据进行分析,寻找特定的目标用户或者目标用户群,以实现对用户使用金融或通信服务行为的内在需求进行发掘,一方面为用户推荐更为个性化的服务需求,一方面可以识别部分用户的违法欺诈行为。

传统的推荐算法中,计算设备和计算系统通过对目标用户的信息进行一步步筛选过滤的方式进行分析,寻找与目标用户特征属性相近的用户,这种迭代分析过程复杂而繁琐,且当数据量到达一定程度,或复杂程度较高时,分析效率会变得较低。



技术实现要素:

本发明的目的是提供一种计算设备、计算系统,实现通过分析获取一个目标账户或多个目标账户组成的目标群,对全图数据中所有与目标账户有相同特征属性的账户进行相似度计算,获取与目标账户或目标账户组成的目标群最相似的账户或账户群。

本发明提供的技术方案如下:

本发明提供一种计算设备,包括:

至少一个处理器;以及

至少一个存储器,其包含计算机程序代码,所述至少一个存储器和所述计算机程序代码经配置以利用所述至少一个处理器使所述设备至少执行以下指令:

接收源数据,所述源数据包括用户的一个或多个基本信息和账户关联活动信息,其中所述用户的一个或多个基本信息包括用户的身份识别信息、用户身份相关的初始配置信息,所述初始配置信息包括用户的账户信息;

其中所述用户的一个或多个关联活动信息包括与用户的账户产生业务往来的账户信息;

对所述源数据进行分析,获取一个或多个目标账户;

将源数据转化为图数据存储在所述存储器中,所述图数据记录用户的一个或多个基本信息和账户关联活动信息;

对图数据中所述目标账户的特征属性信息进行提取;

根据所述提取出的特征属性,对图数据中所有账户进行筛选,得到与目标账户具有相同特征属性的账户;

对图数据中与所述目标账户具有相同特征属性的账户的特征属性信息进行提取;

通过相似度算法逐一将与所述目标账户具有相同特征属性的账户的特征属性信息与目标账户的特征属性信息进行相似度计算,得到相似度值;通过所述相似度值进行排序,将与目标账户相似程度最近的账户依次推荐给用户进行确认。

源数据指金融系统、通信系统(如支付宝、微信、qq等互动平台)、或网络交易系统(如淘宝、阿里巴巴等)或者出行系统等中已经存储的数据,包括用户的基本身份信息,如身份证号、账户名、账户数、各账户注册时间、各账户注册地点等已经被获取的数据,本发明不限制源数据的来源,任何存在大数据分析的数据平台,平台中的用户信息包括基本信息及活动信息都在本发明数据分析的对象之中;

计算机程序代码指存储于设备的存储器内的进行计算的程序代码,包括接收源数据、分析源数据、转化源数据为图数据、存储转化后的图数据、以及对图数据进行分析和计算的各种程序代码;

图数据指提取一个或多个包含用户的基本信息和账户关联活动信息转化形成的数据库,比如提取用户资金账户、转账金额及转出目标账户等属性信息形成的图数据库。

用户的基本信息指用户在原数据库中存储的一些原始数据信息,比如用户的用户名、身份信息、资金账户余额、手机账户余额,或基于原始数据库可以直接统计计算出的数据,如某时间段内资金账户余额变动次数、手机通话次数等。

用户的账户关联活动信息指用户在日常的经济、社交通信、出行或者网络交易中原始信息的更新信息,如更名记录、资金账户余额变动记录、资金账户转账记录、手机账户余额变动记录、手机通话记录等。

相似度计算指针对目标用户基本信息和/或关联活动的特征属性信息进行计算,获取与目标用户特征属性相同,属性信息相似的用户。

进一步地,在上述计算设备中,用户的源数据中的一个或多个基本信息可以包括:

所述用户的资金账户余额;

所述用户的资金账户历史额度信息,所述历史额度信息包括最高历史额度和最低历史额度。

历史额度信息指,从用户注册该资金账户开始,该账户中记录的具有明显特征的额度信息,如最高历史额度、最低历史额度等信息。

进一步地,在上述计算设备中,用户的源数据中的一个或多个和所述用户账户关联活动信息至少包括:

一个或多个与用户的资金账户产生业务往来的账户的基本信息,该信息指与用户账户有联系的第二到第n用户的账户信息;

一个或多个与用户的资金账户产生业务往来的账户的资金交易次数,该次数指用户与第二到第n用户的账户进行的交易的总次数;

一个或多个与用户的资金账户产生业务往来的账户的资金交易时间,该交易时间指用户与第二到第n用户的账户进行的每一次交易的时间;

一个或多个与用户的资金账户产生业务往来的账户的资金交易额度,该额度指用户与第二到第n用户的账户进行的每一次交易的额度,当额度为正时,为转入交易,当额度为负时,为转出交易;

一个或多个与用户的资金账户产生业务往来的账户的资金交易频率,该频率指用户与第二到第n用户的账户进行的预设时间段内交易的次数。

进一步地,在上述计算设备中,通过所述计算机程序对源数据进行分析,获取一个或多个目标账户包括:

通过选定的一个或多个账户基本信息对源数据进行分析,获取一个或多个目标资金账户,所选定的账户基本信息可以是特定的用户身份证号信息;和/或

通过选定一个或多个账户关联活动信息对源数据进行分析,获取一个或多个目标资金账户,所选定的账户关联活动信息可以是交易频率为某一特定值;

若获取的为包含多个目标资金账户的群,分析其各账户之间的连接关系,作为该群新的特征属性。所述连接关系可以是账户之间用户的人际关系。

进一步地,在上述计算设备中,将所述源数据转化为图数据存储在所述存储器中,所述图数据至少包括:

所有用户的资金账户和与其产生业务往来的账户的资金交易次数,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的次数等信息;

所有用户的资金账户和与其产生业务往来的账户的资金交易时间,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的时间等信息;

所有用户的资金账户和与其产生业务往来的账户的资金交易额度,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的资金额度等信息;

所有用户的资金账户和与其产生业务往来的账户的资金交易频率,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、预设时间段内交易的时间等信息。

进一步地,在上述计算设备中,所述通过计算机程序对图数据中目标账户的特征属性信息进行提取包括:

使用存储器中的计算机程序执行操作,对图数据中目标资金账户的特征属性信息进行提取,

其中所述目标账户的特征属性信息包括目标账户在图数据库中的图结构特征,和/或

用户的身份证号和/或开户日期和/或开户营业网点地址代码,和/或

与其产生业务往来的账户资金交易次数和/或时间和/或额度和/或频率。

具体地,通过目标特征提取算法(存储器中的计算机程序之一),对目标账户的特征属性信息进行计算,所述特征属性信息可以是上述任意特征属性信息的组合。

进一步地,在上述计算设备中,所述通过计算机程序对图数据中所有账户进行筛选,得到与目标账户具有相同特征属性的账户:

根据所述目标账户的特征属性筛选出与目标账户具有相同特征属性的账户,所述图数据中目标账户的特征属性包括用户的身份证号和/或开户日期和/或开户营业网点地址代码,和/或

与其产生业务往来的账户资金交易次数和/或时间和/或额度和/或频率。

具体地,根据上述目标账户的特征属性,将具有该特征属性的账户从图数据中筛选出来。然后采用目标账户的特征提取算法,对筛选出的账户的特征属性信息进行计算,所述特征属性信息可以是上述任意特征属性信息的组合。

进一步地,在上述计算设备中,通过所述计算机程序中的相似度算法逐一将与所述目标账户具有相同特征属性的账户的特征属性信息与目标账户的特征属性信息进行相似度计算,得到相似度值包括:

在包含提取的目标账户或账户群和与目标账户有相同属性特征的账户或账户群特征属性信息的图数据中,通过相似度算法进行计算,获得相似程度值,所述相似度算法包括但不限于欧几里得距离、曼哈顿距离、明可夫斯基距离、余弦相似度、调整余弦相似度、jaccard系数、皮尔森相关系数等可选。

进一步地,在上述计算设备中,通过相似度值进行排序,将与目标账户相似程度最近的账户依次推荐给用户进行确认还包括:

根据相似度值的大小,将与目标账户相似度值在一定区间范围内的用户账户推荐给用户确认。

进一步地,提供一种计算系统,其包括:

至少一个处理模块;以及

至少一个存储模块,其至少存储有接收源数据、处理源数据为图数据、提取特征属性数据、相似度计算等程序代码。

进一步地,在上述计算系统中,存储模块至少包括:

至少一个接收子模块,用以接收源数据

至少一个数据转化子模块,用于将接收子模块接收的源数据转为为图数据;

至少一个数据提取子模块,用于从数据转化子模块转化的图数据中提取目标账户特征属性信息;

至少一个相似度计算子模块,用于将目标账户与筛选出的与目标账户具有相同属性信息的账户进行相似度计算;

至少一个存储子模块,存储相似度计算子模块的相似度计算结果。

通过本发明提供的一种计算设备、计算系统,能够带来以下至少一种有益效果:

1、本发明中,通过将源数据转化为图数据,基于图数据对用户的特征信息进行提取,根据分析得到的目标用户特征属性信息,分析得到与目标用户有相似特征属性信息的用户,从而实现了输入源数据和目标用户,自动分析并获取与目标用户相似的其他用户,大大提高了数据分析的效率。

2、本发明中,通过对金融行业用户数据转化为图数据,并基于图数据对目标账户的特征属性信息进行提取,对全图中与目标账户拥有相同特征属性的用户进行特征属性星系提取,再计算两者的相似值,根据相似值排序得出与当前目标账户用户或用户群活动最相似的其他用户或用户群,再具体的金融系统反欺诈中,实现自动推荐与目标嫌疑人特征属性信息相似的用户,提高了经济犯罪侦查效率。

附图说明

下面将以明确易懂的方式,结合附图说明优选实施方式,对一种yy的上述特性、技术特征、优点及其实现方式予以进一步说明。

图1是本发明一种计算设备的一个实施例的结构示意图;

图2是本发明一种计算设备的另一个实施例的结构示意图。

具体实施方式

在金融或通信行业中,大数据分析经常被用来对用户的潜在真实需求进行发掘,通过计算设备和计算系统对用户的账户信息数据进行分析,寻找特定的目标用户或者目标用户群,以实现对用户使用金融或通信服务行为的内在需求进行发掘,一方面为用户推荐更为个性化的服务需求,一方面可以识别部分用户的违法欺诈行为。

传统的推荐算法中,计算设备和计算系统通过对目标用户的信息进行一步步筛选过滤的方式进行分析,寻找与目标用户特征属性相近的用户,这种迭代分析过程复杂而繁琐,且当数据量到达一定程度,或复杂程度较高时,分析效率会变得较低。

本发明体提供一种设备、一种系统,基于金融或通信行业的原始数据库,将数据库中的源数据转化为分析效率更高的图结构数据,通过分析获取目标用户后,对图数据中的目标用户信息特征、行为特征、图结构特征进行提取,获取其相应的特征属性信息,进一步地,对图数据库中与目标用户具有相同特征属性的用户也进行特征属性信息提取,并将其与目标用户的特征属性信息进行相似度计算,根据计算结果进行排序,获取与目标用户活动行为最相似的其他用户。本发明大大提高了用户数据分析效率,在金融或通信行业具有丰富的应用场景。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。

为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。

本发明第一实施例,如图1所示:

本发明提供至少一个处理器;一种计算设备,包括:

至少一个处理器;以及

至少一个存储器,其包含计算机程序代码,所述至少一个存储器和所述计算机程序代码经配置以利用所述至少一个处理器使所述设备至少执行以下指令:

接收源数据,所述源数据包括用户的一个或多个基本信息和账户关联活动信息,其中所述用户的一个或多个基本信息包括用户的身份识别信息、用户身份相关的初始配置信息,所述初始配置信息包括用户的账户信息;

其中所述用户的一个或多个关联活动信息包括与用户的账户产生业务往来的账户信息;

对所述源数据进行分析,获取一个或多个目标账户;

将源数据转化为图数据存储在所述存储器中,所述图数据记录用户的一个或多个基本信息和账户关联活动信息;

对图数据中所述目标账户的特征属性信息进行提取;

根据所述提取出的特征属性,对图数据中所有账户进行筛选,得到与目标账户具有相同特征属性的账户;

对图数据中与所述目标账户具有相同特征属性的账户的特征属性信息进行提取;

通过相似度算法逐一将与所述目标账户具有相同特征属性的账户的特征属性信息与目标账户的特征属性信息进行相似度计算,得到相似度值;通过所述相似度值进行排序,将与目标账户相似程度最近的账户依次推荐给用户进行确认。

源数据指金融系统、通信系统(如支付宝、微信、qq等互动平台)、或网络交易系统(如淘宝、阿里巴巴等)或者出行系统等中已经存储的数据,包括用户的基本身份信息,如身份证号、账户名、账户数、各账户注册时间、各账户注册地点等已经被获取的数据,本发明不限制源数据的来源,任何存在大数据分析的数据平台,平台中的用户信息包括基本信息及活动信息都在本发明数据分析的对象之中。该等数据只是其中的举例,并非限定为本发明的具体实施范围,本领域一般技术人员可以知道,任何可以图数据化的一个或者若干个数据,为了避免用户聚类分析,都可被涵盖于本发明的技术思想内。

计算机程序代码指存储于设备的存储器内的进行计算的程序代码,包括接收源数据、分析源数据、转化源数据为图数据、存储转化后的图数据、以及对图数据进行分析和计算的各种程序代码;

图数据指提取一个或多个包含用户的基本信息和账户关联活动信息转化形成的数据库,比如提取用户资金账户、转账金额及转出目标账户等属性信息形成的图数据库。

申请人特别指出的是,在金融系统或通信系统、出行系统、网络交易系统中用户账户的上述基本信息或者用户的关联活动信息只是其中的举例,并非限定为本发明的具体实施范围,本领域一般技术人员可以知道,任何可以图数据化的一个或者若干个数据,为了方便用户聚类分析,都可被涵盖于本发明的技术思想内。

用户的基本信息指用户在原数据库中存储的一些原始数据信息,比如用户的用户名、身份信息、资金账户余额、手机账户余额,或基于原始数据库可以直接统计计算出的数据,如某时间段内资金账户余额变动次数、手机通话次数等。

用户的账户关联活动信息指用户在日常的经济、通话等活动引起的账户中原始信息的更新信息,如更名记录、资金账户余额变动记录、资金账户转账记录、手机账户余额变动记录、手机通话记录等。

相似度计算指针对目标用户基本信息和/或关联活动的特征属性信息进行计算,获取与目标用户特征属性相同,属性信息相似的用户。

具体地,本发明中,通过设备中的对外接口获取源数据,所述的源数据可以是文本数据、社交数据、关系数据、实时流数据和系统日志等,源数据中包含的信息有用户的用户名、身份证号、账户名、账户数、各账户注册时间、各账户注册地点等数据。

通过对外接口获取源数据后,使用存储器中的相应的程序,对源数据进行分析,获取一个或多个目标用户。

通过对外接口获取源数据后,使用存储器中的相应的程序,对源数据进行转化,将其转化为图结构数据,并将图数据存储于存储器当中,在当前图数据中,用户的一个或多个基本信息和账户关联活动信息都被存储。例如,用户的账户名,用户账户关联的活动的具体内容,在一个实施例中,用户账户为手机账户,活动内容为通话,关联活动的目标账户为另一个手机账户,三个因素分别构成图数据的节点、边、终点。

设备完成源数据的导入和转化后,使用存储器中的特征提取程序,对图数据中目标用户的基本信息特征和关联活动信息特征进行提取,当目标用户为对各账户组成的群时,对群成员间的关系进行分析,并将这种关系特征化,记录为新的特征属性信息。

具体地,在第一实施例中,所述目标用户信息可以为用户的手机账号信息,那么,假设某个电信诈骗团伙中成员身份已经被确认,那么对源数据进行分析的过程,可以指定源数据库中用户的某一项已获知的属性对其进行定位,例如根据用户的身份证号信息查找到目标用户。

接下来,将该用户的通话时长、通话的目标账户、通话时间段、通话频率等作为特征属性,计算该用户的特征属性信息,然后将具有上述属性的所有用户从图数据库中筛选出来。随后,使用特征提取算法,将筛选出的用户或用户群的特征信息提取出来,并进行相似度计算,由此,实现根据一个已经分析出的目标用户或目标用户群特征信息,判段图数据中哪些用户可能和目标用户类似。

本发明第二个实施例,如图2所示,一种计算设备中,用户的源数据中的一个或多个基本信息可以包括:

所述用户的资金账户余额;

所述用户的资金账户历史额度信息,所述历史额度信息包括最高历史额度和最低历史额度。

历史额度信息指,从用户注册该资金账户开始,该账户中记录的具有明显特征的额度信息,如最高历史额度、最低历史额度等信息。

第二实施例中,在上述计算设备中,用户的源数据中的一个或多个和所述用户账户关联活动信息至少包括:

一个或多个与用户的资金账户产生业务往来的账户的基本信息,该信息指与用户账户有联系的第二到第n用户的账户信息;

一个或多个与用户的资金账户产生业务往来的账户的资金交易次数,该次数指用户与第二到第n用户的账户进行的交易的总次数;

一个或多个与用户的资金账户产生业务往来的账户的资金交易时间,该交易时间指用户与第二到第n用户的账户进行的每一次交易的时间;

一个或多个与用户的资金账户产生业务往来的账户的资金交易额度,该额度指用户与第二到第n用户的账户进行的每一次交易的额度,当额度为正时,为转入交易,当额度为负时,为转出交易;

一个或多个与用户的资金账户产生业务往来的账户的资金交易频率,该频率指用户与第二到第n用户的账户进行的预设时间段内交易的次数。

第二实施例中,在上述计算设备中,通过所述计算机程序对源数据进行分析,获取一个或多个目标账户包括:

通过选定的一个或多个账户基本信息对源数据进行分析,获取一个或多个目标资金账户,所选定的账户基本信息可以是特定的用户身份证号信息;和/或

通过选定一个或多个账户关联活动信息对源数据进行分析,获取一个或多个目标资金账户,所选定的账户关联活动信息可以是交易频率为某一特定值;

若获取的为包含多个目标资金账户的群,分析其各账户之间的连接关系,作为该群新的特征属性。所述连接关系可以是账户之间用户的人际关系。

第二实施例中,在上述计算设备中,将所述源数据转化为图数据存储在所述存储器中,所述图数据至少包括:

所有用户的资金账户和与其产生业务往来的账户的资金交易次数,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的次数等信息;

所有用户的资金账户和与其产生业务往来的账户的资金交易时间,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的时间等信息;

所有用户的资金账户和与其产生业务往来的账户的资金交易额度,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、交易的资金额度等信息;

所有用户的资金账户和与其产生业务往来的账户的资金交易频率,即是指转化后的图数据记录的数据为用户资金账户、用户交易的目标资金账户、预设时间段内交易的时间等信息。

第二实施例中,在上述计算设备中,所述通过计算机程序对图数据中目标账户的特征属性信息进行提取包括:

使用存储器中的计算机程序执行操作,对图数据中目标资金账户的特征属性信息进行提取,

其中所述目标账户的特征属性信息包括目标账户在图数据库中的图结构特征,和/或

用户的身份证号和/或开户日期和/或开户营业网点地址代码,和/或

与其产生业务往来的账户资金交易次数和/或时间和/或额度和/或频率。

具体地,通过目标特征提取算法(存储器中的计算机程序之一),对目标账户的特征属性信息进行计算,所述特征属性信息可以是上述任意特征属性信息的组合。在一个实施例中,采用node2vec算法对目标的图结构特征进行提取;在另一个实施例中,提取目标用户的开户时间、转账方向、用户身份证号等信息,计算在某一个预设时间内,开户时间相近、转账方向相近的用户并进行推荐。

第二实施例中,在上述计算设备中,所述通过计算机程序对图数据中所有账户进行筛选,得到与目标账户具有相同特征属性的账户:

根据所述目标账户的特征属性筛选出与目标账户具有相同特征属性的账户,所述图数据中目标账户的特征属性包括账户在图数据库中的图结构特征,和/或

用户的身份证号和/或开户日期和/或开户营业网点地址代码,和/或

与其产生业务往来的账户资金交易次数和/或时间和/或额度和/或频率。

具体地,根据上述目标账户的特征属性,将具有该特征属性的账户从图数据中筛选出来。然后采用目标账户的特征提取算法,对筛选出的账户的特征属性信息进行计算,所述特征属性信息可以是上述任意特征属性信息的组合,例如,在一个实施例中,采用node2vec算法对目标的图结构特征进行提取;在另一个实施例中,用户与一个或多个其他用户的账户发生交互,将其中的交易用的目标账户的身份信息、转账金额、次数、或时间和/或额度和/或频率作为特征属性进行特征信息提取,就可以得到与目标账户在身份信息、转账金额、次数、或时间和/或额度和/或频率相似的其他用户。

第二实施例中,在上述计算设备中,通过所述计算机程序中的相似度算法逐一将与所述目标账户具有相同特征属性的账户的特征属性信息与目标账户的特征属性信息进行相似度计算,得到相似度值包括:

在包含提取的目标账户或账户群和与目标账户有相同属性特征的账户或账户群特征属性信息的图数据中,通过相似度算法进行计算,获得相似程度值,所述相似度算法包括但不限于欧几里得距离、曼哈顿距离、明可夫斯基距离、余弦相似度、调整余弦相似度、jaccard系数、皮尔森相关系数等可选。

第二实施例中,在上述计算设备中,通过相似度值进行排序,将与目标账户相似程度最近的账户依次推荐给用户进行确认还包括:

根据相似度值的大小,将与目标账户相似度值在一定区间范围内的用户账户推荐给用户确认。

本发明第三实施例,提供一种计算系统,其包括:

至少一个处理模块;以及

至少一个存储模块,其至少存储有接收源数据、处理源数据为图数据、提取特征属性数据、相似度计算等程序代码。

进一步地,在上述计算系统中,存储模块至少包括:

至少一个接收子模块,用以接收源数据

至少一个数据转化子模块,用于将接收子模块接收的源数据转为为图数据;

至少一个数据提取子模块,用于从数据转化子模块转化的图数据中提取目标账户特征属性信息;

至少一个相似度计算子模块,用于将目标账户与筛选出的与目标账户具有相同属性信息的账户进行相似度计算;

至少一个存储子模块,存储相似度计算子模块的相似度计算结果。

具体地,本实施例为上述第一实施例的系统实施例,其原理相似,效果参见上述第一实施例,在此不作赘述。

应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1