一种网络交易分析方法及系统与流程

文档序号:19007212发布日期:2019-10-29 23:50阅读:178来源:国知局
本发明属于大数据风险控制
技术领域
:,具体来说,涉及一种网络交易分析方法及系统。
背景技术
::随着互联网购物的快速发展,越来越多的犯罪分子关注第三方支付平台。犯罪分子利用平台一些漏洞钻空子,盗取平台账号,盗取平台用户资金等等,给客户带来很大的损失。随着第三方支付平台的成长与壮大,会培养部分高质量高忠诚的客户,但同样的会有大量欺诈的行为。虽然第三方支付平台现有风险拦截系统能有效拦截异常交易,保护客户合法财产安全,但不可避免地将很多正常交易也拦下,影响了部分用户体验。怎样减少正常交易被拦截的概率,提高用户体验,是本领域技术人员面临的一个技术问题。技术实现要素:本发明实施例提供一种网络交易分析方法及系统,在不显著提升漏杀率的前提下,对部分被拦截交易进行放过,进而减少误杀,提升用户体验。为解决上述技术问题,本发明实施例采用以下技术方案:第一方面,本发明实施例提供一种网络交易分析方法,所述方法包括:采集样本数据,建立样本数据库;所述样本数据包括正常交易数据和非正常交易的案件数据;根据所述样本数据记录的交易指标,对交易进行可信级别划分,构建可信模型;将系统拦截的实时交易信息,输入所述可信模型中,计算所述实时交易是否属于高可信级别,若属于,则进行交易;若不属于,则进行交易拦截。结合第一方面,作为第一种可实现的方案,所述根据所述样本数据记录的交易指标,对交易进行可信级别划分,构建可信模型,包括:从所述样本数据记录的交易指标中筛选可信交易要素;根据关联规则,计算所述可信交易要素的可信指标;所述可信指标包括支持度、置信度与提升度;根据所述可信指标,将包含所述可信交易要素的交易进行可信级别划分,构建可信模型;可信级别包括高可信级别。结合第一方面的第一种可实现的方案,作为第二种可实现的方案,所述计算所述可信交易要素的可信指标,包括:对所述可信交易要素按照组合形式,计算可信指标。结合第一方面的第一种可实现的方案,作为第三种可实现的方案,所述计算所述可信交易要素的支持度过程为:设可信交易要素为m个,m为大于等于1的整数;设样本数据库中同时包含m个可信交易要素,对于一可信交易要素中的具体要素的正常交易数量为s′;设样本数据库中的交易总数量为s;支持度w1=s′/s。结合第一方面的第三种可实现的方案,作为第四种可实现的方案,所述计算所述可信交易要素的置信度过程为:设样本数据库中同时含有m个可信交易要素中的具体要素的交易数量为s1;置信度w2=s′/s1。结合第一方面的第四种可实现的方案,作为第五种可实现的方案,所述计算所述可信交易要素的提升度过程为:设样本数据库中正常交易量为n,提升度w3=w2/(n/s)。第二方面,本发明实施例提供一种网络交易分析系统,包括:构件模块:用于采集样本数据,建立样本数据库;根据所述样本数据记录的交易指标,对交易进行可信级别划分,构建可信模型;可信模型:用于对系统拦截的实时交易信息,计算所述实时交易是否属于高可信级别,若属于,则进行交易;若不属于,则进行交易拦截。结合第二方面,作为第一种可实现的方案,所述构件模块,包括:采集单元:用于采集样本数据,建立样本数据库;所述样本数据包括正常交易数据和非正常交易的案件数据;筛选单元:用于从所述样本数据记录的交易指标中筛选可信交易要素;计算单元:用于根据关联规则,计算所述可信交易要素的可信指标;所述可信指标包括支持度、置信度与提升度;划分单元:用于根据所述可信指标,将可信交易要素进行可信级别划分,可信级别包括高可信级别。结合第二方面第一种可实现的方案,作为第二种可实现的方案,所述计算单元:具体用于对所述可信交易要素按照组合形式,计算可信指标。结合第二方面第一种可实现的方案,作为第三种可实现的方案,所述计算单元:具体用于根据下述方法计算支持度:设可信交易要素为m个,m为大于等于1的整数;设样本数据库中同时包含m个可信交易要素,对于一可信交易要素中的具体要素的正常交易数量为s′;设样本数据库中的交易总数量为s;支持度w1=s′/s。结合第二方面第一种可实现的方案,作为第四种可实现的方案,所述计算单元:具体用于根据下述方法计算置信度:设样本数据库中同时含有m个可信交易要素中的具体要素的交易数量为s1;置信度w2=s′/s1。结合第二方面第一种可实现的方案,作为第五种可实现的方案,所述计算单元:具体用于根据下述方法计算提升度:设样本数据库中正常交易量为n,提升度w3=w2/(n/s)。与现有技术相比,本发明实施例的网络交易分析方法及系统,在不显著提升漏杀率的前提下,对部分被拦截交易进行放过,进而减少误杀,提升用户体验。该实施例的方法中,首先,根据样本数据记录的交易指标,对交易进行可信级别划分,构建可信模型;然后,将系统拦截的实时交易信息,输入所述可信模型中,计算所述实时交易是否属于高可信级别,若属于,则进行交易;若不属于,则进行交易拦截。该方法对被系统拦截的实时交易进行判断,是否属于高可信级别的交易,如果属于,则允许进行交易。该方法能够大幅降低正常交易被风险系统误拦的概率,降低对客户的打扰率,减少误杀,并提升风控准确率,从而提升用户体验。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本发明实施例提供的系统架构示意图;图2是本发明实施例提供的方法流程框图;图3是本发明实施例的方法中步骤10)的流程框图;图4是在整个网络交易流程中产生的交易指标示例图;图5是本发明实施例中,交易级别划分示例图;图6是本发明实施例提供的具体实例的结构框图。具体实施方式为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本
技术领域
:技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本
技术领域
:技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。现有的网络平台交易中通常设有风险控制系统。该风险控制系统对可疑交易进行拦截。虽然该系统可以拦截异常交易,但是对部分正常交易也进行了拦截。本发明实施例结合大数据和关联分析技术,根据已有正常交易以及案件交易,根据交易的相关信息要素衡量,给定交易的可信度。对于被系统拦截的高可信交易予以放行。本发明实施例可以实现在一种如图1所示的系统中。该系统包括用户终端、交易平台、可信模型、交易信息数据库。用户终端,具体可以为单独一台系统,或整合于各种不同的媒体数据播放系统中,诸如智能手机、平板电脑(tabletpersonalcomputer)、膝上型电脑(laptopcomputer)或者个人数字助理(personaldigitalassistant,简称pda)等。用户终端上可以通过安装的应用程序(比如浏览器)或者app,来加载并显示网页,由用户终端访问的网页,具体可以是业务系统(比如网购平台、促销网站、金融营销平台等)向用户展示的页面,这些页面可以由运行业务系统的服务器系统运行,也可以由系统中的服务器设备运行,即所述服务器设备可以集成在运行业务系统的服务器系统中。交易平台可以是单独的服务器设备,比如:机架式、刀片、塔式或者机柜式的服务器设备,也可以采用工作站、大型计算机等具备较强计算能力硬件设备;也可以是由多个服务器设备组成的服务器集群。交易平台用于进行网络交易。可信模型可以是单独的服务器设备,也可以集成在交易平台的服务器系统中。可信模型用于对被拦截的实时交易进行判断,是否属于高可信级别。交易信息数据库用于存储并管理历史交易数据。数据库系统具体可以是单独作成的,用于数据的管理、存储的服务器设备,也可以是由多个服务器设备组成的服务器集群。在数据库系统的硬件设备上运行对应服务器设备的数据库,用于管理并存储服务器设备的数据。具体可以采用常用的网状数据库(networkdatabase)、关系数据库(relationaldatabase)、树状数据库(hierarchicaldatabase)、面向对象数据库(object-orienteddatabase)以及新一代大数据系统架构。上述系统中,可信模型根据交易信息数据库中的历史交易数据,构件模型,并对被交易平台拦截的交易进行判断,是否属于高可信交易。本发明实施例的一种网络交易分析方法,如图2所示,包括:s10采集样本数据,建立样本数据库;所述样本数据包括正常交易数据和非正常交易的案件数据;根据所述样本数据记录的交易指标,对交易进行可信级别划分,构建可信模型;s20将系统拦截的实时交易信息,输入所述可信模型中,计算所述实时交易是否属于高可信级别,若属于,则进行交易;若不属于,则进行交易拦截。上述实施例的方法,对系统拦截的实时交易信息并非全部拦截,禁止交易。该方法通过对被拦截的实时交易信息,进行分析,判断该实时交易信息是否属于高可信级别。如属于高可信级别,则放弃拦截,允许进行交易。如不属于高可信级别,则进行交易拦截。上述方法,对被系统拦截的实时交易信息再次进行分析,并根据分析结果,对属于高可信级别的实时交易,不再拦截,允许交易。这利于确保正常交易的进行,提升用户体验。步骤s10中,样本数据包括正常交易数据和非正常交易的案件数据。将数据分为两类,一类是正常交易数据,另一类是非正常交易数据。非正常交易数据作为案件数据。这两类数据可来源于内部,也可来源于外部。将采集的两类数据加入数据库中。另外,样本数据可更新,以提高可信模型分析的精准度。例如,当实时交易结束后,无论是正常交易,还是非正常交易,都可将该次交易数据存入样本数据中。样本数据中的信息数据来源包含但不限于以下数据来源:订单详细信息、支付详细信息、收货地址信息、交易主体的设备指纹信息、注册信息。上述实施例的方法通过构建可信模型,对被系统拦截的实时交易信息进行分析。作为优选例,如图3所示,所述构建可信模型,包括:s101从所述样本数据记录的交易指标中筛选可信交易要素。步骤s101中,可信交易要素是在系统记录的交易指标中,最具用户标识性的交易指标。随着技术的发展,在一笔交易发生的同时,交易系统会记录很多的交易指标。如图4所示,在整个网络交易流程中可能产生的交易指标示例。作为优选例,将地址、手机号、身份证号、银行卡号、ip地址、wifimac、设备号、邮箱作为可信交易要素。随着技术发展,在构建可信模型时,采用的可信交易要素会改变。s102根据关联规则,计算所述可信交易要素的可信指标。在确定可信交易要素之后,根据关联规则,对单独可信交易要素以及组合可信交易要素分别计算其可信指标。可信指标包括支持度、置信度与提升度。优选的,对所述可信交易要素按照组合形式,计算可信指标。组合要素的最高可信数据的使用要优于单独要素使用。组合要素相互之间可相互支持,减少误杀,提升风控拦截准确率,以最大程度提升用户体验。优选的,计算支持度的方法为:设可信交易要素为m个,m为大于等于1的整数。设样本数据库中同时包含m个可信交易要素,对于一可信交易要素中的具体要素的正常交易数量为s′;设样本数据库中的交易总数量为s;支持度w1=s′/s。当m为1时,表示可信交易要素为一个。当m大于1时,表示可信交易要素为多个。要素是交易过程中能收集到的体现用户特征属性的要素。具体要素是能够具体体现用户特征属性的要素,比如交易的设备号、ip地址、手机号等。优选的,计算置信度的方法为:设样本数据库中同时含有m个可信交易要素中的具体要素的交易数量为s1;置信度w2=s′/s1。优选的,计算提升度的方法为:设样本数据库中正常交易量为n;提升度w3=w2/(n/s)。下面举一实例,说明支持度、置信度和提升度的计算过程。设手机号a交易了8次,一次案件。地址b交易12次,一次案件。手机a+地址b同时出现6次,没有案件。设数据库中总交易次数为20,正常交易数量为18。(1)将地址b和手机a作为可信交易要素,即组合要素作为可信交易要素:支持度w1=6/20=0.3置信度w2=6/6=1提升度w3=1/(18/20)=1.11(2)将手机a作为可信交易要素,即单要素作为可信交易要素:支持度w1=7/20=0.35置信度w2=7/8=0.875提升度w3=0.875/0.9=0.972。设置信度阈值为0.1,大于阈值为高置信度,否则为低置信度。提升度阈值为1,大于阈值为高提升度,否则为低提升度。支持度根据二八阀值,由高到底排序,前5%为高,5%-20%中,低于20%则低。综上,将地址b和手机a作为可信交易要素的交易,为高置信度、高提升度。如果支持度进入前5%,则该交易属于高可信级别,允许交易。将手机a作为可信交易要素的交易,为高置信度、低提升度。即使该交易的支持度进入前5%,则该交易也不属于高可信级别,交易被拦截。从上述实例可以看出,组合多个可信交易要素进行可信指标的计算,能够更准确反映交易的风险,防止交易被错误拦截。s103根据所述可信指标,将包含所述可信交易要素的交易进行可信级别划分,可信级别包括高可信级别。通过可信指标,将交易分为若干级别。所述级别包括高可信级别。当可信交易要素对应的交易属于高可信级别,则系统允许该交易进行。作为优选例,如图5所示,将交易分为五个级别,分别为高不可信级别、低不可信级别、低可信级别、中可信级别与高可信级别。具体来说,根据提升度与置信度将交易分为四类,再通过支持度细分:低置信低提升:案件率较高,可设为高危名单;高置信低提升与低置信高提升:有正常交易也有案件,可视为灰名单;高置信高提升:该部分量较大,且未发生过案件,对于此类交易,再通过支持度将此类别交易按照高支持度、中支持度与低支持度划分为三类。分类的可信度由高到低分别为:50分:高置信度+高提升度+高支持度;40分:高置信度+高提升度+中支持度;30分:高置信度+高提升度+低支持度;20分:高置信度+低提升度与低置信度+高提升度;10分:低置信度+低提升度;对于可信交易要素的度量方式,可自由配置可信交易要素的判断标准,自由设置度量阈值。置信度、提升度和支持度均是根据设定的阈值进行划分属于高级别还是低级别。高不可信级别对应分值10,低不可信级别对应分值20,低可信级别对应分值30,中可信级别对应分值40,高可信级别对应分值50。目前,采用风控手段在拦截高危账户交易的同时,会带来正常账户的错误拦截。为了减少对正常账户交易的拦截,通过对特定交易要素进行案件的关联分析,将可信交易要素分为几大类,对属于高可信的交易不再拦截,允许交易顺利进行,以减少正常交易的错误拦截。上述实施例的方法中,结合了大数据和关联分析技术,将关联分析技术应用于风险控制领域。上述实施例的方法,用于对被系统拦截的交易进行分析,有助于降低误杀,减少对正常用户的使用打扰,并能降低风险审核人员的工作量,提高风险拦截的准确性。交易可信度的衡量方法是综合考虑支付全场景下最具代表性的可信交易要素,计算可信交易要素的支持度、提升度和置信度。对单维度要素以及组合要素进行评判,将最可信的部分作为降低错误拦截的依据。该方法将对交易风险控制带来如下的技术效果:可以得到多种最具用户标识性的可信交易要素,可信交易要素之间可以进行相互组合成更有效的组合要素。单维度要素与组合要素都可作用于实际生产。组合要素也避免了单要素的片面性,能最大程度识别被误杀的正常交易。另外,分别计算单交易要素与组合交易要素的可信度,可信度最好部分可认为低风险客户,再被误拦的时候予以放过,以减少对正常交易的打扰,提升用户体验。如图6所示,本发明实施例还提供一种网络交易分析系统,包括:构件模块:用于采集样本数据,建立样本数据库;所述样本数据包括正常交易数据和非正常交易的案件数据;根据所述样本数据记录的交易指标,对交易进行可信级别划分,构建可信模型。可信模型:用于对系统拦截的实时交易信息,计算所述实时交易是否属于高可信级别,若属于,则进行交易;若不属于,则进行交易拦截。上述实施例的系统,对被拦截的实时交易信息并非全部拦截,禁止交易。该系统通过可信模型对被拦截的实时交易信息,进行分析,判断该实时交易信息是否属于高可信级别。如属于高可信级别,则放弃拦截,允许进行交易。如不属于高可信级别,则进行交易拦截。这利于确保正常交易的进行,提升用户体验。作为优选例,所述构建模块,包括:采集单元:用于采集样本数据,建立样本数据库;所述样本数据包括正常交易数据和非正常交易的案件数据;筛选单元:用于从所述样本数据记录的交易指标中筛选可信交易要素;计算单元:用于根据关联规则,计算所述可信交易要素的可信指标;所述可信指标包括支持度、置信度与提升度;划分单元:用于根据所述可信指标,将可信交易要素进行可信级别划分,可信级别包括高可信级别。优选的,计算单元,对所述可信交易要素按照组合形式,计算可信指标。多个可信交易要素组合起来,进行可信指标的计算,能够更加准确为交易进行级别划分。在上述计算单元中,根据下述方法计算支持度、置信度和提升度:设可信交易要素为m个,m为大于等于1的整数;样本数据库中同时包含m个可信交易要素,对于一可信交易要素中的具体要素的正常交易数量为s′;设样本数据库中同时含有m个可信交易要素中的具体要素的交易数量为s1;设样本数据库中的交易总数量为s;设样本数据库中正常交易量为n。支持度w1=s′/s。置信度w2=s′/s1。提升度w3=w2/(n/s)。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。本领域技术人员应该知晓,实现上述实施例的方法或者系统,可以通过计算机程序指令来实现。该计算机程序指令装载到可编程数据处理设备上,例如计算机,从而在可编程数据处理设备上执行相应的指令,用于实现上述实施例的方法或者系统实现的功能。本领域技术人员依据上述实施例,可以对本申请进行非创造性的技术改进,而不脱离本发明的精神实质。这些改进仍应视为在本申请权利要求的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1