用于电子商务虚假交易的识别方法、系统及电子商务系统与流程

文档序号:12804385阅读:270来源:国知局
用于电子商务虚假交易的识别方法、系统及电子商务系统与流程

本发明属于人工智能技术领域,具体涉及一种用于电子商务虚假交易的识别方法、系统及电子商务系统。



背景技术:

企业电子商务平台是建立在互联网上的管理环境,通过该平台进行商务活动保证商务顺利运营,区别于传统意义的平台,企业电子商务平台是虚拟的网络空间,它不受时间和空间的限制,具有高效性和直通性。电子商务平台不仅能对供应链上的各种资源进行优化整合,还能有效及时响应用户需求,挖掘用户潜在需求,能在链条的双向上创造价值。

但是,电子商务平台在提高交易效益的同时,也存在自身的一些缺陷,其中最重要的是线上虚假交易无法很好的识别,虚假交易不仅污染了真实的交易数据,也给加大了政府和企业的决策难度。例如,交易平台中的店家通过付款请人假扮顾客,用以假乱真的购物方式提高网店的排名和销量获取销量及好评吸引顾客,通过这种方式,网店可以获得较好的搜索排名以及改变店铺的信誉,平台企业以及消费者越来越难对这类店铺进行有效的识别。因此,虚假交易识别越来越成为电子商务平台亟需解决的重要问题之一。



技术实现要素:

本发明的目的之一在于克服以上缺点,提供一种用于识别电子商务订单中的虚假交易的方法。

为了解决上述技术问题,本发明提供了一种用于电子商务虚假交易的识别方法,包括以下步骤:

确定分析虚拟交易所需的特征,并计算所需的特征基准值;

基于所述分析虚拟交易所需的特征,生成虚假交易推理规则;

根据所述虚假交易推理规则,判断电子商务订单是否为虚假交易。

通过分析确定虚拟交易的特征属性,并根据特征属性形成一套完整的虚假交易推理规则,再根据推理规则对电子商务订单进行判断,可识别出虚假交易订单,便于对虚假订单进行后续处理,保证交易数据的真实性和可靠性。

进一步地,所述的用于电子商务虚假交易的识别方法,还包括以下步骤:

对判断为虚假交易的电子商务订单进行处理。

进一步地,所述的用于电子商务虚假交易的识别方法,还包括以下步骤:

通过重新计算所述分析虚拟交易所需的特征基准值和/或更新所述虚假交易推理规则,进行学习和优化。

本发明的方法可以通过不断地学习对知识库和推理规则库进行更新和优化,提高虚假交易识别的准确性。

进一步地,所述分析虚拟交易所需的特征基准值,是通过逻辑回归决策树算法进行计算,具体步骤为:

确定影响所述分析虚拟交易所需的特征的因素字段,利用因素字段构造树形图;

从树形图中的最底层进行逻辑回归分析,至下而上逐层汇总;

将回归汇总好的树进行保存;

更换因素字段的排列顺序,重新进行上述处理,直至所需的排列顺序都处理完成。

本发明技术方案通过采用逻辑回归决策树算法可以支持在某些因素字段为空时,可根据其他非空的因素字段信息技术特征基准值,增强基准值计算的兼容性。

相应地,本发明还提供了一种用于电子商务虚假交易的识别系统,包括:

第一处理模块,用于确定分析虚拟交易所需的特征,并计算所需的特征基准值;

第二处理模块,用于基于所述分析虚拟交易所需的特征,生成虚假交易推理规则;

第三处理模块,用于根据所述虚假交易推理规则,判断电子商务订单是否为虚假交易。

进一步地,所述的用于电子商务虚假交易的识别系统,还包括:

第四处理模块,用于对判断为虚假交易的电子商务订单进行处理。

进一步地,所述的用于电子商务虚假交易的识别系统,还包括:

第五处理模块,用于通过重新计算所述分析虚拟交易所需的特征基准值和/或更新所述虚假交易推理规则,进行学习和优化。

进一步地,所述分析虚拟交易所需的特征基准值,是通过逻辑回归决策树算法进行计算,具体步骤为:

确定影响所述分析虚拟交易所需的特征的因素字段,利用因素字段构造树形图;

从树形图中的最底层进行逻辑回归分析,至下而上逐层汇总;

将回归汇总好的树进行保存;

更换因素字段的排列顺序,重新进行上述处理,直至所需的排列顺序都处理完成。

相应地,本发明还提供了一种电子商务系统,包含上述的用于电子商务虚假交易的识别系统。

综上所述,本发明技术方案的有益效果有:

1.通过分析确定虚拟交易的特征属性,并根据特征属性形成一套完整的虚假交易推理规则,再根据推理规则对电子商务订单进行判断,可识别出虚假交易订单,便于对虚假订单进行后续处理,保证交易数据的真实性和可靠性。

2.可以通过不断地学习对知识库和推理规则库进行更新和优化,提高虚假交易识别的准确性。

3.通过采用逻辑回归决策树算法可以支持在某些因素字段为空时,可根据其他非空的因素字段信息技术特征基准值,增强基准值计算的兼容性。

附图说明

图1是本发明的一种用于电子商务虚假交易的识别方法步骤流程图。

图2是本发明的一种用于电子商务虚假交易的识别系统结构图。

图3是本发明的一种电子商务系统结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1,是本发明的一种用于电子商务虚假交易的识别方法步骤流程图,包括以下步骤:

步骤1、确定分析虚拟交易所需的特征,并计算所需的特征基准值;

电子商务通常是指在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于浏览器/服务器应用方式,买卖双方不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式,通常由平台、消费者、产品、物流等几大要素组成。

识别电子商务活动中的虚假交易记录是一个复杂的过程,涉及概率论、统计学、语义网络、推理系统等多门学科的知识内容。首先,需要确定哪些电子商务交易活动中的业务特征属性可以用于判断虚假交易,这些业务特征属性可以是交易过程中的任意信息,例如,用户信息,包括用户性别,电话,住址等;商品信息,包括商品名称,价格,受欢迎程度等;物流信息,包括收件地址,物流接收时间等。这类信息通常采用语义网络中的谓词逻辑进行描述,返回一个是或否的结果,例如:根据客户编号判断客户是否为黑名单,根据客户编号判断是否为女性顾客,根据商品编号判断是否为受欢迎的商品等等。

另外,判断虚假交易的特征属性还可以是统计汇总信息,例如,用户平均页面停留时间,用户平均咨询时间等,可以通过交易记录的历史信息进行汇总统计;但是在实际应用中,还有些特征值是无法通过直接计算得到的,例如,判断顾客在商品页面的停留时间是否为正常,不能简单地将停留时间与平均停留时间进行判断,而可能和顾客的性别有关,因为女性顾客停留时间会比男性顾客长;还可能和顾客访问的商品价值有关;还可能和顾客访问的时间段有关系等等。因此通常一个特征信息的基准值计算,会与其他若干个因素相关,这就需要用到概率学的方法。

在一具体的实施例中,本发明的用于电子商务虚假交易的识别方法,通过逻辑回归决策树算法计算分析虚拟交易所需的特征基准值,具体步骤为:

步骤101、确定影响所述分析虚拟交易所需的特征的因素字段,利用因素字段构造树形图;

决策树是使用类似于一棵树的结构来表示类的划分,树的构建是因素字段选择的过程,内部节点表示树选择哪几个因素字段作为划分,每棵树的叶节点表示为一个类的标号,树的最顶层为根节点。决策树算法属于有指导的学习,即原数据必须包含预测变量和目标变量。决策树分为分类决策树和回归决策树,本发明采用的是回归决策树。构造一棵决策树需要一个训练集,训练集是由一些例子组成,本发明中训练集为现有电子商务系统数据,包括交易数据,用户数据,产品数据,物流数据等等,每个例子用一些因素字段和一个目标特征基准值来描述。构造决策树的目的是找出因素字段和目标特征基准值间的关系,一旦这种关系找出,就能用它来预测将来未知类别的记录的类别。

使用逻辑回归研究某一现象的概率的大小,是一个二进制变量,只有是和否两个值,非常适合建立基准。例如,计算顾客在商品页面的停留时间是否为正常的基准值,先确定与其相关的因素:顾客性别,商品价格,顾客访问时间段,商品是否为受欢迎,并按照某一顺序构造回归树形图。通常,采用的因素字段越多,通过逻辑回归决策树预测的基准值越准确,同时生成决策树越大。

步骤102、从树形图中的最底层进行逻辑回归分析,至下而上逐层汇总;

通过从树形图叶子节点向上至根节点进行逻辑回归决策树的构造,即由叶子节点的各个因素字段汇总出根节点的特征基准值。步骤103、将回归汇总好的树进行保存;通常采用计算机某种数据结构方式存储在数据库。

步骤104、更换因素字段的排列顺序,重新进行上述处理,直至所需的排列顺序都处理完成。

在实际的应用场景中,可能存在因素字段值为空的情况,导致不能用所有的影响因素进行计算基准值,因为如果树形结构中某个根节点为空的话,就无法进行逻辑回归分析,例如,有的顾客没有登记性别信息,计算顾客在商品页面的停留时间是否为正常的基准值,就只能通过商品价格,顾客访问时间段,商品是否为受欢迎这几个影响因素进行计算。为解决这个问题,本发明的技术方案采用改变字段顺序构造回归树的方式进行处理,使得树形根节点均为非空值。另外,回归树的构造与影响因素的顺序有关,如果有n个影响因素与概率p相关,就总共可以构造n!个回归树,这在实际的应用中是不切实际的,例如,如果有10个因素字段,就可以构造10!个回归树,构造并存储全部的回归树将占用大量的存储空间,本发明的技术方案只对最常用的回归树进行存储,能够较好的实现存储与处理速度之间的平衡。

由于回归树的建立就是为了对一个具体的实例进行特征基准值的预测计算,在实际使用时候,根据具体实例的影响因素字段情况,选择合适的回归树进行基准值预测计算。

步骤2、基于所述分析虚拟交易所需的特征,生成虚假交易推理规则;

在确定了分析虚拟交易所需的特征之后,需要根据这些特征确定判断虚假交易的推理规则集合,由推理规则集合共同判断电子商务订单是否为虚假交易。例如,虚假交易的推理规则集合可以包括以下规则:如果顾客属于黑名单,那么所有交易均为虚假交易;如果商品重量很重并且物流费用很低,则为虚假交易;如果确认收货时间太短,则为虚假交易。同时,多条推理规则之间也可以存在推理的逻辑顺序。

步骤3、根据所述虚假交易推理规则,判断电子商务订单是否为虚假交易。

对于电子商务系统的每一笔订单,都必须通过本推理步骤进行虚假交易的判断,即按照每个推理规则公式,提取每笔订单的相应特征信息,得出推理结果从而判断是否为虚假交易。例如,对于推理规则:如果顾客属于黑名单,那么所有交易均为虚假交易,需要根据实际订单中的顾客信息,去电子商务平台的黑名单信息进行匹配查询,若能匹配,说明该顾客为黑名单用户,推理结果为:交易为虚假交易;又如,对于推理规则:如果商品重量很重并且物流费用很低,则为虚假交易,则提取订单商品的重量特征信息和物流费用特征信息,如果商品是重量大,并且物流费用低,则推理为虚假交易。其中,商品重量是否大以及物流费用是否低,均可以采用前述逻辑回归决策树算法进行计算基准值。

在一优选的实施例中,本发明的用于电子商务虚假交易的识别方法,还可以包括以下步骤:对判断为虚假交易的电子商务订单进行处理。例如,可以是对虚假交易订单进行取消和回滚操作;还可以是将这些虚假交易订单进行标识,平台的收入或交易报表数据过滤这部分数据,使得报表结果更加真实。

在另一优选的实施例中,本发明的用于电子商务虚假交易的识别方法,还包括以下步骤:通过重新计算所述分析虚拟交易所需的特征基准值和/或更新所述虚假交易推理规则,进行学习和优化。一方面,某些判断虚假交易的特征属性值是通过交易数据汇总出来的,如平均页面停留时间等,可根据新的交易记录进行重新计算;另一方面,某些判断虚假交易的特征属性值,例如,顾客在商品页面的停留时间是否为正常,若影响其的因素发生了变化,则需要重新采用逻辑回归决策树算法计算特征基准值;另外,用于判断是否为虚假交易的推理规则也并非一成不变,当有更加合理的推理规则时,也可更新至推理规则库,提高推理的准确性。

如图2,是本发明的一种用于电子商务虚假交易的识别系统结构图,包括:

第一处理模块,用于确定分析虚拟交易所需的特征,并计算所需的特征基准值;确定哪些电子商务交易活动中的业务特征属性可以用于判断虚假交易,这些业务特征属性可以是交易过程中的任意信息,还可以是统计汇总信息。

其中,分析虚拟交易所需的特征基准值,是通过逻辑回归决策树算法进行计算,具体步骤为:确定影响所述分析虚拟交易所需的特征的因素字段,利用因素字段构造树形图;从树形图中的最底层进行逻辑回归分析,至下而上逐层汇总;将回归汇总好的树进行保存;更换因素字段的排列顺序,重新进行上述处理,直至所需的排列顺序都处理完成。通过采用逻辑回归决策树算法可以支持在某些因素字段为空时,可根据其他非空的因素字段信息技术特征基准值,增强基准值计算的兼容性

第二处理模块,用于基于所述分析虚拟交易所需的特征,生成虚假交易推理规则;在确定了分析虚拟交易所需的特征之后,需要根据这些特征生成判断虚假交易的推理规则集合,由推理规则集合共同判断电子商务订单是否为虚假交易。具体的推理规则集合可以通过人为定义,也可以从现有的知识经验库导入。

第三处理模块,用于根据所述虚假交易推理规则,判断电子商务订单是否为虚假交易。对于电子商务系统的每一笔订单,都必须通过本模块进行虚假交易的判断,即按照每个推理规则公式,提取每笔订单的相应特征信息,得出推理结果从而判断是否为虚假交易。

在一优选的实施例中,本发明的用于电子商务虚假交易的识别系统,还包括:第四处理模块,用于对判断为虚假交易的电子商务订单进行处理。可以是对虚假交易订单进行取消和回滚操作;还可以是将这些虚假交易订单进行标识,报表数据过滤这部分数据。

在一优选的实施例中,本发明的用于电子商务虚假交易的识别系统,还可以包括:第五处理模块,用于通过重新计算所述分析虚拟交易所需的特征基准值和/或更新所述虚假交易推理规则,进行学习和优化,包括:重新汇总虚假交易的特征属性值;重新采用逻辑回归决策树算法计算特征基准值;更新推理规则集合。通过不断地学习对知识库和推理规则库进行更新和优化,提高虚假交易识别的准确性。

如图3,是本发明的一种电子商务系统结构图,包含本发明的用于电子商务虚假交易的识别系统。

例如,某一电子商务系统,包括了以下三个部分,客户端,平台系统以及本发明的用于电子商务虚假交易的识别系统。客户端主要为顾客访问提供支持,包括http网页客户端,pc端应用程序,智能设备(智能手机,平板电脑)app应用程序等。平台系统主要提供电子商务平台支撑,可以包含物流系统、订单系统,客户系统,股票系统,产品系统和评价系统等等子系统。通过包含本发明的用于电子商务虚假交易的识别系统,该电子商务平台可对虚假交易订单进行识别,具体方式为:第一处理模块,确定分析虚拟交易所需的特征,并通过连接平台系统获取交易信息,计算所需的特征基准值;第二处理模块,基于所述分析虚拟交易所需的特征,生成虚假交易推理规则;第三处理模块,根据所述虚假交易推理规则,判断每一笔电子商务订单是否为虚假交易,得出推理结果;第四处理模块,对判断为虚假交易的电子商务订单进行取消和回滚操作处理;第五处理模块,连接平台系统获取最新的交易数据,通过重新计算所述分析虚拟交易所需的特征基准值和/或更新所述虚假交易推理规则,进行学习和优化,提高后续推理的准确性。

总之,在任何需要对交易是否真实进行判断的电子商务平台,均可以使用本发明的用于电子商务虚假交易的识别系统。

上述具体实施方式只是对本发明的技术方案进行详细解释,本发明并不只仅仅局限于上述实施例,凡是依据本发明原理的任何改进或替换,均应在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1