订单识别方法、装置和可读存储介质与流程

文档序号:16040842发布日期:2018-11-24 10:27阅读:234来源:国知局

本公开涉及电子技术领域,尤其涉及一种订单识别方法、装置和可读存储介质。

背景技术

随着电子技术的发展,电子商务越来越普及,电子购物平台上的各种营销手段越来越丰富。比如,将商品定价为较低的价格,并在一个指定的时间点开放购买。在这种情况下,会出现一些异常订单,该异常订单对应的购买行为违背活动规则,例如,通过抢单软件等方式在电子购物平台上抢购低价商品,再以高价卖出。这些异常订单对应的购买行为严重影响了其他具有真实购买意图的用户的利益。因此,需要对订单进行识别。

相关技术中,通过待识别订单使用的终端的网络互联协议(ip,internetprotocol)地址对待识别订单进行识别。例如,如果曾经有违规购买行为的订单使用过该ip地址,则将该待识别订单确定为异常订单。



技术实现要素:

本公开提供一种订单识别的方法、装置和可读存储介质,以克服相关技术中存在的问题。所述技术方案如下:

一方面,本公开提供一种订单识别方法,包括:获取待识别订单的地址信息;将所述待识别订单的地址信息转换成向量;调用目标神经网络模型对所述向量进行处理,得到所述待识别订单是否为异常订单的识别结果,所述目标神经网络模型基于订单样本进行训练得到。

可选地,所述将所述待识别订单的地址信息转换成向量,包括:将所述待识别订单的地址信息进行文本切分,基于所述文本切分后的结果得到字符集合;基于所述字符集合得到所述待识别订单的地址信息对应的向量。

可选地,所述基于所述文本切分后的结果得到字符集合包括:将所述文本切分后的结果中的特殊字符和数字字符剔除得到字符集合。

在一种可能的实现方式中,所述方法还包括:获取订单样本;根据所述订单样本获取地址样本;将所述地址样本转换成向量;采用所述地址样本对应的向量训练神经网络模型,得到所述目标神经网络模型。

可选地,所述地址样本包括地址负样本,所述根据所述订单样本获取地址样本,包括:当所述订单样本的地址信息包括异常地址词条时,将所述订单样本的地址信息作为地址负样本。

可选地,所述地址样本包括地址负样本,所述根据所述订单样本获取地址样本,包括:采用地图应用程序对所述订单样本的地址信息进行检索,当检索结果不存在或检索结果与所述订单样本的地址信息的相似度未达到相似度阈值时,将所述订单样本的地址信息作为地址负样本。

可选地,所述地址样本包括地址负样本,所述根据所述订单样本获取地址样本,包括:当所述订单样本对应的对象的选中时间与所述对象的购买时间间隔未满足第一时间间隔阈值时,将所述订单样本的地址信息作为地址负样本。

可选地,所述地址样本包括地址负样本,所述根据所述订单样本获取地址样本,包括:当所述订单样本对应的对象的收取时间信息与所述对象的激活时间间隔未满足第二时间间隔阈值时,将所述订单样本中的地址信息作为地址负样本。

可选地,所述地址样本包括地址正样本,所述根据所述订单样本获取地址样本,包括:当所述订单样本对应的对象的收取时间信息与所述对象的激活时间间隔满足第三时间间隔阈值时,将所述订单样本中的地址信息作为地址正样本。

可选地,所述地址样本包括地址正样本,所述根据所述订单样本获取地址样本,包括:当所述订单样本对应的用户账号在用户账号白名单中时,将所述订单样本中的地址信息作为地址正样本。

另一方面,本公开提供一种订单识别装置,所述装置包括:地址获取模块,被配置为获取待识别订单的地址信息;转换模块,被配置为将所述待识别订单的地址信息转换成向量;识别模块,被配置为调用目标神经网络模型对所述向量进行处理,得到所述待识别订单是否为异常订单的识别结果,所述目标神经网络模型基于订单样本进行训练得到。

可选地,所述转换模块,被配置为,基于所述文本切分后的结果得到字符集合。

可选地,所述转换模块,被配置为,将所述待识别订单的地址信息进行文本切分,并将文本切分后的结果中的特殊字符和数字字符剔除得到字符集合;基于所述字符集合得到所述待识别订单的地址信息对应的向量。

在一种可能的实施方式中,所述装置还包括:样本获取模块,被配置为获取订单样本;地址样本获取模块,被配置为根据所述订单样本获取地址样本;样本向量转换模块,被配置为将所述地址样本转换成向量;训练模块,被配置为采用所述地址样本对应的向量训练神经网络模型,得到所述目标神经网络模型。

可选地,所述地址样本包括地址负样本,所述地址样本获取模块,被配置为,当所述订单样本的地址信息包括异常地址词条时,将所述订单样本的地址信息作为地址负样本。

可选地,所述地址样本包括地址负样本,所述地址样本获取模块,被配置为,采用地图应用程序对所述订单样本的地址信息进行检索,当检索结果不存在或检索结果与所述订单样本的地址信息的相似度未达到相似度阈值时,将所述订单样本的地址信息作为地址负样本。

可选地,所述地址样本包括地址负样本,所述地址样本获取模块,被配置为,当所述订单样本对应的对象的选中时间与所述对象的购买时间间隔未满足第一时间间隔阈值时,将所述订单样本的地址信息作为地址负样本。

可选地,所述地址样本包括地址负样本,所述地址样本获取模块被配置为,当所述订单样本对应的对象的收取时间信息与所述对象的激活时间间隔未满足第二时间间隔阈值时,将所述订单样本中的地址信息作为地址负样本。

可选地,所述地址样本包括地址正样本,所述地址样本获取模块,被配置为,当所述订单样本对应的对象的收取时间信息与所述对象的激活时间间隔满足第三时间间隔阈值时,将所述订单样本中的地址信息作为地址正样本。

可选地,所述地址样本包括地址正样本,所述地址样本获取模块,被配置为,当所述订单样本对应的用户账号在用户账号白名单中时,将所述订单样本中的地址信息作为地址正样本。

另一方面,本公开提供一种订单识别装置,所述装置包括:

处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为上述第一方面所述的任一项方法的步骤。

另一方面,本公开提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现上述第一方面所述的任一项方法的步骤。

本公开提供的技术方案至少包括以下有益效果:

本公开通过基于订单样本训练得到目标卷积神经网络模型,使其具有识别不同特征的待识别订单的能力,从而调用该模型对由待识别订单的地址信息转换的向量进行处理得到识别结果,避免了基于单一特征对待识别订单进行识别导致的误判问题。

此外,通过对订单样本的更新以及使用其对目标卷积神经网络模型的训练,可以实现该目标卷积神经网络模型对待识别订单的识别能力的更新,使得本公开提供的方案具有更强的后向兼容性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1是根据本公开实施例提供的一种卷积神经网络模型的原理示意图;

图2是根据本公开一个实施例提供的一种订单识别方法的流程图;

图3是根据本公开一个实施例提供的一种订单识别方法的流程图;

图4是根据本公开一个实施例提供的一种订单识别装置的框图;

图5是根据本公开一个实施例提供的一种订单识别装置的框图;

图6是根据本公开一个实施例提供的一种订单识别装置的框图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。

在对本公开实施例进行详细的解释说明之前,先对本公开实施例涉及的应用场景予以介绍。

随着电子技术的发展,电子商务越来越普及,电子购物平台上的各种营销手段越来越丰富。比如,将商品定价为较低的价格,并在一个指定的时间点开放购买。在这种情况下,会出现一些异常订单,该异常订单对应的购买行为违背活动规则。例如,通过抢单软件等方式在电子购物平台上抢购低价商品,再以高价卖出。这些异常订单对应的购买行为严重影响了其他具有真实购买意图的用户的利益。因此,需要对这类异常订单进行识别。

一般地,异常订单和正常订单都具有一些特征,可以基于异常订单的特征和正常订单的特征来对待识别订单进行识别。

异常订单可能包括很多类型,不同的类型具有不同的特征。例如,一些异常订单具有特定的违规购买行为,如违规超量抢购商品、使用抢单软件进行抢购等。又例如,一些异常订单的地址包括特定的字或者词。对于一个待识别订单,属于异常订单的一种类型,就可以将其识别为异常订单。需要说明的是,上述对异常订单的类型仅作举例说明,异常订单的类型不限于上述提供的类型。正常订单的特征也是类似情况,在此不再赘述。

对异常订单的订单信息进行分析表明,无论是具有违规购买行为的异常订单,还是地址中包括特定字或者词的异常订单,订单的地址信息都表现出一定的特征,因此可以基于待识别订单的地址信息来进行其是否为异常订单的识别。

基于上述对待识别订单的地址信息的分析,本公开提供的方案调用卷积神经网络(convolutionalneuralnetwork,cnn)模型基于待识别订单的特征对待识别订单进行识别。cnn模型是一种高效的基于特征的识别方法。使用cnn模型对异常订单进行识别,需要调用训练好的目标cnn模型,对待识别订单的地址信息进行处理,得到该待识别订单是否为异常订单的识别结果。

可选地,在对待识别订单进行识别之前,还可以通过地址样本对cnn模型进行训练得到上述识别方法所使用的目标cnn模型,以使得该目标cnn模型具有异常订单的识别功能。

下面对本公开中所使用的cnn模型的一种可选实现方式介绍如下:

参见图1,其示出了一种可能的cnn模型的原理示意图。如图1所示,cnn模型100包括卷积器110,分类器120,反馈器130。在使用样本对该cnn模型进行训练的过程中,调用卷积器110对已知识别结果的样本进行处理,经过一层或者多层卷积处理;调用分类器120对得到的卷积处理结果进行分类,得到分类结果,基于该分类结果与该样本的已知识别结果得到误差参数,将该误差参数通过反馈器130反馈到卷积器110中,根据该误差参数对卷积器110的相关参数进行校正,至此一个样本的训练过程完成。其后,可以再采用一个已知分类结果的样本,对该cnn模型重复上述训练过程。随着进行训练的样本的个数的增多,该cnn模型被不断校正,使得其能够具有更好的识别能力,得到目标cnn模型。

在调用目标cnn模型进行识别的过程中,调用卷积器110和分类器120对待识别信息进行处理得到识别结果,该识别结果即该cnn模型对该待识别信息的识别结果,此过程中不调用反馈器130。

需要说明的是,本公开中的cnn模型及目标cnn模型不限于上述实现方式。

参见图2,其示出了本公开的一个实施例提供的订单识别方法的流程图,该方法包括:

步骤201、获取待识别订单的地址信息。

可选地,待识别订单的地址信息可以基于待识别订单中的收货地址得到。在电子购物平台的订单中,订单中的被购买对象,也可以说是商品,是通过物流或者快递等形式送到收货地址,收货地址是订单的订单信息中的一种,可以通过订单的订单信息获得。

此外,待识别订单的地址信息还可以通过待识别订单的用户账号的账号地址得到。例如,用户在电子购物平台进行用户账号注册的时候,需要登记用户的地址,该地址被记录为账号地址;待识别订单的账号地址可能与上述收货地址不同。

可选地,待识别订单是通过电子购物平台获得的订单。该待识别订单可以是实时产生的订单,即用户进行下单之后,即产生待识别订单,该待识别订单需要被识别是否为异常订单。

可选地,待识别订单的地址信息是一个或者多个字符。该字符包括但不限于以下字符的一种:汉字字符、英文字符、数字字符和特殊字符。例如,特殊字符可以是“*”“!”“%”“@”等。

步骤202、将待识别订单的地址信息转换成向量。

其中,待识别订单的地址信息对应的向量可以是一个向量,也可以是多个向量。

当待识别订单的地址信息是字符时,步骤202包括:将待识别订单的地址信息的字符转换成向量。例如,将待识别订单的地址信息“北京市三十一中学五年一班”转换成向量。

在该种情况下,步骤303的一种可能的实现方式包括:

步骤一:将待识别订单的地址信息进行文本切分,基于文本切分后的结果得到字符集合。

示例地,将待识别订单的地址信息“北京市三十一中学五年一班”进行文本切分得到字符集合{北,京,市,三,十,一,中,学,五,年,一,班}。

示例性地,步骤一包括:

将待识别订单的地址信息进行文本切分,将文本切分后的结果中以下字符种类中的一种或者多种字符剔除,得到字符集合:

特殊字符、数字字符、字母字符。

待识别订单的地址信息一般由用户填写的地址得到,可能存在一些不规范用语或者错误,还可能由用户故意加入一些不必要的字符,以避免电子购物平台的有关异常订单的识别及屏蔽等措施。因此,基于待识别订单的地址信息得到的字符集合可能包括特殊字符,例如“#”、“@”、“/”等,而这些特殊字符对订单的识别没有帮助,为了减少订单识别过程中的运算量,可以将特殊字符剔除。字符集合中还会包括一些数字字符,例如“2楼”、“1203”等,这些数字字符一般用于区分同一栋楼的不同住户等,对订单的识别帮助很小或者没有,为了减少订单识别过程中的运算量,可以将数字字符剔除。在中国区域使用的电子购物系统中的订单地址,字母字符出现频率较小,一般不将字母字符用作订单识别也不会影响识别结果,但是会减少订单识别过程中的运算量,因此可以将字母字符剔除。

步骤二:基于字符集合得到待识别订单的地址信息对应的向量。

在一种可选的实现方式中,步骤二包括:

将该字符集合中的字符对应的数值分别赋值给向量中的元素。

其中,字符集合包括m个字符,m为正整数。

其中,向量的维度是n×1,n为正整数。向量的维度可以是预设的,其取值根据经验或者统计得到,例如,根据电子购物平台的历史订单的收货地址的长度的统计结果,设定n的值为128。

其中,字符与数值是一一对应的关系。

示例性地,在该实现方式中,步骤二可以包括:

将字符集合中的一个字符对应的数值赋值给向量中的一个元素,重复该操作直至该字符集合中的m个字符赋值给向量的m个元素;

当n大于或者等于m时,将该向量中的其余n-m个元素的值设定为预设值,例如0或者1;

当n小于m时,可以将该字符集合中的字符进一步减少,以使得减少字符操作后的字符集合中的字符个数小于或者等于向量的维度。其中,减少字符的操作可以是直接剔除前n个字符之外的字符,也可以是去掉对订单识别贡献较小的字符,例如,表示地址的楼层信息的字符或者地址中的“省”“市”等字符。

可选地,字符对应的数值,可以依据汉字国标码等现有的字符编码规范获得,也可以根据历史订单的地址信息构建。示例性地,构建过程如下:将一个历史订单的地址的k个字符依次与1,2,…,k-1对应;将另一个历史订单的地址的p个字符依次与k,k+1,…,k+p-1对应;重复此操作,被选中构建该字符与数值对应关系的历史订单对应完毕,则建立了字符与数值的对应关系。其中,在构建过程中,如果出现与之前已经对应完成的字符相同的字符,则跳过此字符继续对应。其中,k和p是正整数。对于待识别订单中的字符对应的数值,可以查询上述构建的字符和数值的对应关系中,该字符对应的数值得到。

示例性地,一个待识别订单的地址信息是“广东&深圳@华强北电子世界3楼3605”;经过剔除处理后的字符集合为{广,东,深,圳,华,强,北,电,子,世,界,广,东,深,圳,华,强,北,电,子,世,界},其中“广”“东”“深”“圳”“华”“强”“北”“电”“子”“世”“界”对应的数值分别为:5、32、67、26、74、902、403、45、1037、302和8;待识别订单的地址信息对应向量的维度为16,则该待识别订单的地址信息映射到的向量是(5,32,67,26,74,902,403,45,1037,302,8,0,0,0,0,0)。

可选地,为了实现向量中的元素的数值大小与目标cnn模型中的参数数值大小在相同或者相近数量级上,使得调用目标cnn模型对该待识别订单进行有效识别,步骤二还包括::

将该向量进行标准化处理。

示例性地,将该向量进行标准化或者归一化处理得到单位向量。

步骤203、调用目标神经网络模型对向量进行处理,得到待识别订单是否为异常订单的识别结果。

其中,目标神经网络模型是基于订单样本进行训练得到。

步骤203的一种实现方式包括:调用目标神经网络模型对向量进行处理;当目标神经网络模型输出的结果是对应异常订单的预设值时,识别结果为该待识别订单为异常订单;当目标神经网络模型输出的结果不是对应异常订单的预设值时,识别结果为该待识别订单不是异常订单。

步骤203的一种具体方式参见前述通过图1所示的cnn模型进行订单识别的方法,在此不再赘述。

本公开通过基于订单样本训练得到目标卷积神经网络模型,使其具有识别不同特征的待识别订单的能力,从而调用该模型对由待识别订单的地址信息转换的向量进行处理得到识别结果,避免了基于单一特征对待识别订单进行识别导致的误判问题

参见图3,其示出了本公开的一个实施例提供的订单识别方法的流程图,该方法包括:

步骤301、获取订单样本。

其中,订单样本是用于训练目标神经网络模型的订单。

在一种可选的实现方式中,步骤301包括:

基于历史订单抽样得到订单样本。

其中,历史订单是电子购物平台已经获得的订单。

进一步地,基于历史订单抽样得到订单样本,还可以包括:

对历史订单按照预设比例值随机均匀抽样得到订单样本。

其中,预设比例值可以根据历史订单的个数和所需订单样本的个数确定,也可以根据经验或者试验数据得出。例如,预设比例值是1%~20%的任一值,并根据实际情况选取。

除此以外,步骤301的实现方式还可以包括以下方式中的一种或者多种:

选取电子购物平台中一段时间内的所有订单作为订单样本;

选取电子购物平台中购买特定商品的订单作为订单样本。

示例地:可以将以下订单作为订单样本:

电子购物平台中一种新商品开放购买的一段时间内的订单;

电子购物平台中优惠活动期间的订单;

电子购物平台中开放新型手机购买的一段时间内的订单。

步骤302、根据订单样本获取地址样本。

其中,地址样本是基于订单样本的地址信息获得。

在一种可选的实现方式中,地址样本包括地址正样本和地址负样本,步骤302包括:

步骤一:根据订单样本获取地址负样本。

步骤二:根据订单样本获取地址正样本。

地址负样本和地址正样本是地址样本的两种样本,分别具有不同的特征,可以基于两种订单样本分别得到。

可选地,地址负样本是基于被识别为异常订单的订单样本得到;地址正样本是基于被识别为正常订单的订单样本得到。该识别过程可能是人工识别或者其他识别方法,目的是生成能够对目标卷积神经网络进行训练的地址负样本和地址正样本,使得该目标卷积神经网络能够更加高效、准确地对待识别订单进行识别,以替代上述相关技术中不够高效、不够准确的识别过程。

进一步地,该实现方式具体可以是:根据订单样本的订单信息获得地址正样本和地址负样本。其中,订单信息包含但不限于以下信息中的一种:购买的商品、商品页面浏览时间、商品加入购物车时间、下单时间、付款时间、收货地址、付款方式。

可选地,步骤一的实现方式包含但不限于以下方式中的一种:

方式一:当订单样本的地址信息包括异常地址词条时,将订单样本的地址信息作为地址负样本。

其中,异常地址词条是指根据经验或者统计得到的具有异常购买行为的订单的地址特征词,该异常地址词条可以有多个。例如,包括第一地址特征词的地址通常是异常订单的收货地址或者账号地址,则该第一地址特征词是异常地址词条。

方式二:采用地图应用程序对订单样本的地址信息进行检索,当检索结果不存在或检索结果与订单样本的地址信息的相似度未达到相似度阈值时,将订单样本的地址信息作为地址负样本。

通过地图应用程序对样本订单的地址信息进行验证是对该地址信息真实性的验证。电子购物平台为了规避多次对同一种商品下单的抢购行为,可能会禁止同一订单地址的多次下单,有些用户为了绕过这种限制,会使用虚假收货地址下单。方式二中的操作是通过地图应用软件对地址信息的真实性进行验证。

该方式的一种具体实现方式包括:

将订单样本的地址信息输入第三方地图应用程序的输入接口;第三方地图应用程序对应输出地址集合,该地址集合中包括根据地址信息检索得到的一个或者多个疑似地址;将该地址信息与地址集合中的疑似地址逐一对比;当该地址集合中的每一个疑似地址的对比结果都不能达到相似度阈值时,将订单样本的地址信息作为地址负样本。其中,相似度阈值可以是预设的,例如80%。

其中,第三方地图应用程序可以是百度地图应用程序编程接口(applicationprogramminginterface,api)。

获得该订单样的地址信息与疑似地址的对比结果的一种可选方法包括:

调用最长公共子串算法对地址信息和疑似地址进行处理,得到最长公共子串;当最长公共子串的长度小于长度阈值,或者最长公共子串与该地址信息的比值小于比值阈值时,对比结果是未达到相似度阈值。其中,长度阈值和比例阈值可以是预设的。例如,长度阈值是12;比例阈值是0.8。

方式三:当订单样本对应的对象的选中时间与对象的购买时间间隔未满足第一时间间隔阈值时,将订单样本的地址信息作为地址负样本。

其中,订单样本对应的对象是该订单样本中被购买的商品。

其中,选中时间可以是选中该订单样本中被购买的商品的时间,例如,加入购物车的时间。

可选地,选中时间与对象的购买时间间隔未满足第一时间间隔阈值,可以是:

选中时间与对象的购买时间间隔小于第一时间间隔;

或者,选中时间与对象的购买时间间隔大于第一时间间隔。

在正常购买行为中,用户将商品加入购物车之后会有其他浏览比对行为,或者寻找其他可购买商品一起下单。一些异常订单的用户的购买目标很明确,将目标商品加入购物车后会立刻购买;如果通过抢单软件购买,订单的商品被添加购物车的时间与购买该商品的时间间隔会更短。为了根据上述购买行为确定地址负样本,方式三的一种实现方式包括:

当订单样本对应的商品被添加购物车的时间与该商品的购买时间间隔小于t秒时,将订单样本的地址信息作为地址负样本。

其中,t为正整数。t的值可以根据经验或者统计数据设定。示例地,t=2。t的值的一种可能的设定方式为,获得历史订单中商品被添加购物车的时间与该商品的购买时间间隔的正态分布,并根据贝叶斯公式计算该正态分布下地址负样本的概率,从而获得t的值。

方式四:当订单样本对应的对象的收取时间信息与对象的激活时间间隔未满足第二时间间隔阈值时,将订单样本中的地址信息作为地址负样本。

其中,收货时间信息可以根据订单样本中的送货快递的快递信息获得。收取时间可以是该订单样本中被购买对象被该订单样本中的收货人收到的时间。

可选地,订单样本对应的对象可以是电子设备,该电子设备需要激活使用。

可选地,订单样本对应的对象的收货时间信息与对象的激活时间间隔未满足第二时间间隔阈值,可以是:

订单样本对应的对象的收货时间信息与对象的激活时间间隔小于第二时间间隔;

或者,订单样本对应的对象的收货时间信息与对象的激活时间间隔大于第二时间间隔。

在正常购买行为中,订单中的收货人收到购买的电子设备后,会很快进行激活并使用,激活时间一般是收货时间后一到两天。一些异常订单的用户收到电子购物平台购买的电子设备后,需要将该电子设备转卖,另一个买家在该异常订单的用户处购买该电子设备后,再激活使用,激活时间一般是订单的收货时间后的一到两周。为了根据上述购买行为确定地址负样本,方式四的一种实现方式包括:

当订单样本中的商品的收货时间与该商品的激活时间间隔大于d天时,将订单样本的地址信息作为地址负样本。

其中,d为正整数。d的值可以根据经验或者统计数据得出。示例地,d=7。

可选地,包括获得地址正样本的步骤二可以是以下设计中的一种或者多种:

设计一:当订单样本对应的对象的收取时间信息与对象的激活时间间隔满足第三时间间隔阈值时,将订单样本中的地址信息作为地址正样本。

设计一的具体实现可以参照上述步骤一的实现方式四,在此不再赘述。

设计二:当订单样本对应的用户账号在用户账号白名单中时,将订单样本中的地址信息作为地址正样本。

可选地,将历史订单达到预设数量,且历史订单都是正常订单的用户账号作为用户账号白名单中的一个用户账号;当样本订单对应的用户账号是在用户账号白名单中时,将该订单样本的地址信息作为地址正样本。

需要说明的是,根据订单样本获取地址负样本和地址正样本的方式不限于以上方式,还可以包括其他方式,例如:通过其他电商共享的地址获得正样本和地址负样本。

步骤303、将地址样本转换成向量。

步骤303的实现方式可以参照图2所示的订单识别方法中的步骤202,在此不再赘述。

步骤304、采用地址样本对应的向量训练神经网络模型,得到目标神经网络模型。

可选地,在一种实现方式中,步骤304包括:

采用地址正样本对应的向量和地址负样本对应的向量训练神经网络模型,得到目标神经网络模型。

示例性地,调用卷积神经网络模型对将地址正样本对应的向量进行处理,从而对卷积神经网络模型进行校正;调用卷积神经网络模型对将地址负样本对应的向量进行处理,从而对卷积神经网络模型进行校正;重复上述操作基于地址正样本和负样本对卷积神经网络模型进行校正,从而得到能够用于识别异常订单的目标卷积神经网络模型。

需要说明的是,步骤301-304是可选步骤,用于获得用于该订单识别方法所调用的目标神经网络模型。

进一步地,将第一类异常订单的订单样本对卷积神经网络模型执行步骤301-304进行训练,得到目标卷积神经网络模型,该目标卷积神经网络模型能够识别待识别订单是否为第一类异常订单。进一步地,将第二类异常订单的订单样本对目标卷积神经网络模型执行步骤301-304进行训练,可以使得该目标神经网络模型能够识别待识别订单是否为第一类异常订单或者第二类异常订单。例如,该第一类异常订单是地址信息中包含有异常地址词条的异常订单,该第二类异常订单是订单样本对应的对象的选中时间与对象的购买时间间隔未满足第一时间间隔阈值的异常订单。通过上述过程可知,本公开提供的订单识别方法无需修改算法、程序、装置等,只需要对卷积神经网络模型进行进一步训练即可实现对新的订单类型的识别,从而实现后向兼容,更利于后期维护。

步骤305、获取待识别订单的地址信息。

步骤305的实现方式可以参照图2所示的订单识别方法中的步骤201,在此不再赘述。

步骤306、将待识别订单的地址信息转换成向量。

步骤306的实现方式可以参照图2所示的订单识别方法中的步骤202,在此不再赘述。

步骤307、调用目标神经网络模型对向量进行处理,得到待识别订单是否为异常订单的识别结果。

步骤307的实现方式可以参照图2所示的订单识别方法中的步骤203,在此不再赘述。

本公开通过基于订单样本训练得到目标卷积神经网络模型,使其具有识别不同特征的待识别订单的能力,从而调用该模型对由待识别订单的地址信息转换的向量进行处理得到识别结果,避免了基于单一特征对待识别订单进行识别导致的误判问题。

此外,通过对订单样本的更新以及使用其对目标卷积神经网络模型的训练,可以实现该目标卷积神经网络模型对待识别订单的识别能力的更新,使得本公开提供的方案具有更强的后向兼容性。

上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。

参见图4,其示出了本公开的一个实施例提供的订单识别装置400的框图,包括地址获取模块410、转换模块420和识别模块430。

地址获取模块410,被配置为获取待识别订单的地址信息。

转换模块420,被配置为将待识别订单的地址信息转换成向量。

可选地,转换模块420,被配置为将待识别订单的地址信息进行文本切分,基于所述文本切分后的结果得到字符集合;基于字符集合得到所述待识别订单的地址信息对应的向量。

可选地,转换模块420被配置为将待识别订单的地址信息进行文本切分,并将文本切分后的结果中的特殊字符和数字字符剔除得到字符集合;基于字符集合得到待识别订单的地址信息对应的向量。

识别模块430,被配置为调用目标神经网络模型对向量进行处理,得到待识别订单是否为异常订单的识别结果。

其中,目标神经网络模型基于订单样本进行训练得到。

本公开通过基于订单样本训练得到目标卷积神经网络模型,使其具有识别不同特征的待识别订单的能力,从而调用该模型对由待识别订单的地址信息转换的向量进行处理得到识别结果,避免了基于单一特征对待识别订单进行识别导致的误判问题。

参见图5,其示出了本公开的一个实施例提供的订单识别装置500的框图,包括地址获取模块510、转换模块520、识别模块530、样本获取模块540、地址样本获取模块550和训练模块560。

地址获取模块510,被配置为获取待识别订单的地址信息。

转换模块520,被配置为将待识别订单的地址信息转换成向量。

识别模块530,被配置为调用目标神经网络模型对向量进行处理,得到待识别订单是否为异常订单的识别结果。

其中,目标神经网络模型基于订单样本进行训练得到。

在一种可选的实现方式中,订单识别装置500,还可以包括:样本获取模块540、地址样本获取模块550和训练模块560。

样本获取模块540,被配置为获取订单样本。

地址样本获取模块550,被配置为根据订单样本获取地址样本。

转换模块520,还被配置为将地址样本转换成向量。

训练模块560,被配置为采用地址样本对应的向量训练神经网络模型,得到目标神经网络模型。

在一种可选的实现方式中:

地址样本包括地址负样本和地址正样本。

可选地,地址样本获取模块550还被配置为以下方式中的一种或者多种:

方式一:当订单样本的地址信息包括异常地址词条时,将订单样本的地址信息作为地址负样本。

方式二:采用地图应用程序对订单样本的地址信息进行检索,当检索结果不存在或检索结果与订单样本的地址信息的相似度未达到相似度阈值时,将订单样本的地址信息作为地址负样本。

方式三:当订单样本对应的对象的选中时间与该对象的购买时间间隔未满足第一时间间隔阈值时,将订单样本的地址信息作为地址负样本。

方式四:当订单样本对应的对象的收取时间信息与对象的激活时间间隔未满足第二时间间隔阈值时,将订单样本中的地址信息作为地址负样本。

可选地,地址样本获取模块550还被配置为以下设计中的一种或者多种:

设计一:当订单样本对应的对象的收取时间信息与对象的激活时间间隔满足第三时间间隔阈值时,将订单样本中的地址信息作为地址正样本。

设计二:当订单样本对应的用户账号在用户账号白名单中时,将订单样本中的地址信息作为地址正样本。

本公开通过基于订单样本训练得到目标卷积神经网络模型,使其具有识别不同特征的待识别订单的能力,从而调用该模型对由待识别订单的地址信息转换的向量进行处理得到识别结果,避免了基于单一特征对待识别订单进行识别导致的误判问题。

此外,通过对订单样本的更新以及使用其对目标卷积神经网络模型的训练,可以实现该目标卷积神经网络模型对待识别订单的识别能力的更新,使得本公开提供的方案具有更强的后向兼容性。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

参见图6,其示出了本公开实施例提供的一种订单识别装置的结构示意图。该装置可能是服务器或者终端,具体来讲:

订单识别装置600包括中央处理单元(cpu)601、包括随机存取存储器(ram)602和只读存储器(rom)603的系统存储器604,以及连接系统存储器604和中央处理单元601的系统总线605。订单识别装置600还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(i/o系统)606,和用于存储操作系统613、应用程序614和其他程序模块615的大容量存储设备607。

基本输入/输出系统606包括有用于显示信息的显示器608和用于用户输入信息的诸如鼠标、键盘之类的输入设备609。其中显示器608和输入设备609都通过连接到系统总线605的输入输出控制器610连接到中央处理单元601。基本输入/输出系统606还可以包括输入输出控制器610以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器610还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备607通过连接到系统总线605的大容量存储控制器(未示出)连接到中央处理单元601。大容量存储设备607及其相关联的计算机可读介质为订单识别装置600提供非易失性存储。也就是说,大容量存储设备607可以包括诸如硬盘或者cd-rom驱动器之类的计算机可读介质(未示出)。

不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括ram、rom、eprom、eeprom、闪存或其他固态存储其技术,cd-rom、dvd或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器604和大容量存储设备607可以统称为存储器。

根据本公开的各种实施例,订单识别装置600还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即订单识别装置600可以通过连接在系统总线605上的网络接口单元611连接到网络612,或者说,也可以使用网络接口单元611来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由cpu执行。所述一个或者一个以上程序包含用于进行图2和图3其中任一所提供的订单识别方法的指令。

本公开实施例还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由订单识别装置的处理器执行时,使得订单识别装置能够执行图2和图3其中任一项提供的订单识别方法。

一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行进行图2和图3其中任一所提供的订单识别方法的指令。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1