一种寄递行为异常分析方法、系统、电子设备及存储介质与流程

文档序号:28492990发布日期:2022-01-15 03:15阅读:243来源:国知局
一种寄递行为异常分析方法、系统、电子设备及存储介质与流程

1.本发明涉及智能检测技术领域,尤其涉及一种寄递行为异常分析方法、系统、电子设备及存储介质。


背景技术:

2.随着互联网和电商的发展,中国寄递业务量已经连年激增,2020年,邮政快递业收入规模突破万亿元,占gdp比值超过1%,特别是快递业务量达到833亿件,日均服务人次超过4亿,连续7年稳居世界第一。
3.迄今为止快递业已积累了海量的数据,寄递数据具有联系网上网下的独特优势。例如收发件人姓名、地址、手机号等大都来源于网络、虚拟、社会的三位一体数据,是能在实现社会中促进“落脚生根”的宝贵资源。通过对寄递用户、地址、收寄时间等数据进行源头管控,在发现可疑包裹时对相关数据逆向反查、顺向跟控、横向对比,能有效查处、跟踪各类犯罪案件。
4.目前基于寄递数据的分析,往往是对于单个案件的人员来说的,而且是在案发后,根据案情实际需要掌握更多的依据和线索,进而破获犯罪嫌疑人。但是,这种方式滞后于办案,只有在案发以后才能进行操作,而不能在案发前进行必要的警告和提示。


技术实现要素:

5.本发明提供一种寄递行为异常分析方法、系统、电子设备及存储介质,可以识别出用户的异常寄递行为,有助于事先排查犯罪。
6.第一方面,本发明提供一种寄递行为异常分析方法,采用如下技术方案:所述寄递行为异常分析方法包括:将面单信息中的手机号码作为识别用户的唯一标识;确定所述用户需要分析的时间特征;对所述时间特征进行分析,识别出异常数据和正常数据;根据所述异常数据情况,确定所述用户是否存在异常寄递行为。
7.可选地,所述将面单信息中的手机号码作为识别用户的唯一标识包括:获取寄递数据中的面单信息;判断所述面单信息中是否存在手机号码脱敏或缺失的情况;若不存在,直接从所述面单信息中获取用户的手机号码,将手机号码作为识别用户的唯一标识;若存在,对手机号码脱敏或缺失的面单信息进行技术还原;删除无法还原的面单信息,从成功还原的面单信息中获取用户的手机号码,将手机号码作为识别用户的唯一标识。
8.可选地,对获取的用户的手机号码进行哈希处理,将哈希处理后的手机号码作为识别用户的唯一标识。
9.可选地,所述对所述时间特征进行分析,识别出异常数据和正常数据包括:判断所述时间特征具有一个特征变量还是多个特征变量;根据判断结果,选择对应的分析方式;使用选择好的分析方式,对所述时间特征进行分析,识别出异常数据和正常数据。
10.可选地,所述时间特征具有一个特征变量时,对应的分析方式包括如下步骤:对所述特征变量进行正态性检验,判断所述特征变量是否符合高斯分布;若符合高斯分布,则采取标准差法判别异常数据;若不符合高斯分布,则采取四分位距法判别异常数据。
11.可选地,所述时间特征具有多个特征变量时,对应的分析方式包括如下步骤:计算每个特征变量的平均值μj和方差σj,j为1,2,3,

,n,n为特征变量的个数;根据每个所述特征变量的平均值μj和方差σj,计算所述时间特征的平均值μ和方差σ;根据所述平均值μ和方差σ,计算所述时间特征符合高斯分布的概率密度函数;比较概率密度函数的计算结果p(x)与预设的ε之间的关系,若p(x)<ε,则为异常数据,若p(x)≥ε,则为正常数据。
12.可选地,所述寄递行为异常分析方法还包括:在所述用户存在异常寄递行为时,主动触发预警,并进行二次研判,排查出异常包裹。
13.第二方面,本发明提供一种寄递行为异常分析系统,采用如下技术方案:所述寄递行为异常分析系统包括:标识模块,用于将面单信息中的手机号码作为识别用户的唯一标识;时间特征确定模块,用于确定所述用户需要分析的时间特征;特征分析模块,用于对所述时间特征进行分析,识别出异常数据和正常数据;寄递行为分析模块,用于根据所述异常数据情况,确定所述用户是否存在异常寄递行为。
14.第三方面,本发明提供一种电子设备,所述电子设备包括:存储器,所述存储器存储执行指令;以及处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行以上任一项所述的方法。
15.第四方面,本发明提供一种可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现以上任一项所述的方法。
16.本发明提供了一种寄递行为异常分析方法、系统、电子设备及存储介质,该寄递行为异常分析方法包括:将面单信息中的手机号码作为识别用户的唯一标识;确定用户需要分析的时间特征;对时间特征进行分析,识别出异常数据和正常数据;根据异常数据情况,确定用户是否存在异常寄递行为。通过以上寄递行为异常分析方法,对用户的历史寄递数据进行分析,即可得知该用户在历史寄递过程中是否存在异常寄递行为,进而能够更好地为侦察办案和情报信息工作服务,有助于事先排查犯罪。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
18.图1为本发明实施例提供的寄递行为异常分析方法的流程图;图2为本发明实施例提供的第一种分析方式的流程图;图3为本发明实施例提供的第二种分析方式的流程图;图4为本发明实施例提供的寄递行为异常分析过程的流程图;图5为本发明实施例提供的寄递行为异常分析系统的示意图。
具体实施方式
19.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.需要说明的是,在不冲突的情况下本发明实施例中的各技术特征均可以相互结合。
21.本发明实施例提供一种寄递行为异常分析方法,具体地,如图1所示,图1为本发明实施例提供的寄递行为异常分析方法的流程图,该寄递行为异常分析方法包括:步骤s1、将面单信息中的手机号码作为识别用户的唯一标识。
22.可选地,步骤s1将面单信息中的手机号码作为识别用户的唯一标识包括:子步骤s11、获取寄递数据中的面单信息。
23.子步骤s12、判断面单信息中是否存在手机号码脱敏或缺失的情况。
24.子步骤s13、根据判断结果获取用户的手机号码,将手机号码作为识别用户的唯一标识。
25.具体地,子步骤s13中,若不存在手机号码脱敏或缺失的情况,直接从面单信息中获取用户的手机号码,将手机号码作为识别用户的唯一标识;若存在手机号码脱敏或缺失的情况,对手机号码脱敏或缺失的面单信息进行技术还原,删除无法还原的面单信息,从成功还原的面单信息中获取用户的手机号码,将手机号码作为识别用户的唯一标识。
26.考虑到公民隐私,本发明实施例中可以选择,对获取的用户的手机号码进行哈希处理,将哈希处理后的手机号码作为识别用户的唯一标识。
27.步骤s2、确定用户需要分析的时间特征。
28.寄递数据中可用于分析用户行为特征的有寄递渠道、收寄时间、寄递物品、收寄地区等。其中,寄递渠道反映的是用户使用快递企业的消费习惯,无法从众多使用习惯排查异常渠道;寄递物品具有一定业务场景,用户需求不同,寄递物品也一定千差万别;收寄地区具有一定行业的地域性,从宏观角度无法分析异常行为;而寄递时间则有一定的客观性,第一,收寄时间能反映用户的活动规律,分析与常人不一样的异常收寄件规律,第二,收寄时间和地域差异关系不大,从而可以适用于全国范围。因此,本发明实施例中选择对用户的时间特征进行分析。
29.示例性地,如下表所示,本发明实施例中,时间特征可以包括以下一个或多个特征
变量:时间特征表需要补充的是,若一个特征变量即可划分出一种异常寄递行为,则时间特征包括该特征变量即可,若多个特征变量联合划分一种异常寄递行为,则需要使时间特征包括对应的多个特征变量。
30.步骤s3、对时间特征进行分析,识别出异常数据和正常数据。
31.由以上步骤s2可知,本发明实施例中时间特征可以包括一个或多个特征变量,对于一个、多个特征变量可以采用相同的方式进行分析,也可以采用不同的方式进行分析,识别出异常数据和正常数据。本发明实施例中选择对于一个特征变量和多个特征变量的情况采用不同的方式进行分析。具体地,本发明实施例中,步骤s3、对时间特征进行分析,识别出异常数据和正常数据包括:子步骤s31、判断时间特征具有一个特征变量还是多个特征变量。
32.子步骤s32、根据判断结果,选择对应的分析方式。
33.例如,采取统计方法判别单一连续性特征变量的异常数据,采取高斯模型检测多个连续性混合特征变量的异常数据。
34.可选地,如图2所示,图2为本发明实施例提供的第一种分析方式的流程图,时间特征具有一个特征变量时,对应的分析方式(第一种分析方式)包括如下子步骤:子步骤s321、对特征变量进行正态性检验,判断特征变量是否符合高斯分布。
35.其中,若特征变量符合高斯分布,执行子步骤s322,若特征变量不符合高斯分布,执行子步骤s323。
36.正态性检验可采取图示法或假设检验法,假设检验法主要为k-s检验、w-s检验、偏度和峰度检验,k-s检验适用于大样本的检验即100以上的样本量,偏度和峰度检验适用于
100以下的样本量,w-s检验适用于3-50的样本量,基于样本量的大小使用不同的检验方法。
37.示例性地,本发明实施例中选取k-s检验,基于累计分布函数,通过对标准高斯分布与选取数据服从的分布之间的差异进行分析,若累计频数分布与指定分布差异很小,推论该样本服从高斯分布。
38.k-s检验具体步骤如下:原假设h0:样本来自的总体分布服从高斯分布。备择假设h1:样本来自的总体分布不服从高斯分布。
39.检验统计量为, d值越小越接近正态分布,计算p值,若p《 0.05(显著性水平a),拒绝原假设,不服从高斯分布,否则接受原假设,服从高斯分布。
40.子步骤s322、采取标准差法判别异常数据。
41.距离平均值3δ之外的概率为的事情属于极小概率事件,在默认情况下可以认定距离超过平均值3δ的样本是不存在的。当样本距离平均值大于3δ,则认定该样本为异常数据。
42.子步骤s323、采取四分位距法判别异常数据。
43.适用于非高斯分布的数据样本统计方法是四分位距(iqr),iqr是上四分位与下四分位的差值,超过上四分位+1.5倍iqr,距离或者下四分位-1.5倍iqr的点为异常数据,ql称为下四分位数,qu称为上四分位数。
44.可选地,如图3所示,图3为本发明实施例提供的第二种分析方式的流程图,时间特征具有多个特征变量时,对应的分析方式(第二种分析方式)包括如下子步骤:子步骤s321’、计算每个特征变量的平均值μj和方差σj,j为1,2,3,

,n,n为特征变量的个数。
45.对于样本数据集,求出所有需检测特征的平均值和方差, , 。
46.子步骤s322’、根据每个特征变量的平均值μj和方差σj,计算时间特征的平均值μ和方差σ。
47.子步骤s323’、根据平均值μ和方差σ,计算时间特征符合高斯分布的概率密度函数。
48.计算特征符合高斯分布n(μ, σ2)的概率密度函数。
49.子步骤s324’、比较概率密度函数的计算结果p(x)与预设的ε之间的关系,若p(x)<ε,则为异常数据,若p(x)≥ε,则为正常数据。
50.ε值的选取会影响到模型的参数,影响异常值的判定,因此优化ε值是必要的。本发明采取高斯模型融合em算法优化ε值,初始化分布参数θ,e-step:根据参数θ计算每个样本属于分布的概率,m-step:根据q,求出含有参数θ的似然函数的下界,并最大化它,得到新的
参数θ,不断的迭代,从而训练得到优化的ε值,来确定异常值。
51.子步骤s33、使用选择好的分析方式,对时间特征进行分析,识别出异常数据和正常数据。
52.步骤s4、根据异常数据情况,确定用户是否存在异常寄递行为。
53.具体规则可以根据实际需要进行设定,例如,只要存在异常数据就认定为用户存在异常寄递行为,或者,异常数据数量大于一定阈值,则认为用户存在异常寄递行为。
54.可选地,如图4所示,图4为本发明实施例提供的寄递行为异常分析过程的流程图,寄递行为异常分析方法还包括:在用户存在异常寄递行为时,主动触发预警(对该用户实时寄递数据进行预警),并进行二次研判,排查出异常包裹。图4中数据获取和数据预处理对应本发明实施例中步骤s1,特征分析对应本发明实施例中步骤s2和s3,异常监测对应本发明实施例中步骤s4。
55.目前大部分机器学习算法会将异常信息视为噪声处理掉,而在本发明实施例中,异常数据却有极大的价值。
56.通过以上寄递行为异常分析方法,对用户的历史寄递数据中的时间特征进行分析,即可得知该用户在历史寄递过程中是否存在异常寄递行为,进而能够更好地为侦察办案和情报信息工作服务,有助于事先排查犯罪。具体可以体现为:形成可研判特定信息,锁定异常寄递行为的包裹,在排查犯罪嫌疑人的具体地址信息,掌握重点人群的变化等方面,更好地为侦察办案和情报信息工作服务,使得预防犯罪成为可能,也有助于案发后能更方便快捷的进行分析比对,快速做出反应,落地应用于案件的预警与研判。
57.传统方法是在案发后,根据案情实际需要进行邮件检查,进而发现犯罪嫌疑人。相比较传统的方法,本发明实施例中的寄递行为异常分析方法具有高效性、实用性,并能十分有效地协助研判人员缩小排查范围,减少人员消耗。
58.此外,本发明实施例还提供一种寄递行为异常分析系统,如图5所示,图5为本发明实施例提供的寄递行为异常分析系统的示意图,该寄递行为异常分析系统包括:标识模块10,用于将面单信息中的手机号码作为识别用户的唯一标识;时间特征确定模块20,用于确定用户需要分析的时间特征;特征分析模块30,用于对时间特征进行分析,识别出异常数据和正常数据;寄递行为分析模块40,用于根据异常数据情况,确定用户是否存在异常寄递行为。
59.需要说明的是,本发明实施例中的寄递行为异常分析方法中的各细节内容均适用于寄递行为异常分析系统中对应的模块,此处不再进行赘述。
60.此外,本发明实施例还提供一种电子设备,电子设备包括:存储器,存储器存储执行指令;以及处理器,处理器执行存储器存储的执行指令,使得处理器执行以上任一项的方法。
61.本发明实施例还提供一种可读存储介质,可读存储介质中存储有执行指令,执行指令被处理器执行时用于实现以上任一项的方法。
62.本领域的技术人员应该明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品
的形式。
63.本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令完成流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
64.这些计算机程序指令也可以存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,是的存储在该计算机刻度存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
65.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
66.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1