一种提高相似物流单号识别精度的算法和物流查询系统的制作方法

文档序号:35283975发布日期:2023-09-01 04:33阅读:30来源:国知局
一种提高相似物流单号识别精度的算法和物流查询系统的制作方法

本技术涉及计算机,特别涉及一种提高相似物流单号识别精度的算法和物流查询系统,以及一种通过邮件查询物流单号的方法和系统。


背景技术:

1、目前的全球综合物流查询平台(也称“物流查询系统”),由于物流行业没有约束性的标准,每家物流渠道(也称“物流商”)都有自己的物流单号自动生成方式和规则。没有统一约束和规范的物流单号,对于综合物流查询系统而言,如果支持的物流渠道越多,相似物流单号(指物流单号规则一样或者非常相似,肉眼不易分辨的物流单号)在查询时发生冲突的概率就会越高,从而导致物流渠道不能被自动识别,使得用户查询物流单号的效率降低,影响用户对物流查询系统的体验效果。

2、目前通常的做法是根据不同的物流渠道配置物流单号的正则匹配规则,然后通过规则来区分一部分物流单号;但是对于规则非常接近的相似物流单号,难以在正则匹配基础上进一步的提高物流渠道的识别精度,即便在正则匹配基础上实现了物流渠道的识别,其规则配置会非常复杂,不便于维护和使用。在物流查询系统的相关技术中,对于不能识别的相似物流单号,通常是由用户手动指定相应的物流渠道,这种操作方式会耗费用户很多时间,对于采用其他语言的跨国物流渠道而言,也给用户的物流单号查询工作带来很大困扰和麻烦。

3、此外,对于物流单号查询频率非常高的电商领域,买家在各电商平台购买的商品发货后,一般都会收到卖家的发货邮件;发货邮件主要用于通知买家订单商品已经发货,同时提供发货的物流单号或者物流单号的查询链接。

4、如果买家想要对物流单号进行持续的查询追踪,目前的普遍做法是:买家收到发货邮件后,将发货邮件中的物流单号复制出来,再粘贴到物流查询平台上进行查询追踪。对于购买商品频率很高的买家(比如专职的采购人员),这种物流单号查询方式的查询效率很低,费时费力;而且如果物流过程发生异常,买家无法及时了解物流过程并介入干预处理,可能会造成不必要的损失。

5、涉及本技术的其他技术问题,在后文进一步阐述。上述内容仅用于辅助理解本技术的技术方案,并不代表承认上述内容全部都是现有技术。


技术实现思路

1、本技术的主要目的是提供一种提高相似物流单号识别精度的算法和物流查询系统,旨在使物流查询系统在查询相似物流单号时提高其对物流渠道的识别精度,提高对国际物流单号的查询效率。此外,本技术还提供一种通过邮件查询物流单号的方法和对应的物流查询系统,通过邮件转发并分析识别邮件内容来实现自动查询用户(即买家)邮件中物流单号的物流轨迹;也即:物流查询系统自动分析识别用户(买家)邮件中的物流单号,根据所得物流单号进一步查询追踪物流轨迹,并将物流查询结果通过邮件反馈给买家,实现买家自动获取物流单号查询结果的目的。

2、本技术的一种提高相似物流单号识别精度的算法,用于在物流查询系统中识别物流渠道,其特征在于,所述方法包括以下步骤:

3、步骤s1:获取物流单号,计算所述物流单号的长度,根据所述物流单号的长度从规则库中筛选具有相同物流单号长度的物流渠道,记录具有相同长度的全部所述物流渠道并计算所述物流渠道的数量n;

4、步骤s2:根据n值进行所述物流单号的初步识别,所述物流单号的初步识别包括:当n=1时,将所述唯一的物流渠道作为所述物流单号的识别结果;当n≥2时,执行步骤s3;

5、步骤s3:进行所述物流单号的匹配精度计算,所述匹配精度计算包括步骤s31-s34:

6、步骤s31:根据各物流渠道的号段信息拆分所述物流单号正则表达式中的常数部分和变数部分,所述物流单号中与所述号段信息的内容相同且位置相同的部分作为所述正则表达式的常数部分,其余部分作为所述正则表达式的变数部分;

7、步骤s32:计算各物流渠道对应正则表达式中所述常数部分的长度在整个规则中匹配到的长度比例,所述长度比例作为所述物流单号在相应物流渠道规则下的匹配精度值;

8、步骤s33:将各物流渠道规则的匹配精度值按大小进行排序;

9、步骤s34:取出匹配精度值最高的规则所对应的物流渠道;

10、步骤s4:将匹配精度值最高的物流渠道作为所述物流单号的识别结果。

11、本技术的其他特征和技术效果在说明书的后面部分进行阐述说明。本技术的技术问题解决思路和相关产品设计方案为:

12、比如对于物流单号具有相似规则的两个物流渠道,物流渠道a的物流单号为226590455432,物流渠道b的物流单号为123456784312,两者都是12位的纯数字物流单号,是相似物流单号。通常的做法是在配置规则的时候,按照正则表达式分别配置为d\{12}和d\{12},这样会造成没法区分2个物流单号的归属,也就没法根据优先级选出一个可能性更大的物流渠道以进行识别。这种情况下,通常的物流查询系统会提请用户手动指定相应的物流渠道,以实现物流单号和物流渠道的匹配。

13、申请人通过对大量相似物流单号和物流渠道进行分析,发现很多物流渠道会有号段的概念,比如物流渠道a的物流单号中第3-6位具有固定的字符串6590,也即物流渠道a具有号段,且号段内容为6590字符,号段的位置为第3-6位,号段长度为4位。因此,可以相应的配置物流渠道a的正则表达式为\d{2}(6590)\d{6}。物流渠道b的物流单号中没有固定的字符串,物流渠道b的正则表达式仍然为\d{12};这样在匹配的时候仍然会匹配到2个物流渠道,无法进一步的区分。为此,申请人提出了对正则表达式的匹配精度进行计算的概念,采用“规则+算法”的方式来进一步识别物流单号的物流渠道。

14、在对正则表达式的匹配精度进行计算时,根据物流渠道的号段拆分物流单号正则表达式中的常数部分和变数部分,号段作为常数部分,以此计算物流渠道对应正则表达式中常数部分的长度在整个规则中匹配到的长度比例,将该长度比例作为物流单号在相应物流渠道规则下的匹配精度值。如果查询系统中只有物流渠道a和物流渠道b两个12位的物流渠道,在查询物流单号226590455432时:对于物流渠道a,其号段信息为第3-6位的6590,长度为4位,物流单号长度为12位,其匹配精度值为4位/12位=33.3%;对于物流渠道b,由于其没有固定的字符串,常数部分的长度为0位,其匹配精度值为0位/12位=0.0%;根据新的规则,选择匹配精度值最高的物流渠道作为自动识别的物流渠道,因此物流渠道a做该物流单号的识别结果。

15、这种物流单号的匹配精度计算,采用规则和算法相结合的方式,避免了采用复杂的规则来识别相似物流单号的归属,便于软件编程和维护;在查询时遇到相似的物流单号时,可以不需要用户手动指定物流渠道,提高了物流单号的自动识别能力和对国际物流单号的查询效率,识别精度高,具有查询精准、快速、高效和便捷等优点。而且,相比于普通ai(人工智能)学习系统,其计算更有针对性,计算速度更快,算法语言更简单,对应的软件编程和维护成本低。

16、相应的,本技术还提供一种物流查询系统,物流查询系统包括物流单号获取模块、规则库、物流单号库、物流渠道库、综合计算模块和查询结果展示模块,综合计算模块执行该提高相似物流单号识别精度的算法所包含的操作指令。其他实施方案和技术效果在后文阐述。

17、进一步的,本技术还提供一种通过邮件查询物流单号的方法和相应的物流查询系统,用于通过物流查询系统自动查询用户邮件中的物流单号。该通过邮件查询物流单号的方法包括以下步骤:

18、步骤q1:获取用户邮箱在物流查询系统的查询权限;

19、步骤q2:设置用户邮箱的邮件自动转发规则,将需要查询物流单号的发货邮件自动转发至物流查询系统指定的系统邮箱,所述用户邮箱为用户收取发货邮件的电子邮箱;

20、步骤q3:物流查询系统查收系统邮箱,收取用户邮箱自动转发过来的发货邮件;

21、步骤q4:扫描发货邮件中的内容,识别出发货邮件中的物流单号;

22、步骤q5:物流查询系统将识别出的物流单号添加到用户邮箱对应的跟踪列表;

23、步骤q6:物流查询系统自动查询所述跟踪列表中的物流单号,判断该物流单号前后两次查询的物流进度信息是否更新,当后一次查询的物流进度信息和前一次查询的结果不一致时,将后一次查询的物流进度信息通过系统邮箱发送至用户邮箱。

24、这种根据邮件信息分析物流单号并进行自动物流跟踪的方式可实现物流单号的自动查询,且每次更新物流进度,用户都能够及时的收到相应的物流通知邮件,进而及时获取物流过程信息。如果物流过程发生异常,用户可以及时了解物流过程并介入干预处理,以避免不必要的损失。并且只需要一次设置,后续所有的购买发货物流单号都可以进行自动跟踪,不再需要进行手工处理,大幅度提高物流单号的查询效率。

25、其他实施方案和技术效果在后文阐述。

26、进一步的,非电商领域的普通用户也可以通过邮件查询物流单号的方法实现自己邮箱中物流单号的自动查询。

27、进一步的,本技术还提供一种服务器,服务器包括存储器、处理器,本技术中的物流查询系统储存在存储器,处理器可以运行物流查询系统的操作指令和相应的算法。

28、进一步的,本技术还提供一种计算机设备,计算机设备包括存储器、处理器,本技术中的物流查询系统储存在存储器,处理器可以运行物流查询系统的操作指令和相应的算法。

29、申明,在本技术中:“正则表达式”为“规则表达式”,可简称为“正则”或“规则”,是对字符串操作的一种逻辑公式;物流单号是泛指大件物流单号、小件快递单号等多种货运单号;相关的实施方案中,物流单号不只是由数字组成,还可以是由数字、字母等字符共同组成;为了简化和统一相关表述,将物流渠道没有号段信息表述为物流渠道的号段信息为空,从而使全部物流渠道都具有相应的号段信息;各号段信息或字符串的长度为整数,表示字符的位数;号段信息可以简称为号段。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1