地址纠错方法及其装置、设备、介质、产品与流程

文档序号:34990573发布日期:2023-08-03 21:01阅读:34来源:国知局
地址纠错方法及其装置、设备、介质、产品与流程

本技术涉及网络电商领域,尤其涉及一种地址纠错方法,此外还涉及该方法相应的装置、设备、非易失性存储介质以及计算机程序产品。


背景技术:

1、随着互联网的发展,互联网上出现了不少网络电商平台,平台用户通过网络电商平台进行电商购物,以通过网购的方式购买心仪的商品,平台的买家用户在网络电商平台中进行网购时,需要将填写对应的收货地址,以便商家用户将买家用户所网购的商品邮寄至对应的收货地址,而买家用户在填写收货地址时可能因填写错误,导致其网购的商品无法正常发货,且平台通常会向买家用户提供与收货地址相关的物流服务以提升商品发货效率,例如,商品运费计算在线服务,收货地址分类在线服务,或商品派送在线服务等,错误的收货地址将导致影响买家用户使用的物流服务的业务执行效率,特别对于网络跨界电商平台,多语种的情况下,错误的收货地址将导致进行地址翻译时,地址无法翻译,影响了买家用户的网购体验与商家用户的商品发货效率,这对于网络电商平台与平台用户而言都是不小的损失。

2、鉴于现有的网络电商平台中因错误的收货地址而导致的问题,本技术人出于解决该问题的考虑作出相应的探索。


技术实现思路

1、本技术的目的在于满足用户需求而提供一种地址纠错方法,此外还涉及该方法相应的装置、设备、非易失性存储介质以及计算机程序产品。

2、为实现本技术的目的,采用如下技术方案:

3、获取地址训练集,训练地址特征提取模型直至收敛状态,其中,所述地址训练集中包含多个训练地址样本,各所述训练地址样本包含训练地址文本与一个或多个监督标签,所述监督标签通过滑动窗口遮掩规则对训练地址文本对应的标准纠错地址文本进行文本遮掩替换所获取;

4、接收由客户端推送的用户输入地址文本,调用训练至收敛的地址纠错模型,确定出所述用户输入地址文本与标准纠错地址库中标准纠错地址文本之间的地址相似度,其中,所述地址纠错模型为两个所述地址特征模型所组成的双塔模型;

5、筛选出所述地址相似度满足预设筛选条件的所述标准纠错地址文本,生成包含各所述标准纠错地址文本的地址纠错列表,将所述地址纠错列表推送至所述客户端。

6、进一步的实施例中,各所述训练地址样本包含训练地址文本与一个或多个监督标签,所述监督标签通过滑动窗口遮掩规则对训练地址文本对应的标准纠错地址文本进行文本遮掩替换所获取的步骤之前,包括如下步骤:

7、对标准纠错地址文本进行分词处理,获取所述标准纠错地址文本对应的分词序列;

8、根据三个不同取词范围的预设滑动取词窗口各自的第一预设命中概率,使用其中一种所述预设滑动取词窗口对所述分词序列进行滑动取词,获取所述分词序列对应的由取词文本组成的取词文本集;

9、根据预设待处理文本确定概率,随机将所述取词文本集中一个或多个取词文本确定为待处理文本;

10、根据同义词替换规则、文本乱序规则与原文本保留规则各自的第二预设命中概率,分别对各所述待处理文本采用其中一种规则进行文本处理,将完成文本处理的分词序列对应的文本作为训练地址文本,将各所述待处理文本作为所述训练地址文本的监督标签,生成包含所述训练地址文本与各所述监督标签的训练地址样本。

11、进一步的实施例中,对标准纠错地址文本进行分词处理,获取所述标准纠错地址文本对应的分词序列的步骤之中,包括如下步骤:

12、采用预设的命名实体识别模型,识别出地址文本中每个地址类型对应的词元;

13、基于所述地址文本中各所述地址类型对应的词元,对所述地址文本进行分词。

14、进一步的实施例中,根据同义词替换规则、文本乱序规则与原文本保留规则各自的第二预设命中概率,分别对各所述待处理文本采用其中一种规则进行文本处理,将完成文本处理的分词序列对应的文本作为训练地址文本,将各所述待处理文本作为所述训练地址文本的监督标签,生成包含所述训练地址文本与各所述监督标签的训练地址样本的步骤之前,包括如下步骤:

15、根据所述同义词替换规则,从同义词库中查询出与所述待处理文本对应的同义词文本,将所述分词序列中所述待处理文本替换为所述同义词文本,并将所述待处理文本作为所述同义词文本对应的监督标签;

16、根据所述文本乱序规则,对所述待处理文本进行文本乱序处理,生成对应的乱序文本,将所述分词序列中所述待处理文本替换为所述乱序文本,并将所述待处理文本作为所述乱序文本对应的监督标签;

17、根据所述原文本保留规则,保留所述分词序列中所述待处理文本的原文本,并将所述待处理文本作为所述原文本对应的监督标签;

18、进一步的实施例中,获取地址训练集,训练地址特征提取模型直至收敛状态的步骤之中,包括如下步骤:

19、将所述地址训练集中某一训练地址样本的训练地址文本输入至所述地址特征提取模型中,获取所述地址特征提取模型输出的所述训练地址文本对应的文本特征向量;

20、根据所述文本特征向量,预测出所述分词序列中所述监督标签对应的被遮掩替换文本,获取基于所述文本特征向量中所述被遮掩替换文本的上下文语义特征预测出的预测文本;

21、基于所述监督标签对应的标准文本,确定所述预测文本的损失值,当所述损失值未满足预设阈值时,对所述地址特征提取模型实施权重更新,并继续采用所述训练集中的训练地址样本对所述地址特征提取模型实施迭代训练至模型收敛。

22、进一步的实施例中,调用训练至收敛的地址纠错模型,确定出所述用户输入地址文本与标准纠错地址库中标准纠错地址文本之间的地址相似度的步骤之中,包括如下步骤:

23、将标准纠错地址库中标准纠错地址文本与用户输入地址文本构成地址文本对,输入至所述地址纠错模型中;

24、通过所述地址纠错模型中处于第一支路的地址特征提取模型,对所述地址文本对中所述用户输入地址文本进行深层语义提取,获得第一文本特征向量;

25、通过所述地址纠错模型中处于第二支路的地址特征提取模型,对所述地址文本对中所述标准纠错地址文本进行深层语义提取,获得第二文本特征向量;

26、通过所述地址纠错模型的线性层计算所述第一文本特征向量与所述第二文本特征向量之间的相似度,将所述相似度作为所述标准纠错地址文本与所述用户输入地址文本之间的地址相似度。

27、进一步的实施例中,筛选出所述地址相似度满足预设筛选条件的所述标准纠错地址,生成包含各所述标准纠错地址的地址纠错列表,将所述地址纠错列表推送至所述客户端的步骤之中,包括如下步骤:

28、检测各所述标准纠错地址文本与所述用户输入地址文本之间的地址相似度是否超过预设相似度阈值;

29、获取所述地址相似度超过所述预设相似度阈值的目标标准纠错地址文本,生成基于各所述目标标准纠错地址文本的所述相似度进行顺序排序的地址纠错列表,将所述地址纠错列表推送至所述客户端中。

30、适应本技术的目的而提出的一种地址纠错装置,其包括:

31、特征模型训练模块,用于获取地址训练集,训练地址特征提取模型直至收敛状态,其中,所述地址训练集中包含多个训练地址样本,各所述训练地址样本包含训练地址文本与一个或多个监督标签,所述监督标签通过滑动窗口遮掩规则对训练地址文本对应的标准纠错地址文本进行文本遮掩替换所获取;

32、地址相似度确定模块,用于接收由客户端推送的用户输入地址文本,调用训练至收敛的地址纠错模型,确定出所述用户输入地址文本与标准纠错地址库中标准纠错地址文本之间的地址相似度,其中,所述地址纠错模型为两个所述地址特征模型所组成的双塔模型;

33、纠错列表推送模块,用于筛选出所述地址相似度满足预设筛选条件的所述标准纠错地址文本,生成包含各所述标准纠错地址文本的地址纠错列表,将所述地址纠错列表推送至所述客户端。

34、进一步的实施例中,所述特征模型训练模块包括:

35、文本特征向量确定子模块,用于将所述地址训练集中某一训练地址样本的训练地址文本输入至所述地址特征提取模型中,获取所述地址特征提取模型输出的所述训练地址文本对应的文本特征向量;

36、预测文本预测子模块,用于根据所述文本特征向量,预测出所述分词序列中所述监督标签对应的被遮掩替换文本,获取基于所述文本特征向量中所述被遮掩替换文本的上下文语义特征预测出的预测文本;

37、模型迭代收敛子模块,用于基于所述监督标签对应的标准文本,确定所述预测文本的损失值,当所述损失值未满足预设阈值时,对所述地址特征提取模型实施权重更新,并继续采用所述训练集中的训练地址样本对所述地址特征提取模型实施迭代训练至模型收敛。

38、进一步的实施例中,所述地址相似度确定模块包括:

39、地址文本对输入子模块,用于将标准纠错地址库中标准纠错地址文本与用户输入地址文本构成地址文本对,输入至所述地址纠错模型中;

40、用户地址特征向量提取子模块,用于通过所述地址纠错模型中处于第一支路的地址特征提取模型,对所述地址文本对中所述用户输入地址文本进行深层语义提取,获得第一文本特征向量;

41、标准地址特征向量提取子模块,用于通过所述地址纠错模型中处于第二支路的地址特征提取模型,对所述地址文本对中所述标准纠错地址文本进行深层语义提取,获得第二文本特征向量;

42、相似度检测子模块,用于通过所述地址纠错模型的线性层计算所述第一文本特征向量与所述第二文本特征向量之间的相似度,将所述相似度作为所述标准纠错地址文本与所述用户输入地址文本之间的地址相似度。

43、进一步的实施例中,所述纠错列表推送模块包括:

44、地址相似度检测子模块,用于检测各所述标准纠错地址文本与所述用户输入地址文本之间的地址相似度是否超过预设相似度阈值;

45、地址纠错列表生成子模块,用于获取所述地址相似度超过所述预设相似度阈值的目标标准纠错地址文本,生成基于各所述目标标准纠错地址文本的所述相似度进行顺序排序的地址纠错列表,将所述地址纠错列表推送至所述客户端中。

46、为解决上述技术问题本技术实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述地址纠错方法的步骤。

47、为解决上述技术问题本技术实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述地址纠错方法的步骤。

48、为解决上述技术问题本技术实施例还提供一种计算机程序产品,包括计算机程序及计算机指令,该计算机程序及计算机指令被处理器执行时,使得所述处理器执行上述所述地址纠错方法的步骤。

49、相对于现有技术,本技术的优势如下:

50、本技术为网络电商平台构建地址纠错在线服务,使平台用户可通过使用地址纠错在线服务对其所编辑或收集的用户输入地址文本进行地址文本纠错,例如,在平台中的买家用户填写其收货地址时,用户可使用地址纠错在线服务来自动校验自身所编辑的收获地址文本中是否存在错误,若存在,则可从平台获取与其编辑的收获地址文本相似的一个或多个标准地址文本进行文本替换或文本修订,提升买家用户在平台中的网购体验,对于平台中的商家用户而言,商家用户通过使用地址检测在线服务来对购买其商品的各买家用户的收获地址进行纠错,保证买家用户的收获地址准确性无误,使得买家用户所购买的商品可顺利发货,可以理解,通过为网络电商平台提供地址纠错在线服务,可有效提升平台中买家用户的网购体验,提升商家用户的商品发货效率,保证网络电商平台的电商业务的业务执行效率。

51、另外,本技术中的地址纠错在线服务使用的地址纠错模型为由两个预训练的地址特征提取模型所组成的双塔模型,双方模型结构可同时使用两个地址特征提取模型提取用户输入地址文本及标准纠错地址文本的文本特征向量,提升了文本特征向量提取效率,进而计算双方的文本特征向量之间的相似度,使得使用地址纠错在线服务的用户可快速获取与其相似的标准纠错地址文本进行地址纠错。

52、其次,本技术中的地址特征提取模型所使用的地址训练样本具有对应的监督标签,监督标签为通过滑动窗口遮掩规则对标准纠错地址文本进行文本遮掩替换所生成,使得地址特征提取模型可采用监督标签进行模型训练,相比较传统的文本遮掩训练方式,本技术在实施文本遮掩后进一步地进行文本替换,使得地址特征提取模型可使用具有语义的训练语料进行训练,提升了地址特征提取模型的训练速度,且进行文本替换的文本为针对地址纠错在线服务的业务场景的文本,使得地址特征提取模型在提取地址文本的深层语义所生成的文本特征训练更符合地址纠错在线服务的业务需求,使得提供给用户进行地址纠错的地址纠错文本更符合用户的纠错需求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1