本发明涉及计算机,尤其涉及一种小程序服务区域的确定方法、校验方法及设备。
背景技术:
1、当前,小程序中出现搜索推荐服务但用户不可达的情况,即平台推荐b城市服务给a城市用户,则该b城市服务对于a城市用户不可达。其原因在于,当前服务区域检验方案中的模型构建是基于是对小程序主体的静态信息进行解析识别,但小程序服务是以动态服务内容为主且具有主体特色的复杂内容生态,单一的字面理解不能准确挖掘服务区域,往往会存在小程序名称和商家主体名称中的区域信息不匹配的问题,进而导致小程序的提报区域与实际服务区域不一致,该问题是行业内亟需解决的问题。
技术实现思路
1、本说明书一个或多个实施例描述了小程序服务区域的确定方法、校验方法及设备,能够准确刻画小程序的真实服务区域,确保服务端能够对小程序的真实服务区域进行精准地流量分发推荐。
2、根据第一方面,提供了一种小程序服务区域的确定方法,包括:
3、获取目标小程序的基础文本信息和经营页面图像;
4、对所述基础文本信息进行主体要素抽取,得到与服务区域相关的主体要素信息;
5、将所述经营页面图像输入预训练的多模态分类模型,得到所述目标小程序所属的行业类别;
6、基于所述主体要素信息和所述行业类别,确定所述目标小程序的服务区域特征向量;
7、将所述服务区域特征向量输入第一识别模型,得到所述服务区域是否为全国区域的识别结果;
8、若所述服务区域不是全国区域,则获取所述目标小程序的店铺名称、店铺地址和用户访问行为数据,基于所述店铺名称、店铺地址和所述用户访问行为数据,确定所述目标小程序的服务区域。
9、作为第一方面所述方法的一种可选实施方式,对所述基础文本信息进行主体要素抽取,得到与服务区域相关的主体要素信息,具体包括:
10、将所述基础文本信息输入命名实体识别模型,得到所述主体要素信息;所述命名实体识别模型是基于与所述服务区域相关的训练任务预先训练得到的。
11、作为第一方面所述方法的一种可选实施方式,基于所述主体要素信息和所述行业类别,确定所述目标小程序的服务区域特征向量,具体包括:
12、基于所述主体要素信息和所述行业类别,从预先构建的知识库中检索出相关的补充信息,基于所述补充信息,对所述主体要素信息和所述行业类别进行量化,得到所述服务区域特征向量。
13、作为第一方面所述方法的一种可选实施方式,所述第一识别模型为预训练的二分类模型,所述第一识别模型被训练为用于判断输入的所述服务区域特征向量对应的服务区域是否为全国区域。
14、作为第一方面所述方法的一种可选实施方式,在所述小程序服务区域的确定方法中,获取所述目标小程序的店铺名称和店铺地址,具体包括:
15、从所述经营页面图像中解析提取店铺名称及店铺地址;
16、基于所述店铺名称、店铺地址和所述用户访问行为数据,确定所述目标小程序的服务区域,具体包括:
17、在地图中检索所述目标小程序的店铺名称,得到至少一个候选地址;
18、从所述用户访问行为数据中提取用户访问行为发生地址;
19、基于所述用户访问行为发生地址、所述店铺地址和所述至少一个候选地址,确定所述目标小程序的服务区域。
20、根据第二方面,提供了一种小程序服务区域的校验方法,包括:
21、获取目标小程序的提报区域;
22、采用所述的小程序服务区域的确定方法,确定所述目标小程序的服务区域;
23、将所述服务区域的区域层级调整至与所述提报区域的区域层级一致;
24、确定处于同一区域层级的所述服务区域和所述提报区域是否一致。
25、根据第三方面,提供了一种小程序服务区域的确定装置,包括:
26、第一数据获取模块,配置为获取目标小程序的基础文本信息和经营页面图像;
27、静态主体信息获取模块,配置为对所述基础文本信息进行主体要素抽取,得到与服务区域相关的主体要素信息;
28、动态经营内容获取模块,配置为将所述经营页面图像输入预训练的多模态分类模型,得到所述目标小程序所属的行业类别;
29、量化特征生成模块,配置为基于所述主体要素信息和所述行业类别,确定所述目标小程序的服务区域特征向量;
30、第一识别模块,配置为将所述服务区域特征向量输入第一识别模型,得到所述服务区域是否为全国区域的识别结果;
31、第二识别模块,配置为当所述服务区域不是全国区域时,获取所述目标小程序的店铺名称、店铺地址和用户访问行为数据,并基于所述店铺名称、店铺地址和所述用户访问行为数据确定所述目标小程序的服务区域。
32、作为第三方面所述装置的一种可选实施方式,所述第二识别模块包括:
33、页面解析模块,配置为从所述经营页面图像中解析提取店铺名称及店铺地址;
34、外部检索模块,配置为在地图中检索所述目标小程序的店铺名称,得到至少一个候选地址;
35、行为聚类模块,配置为从所述用户访问行为数据中提取用户访问行为发生地址,并对所述用户访问行为发生地址进行聚类,得到至少一个聚类结果;
36、决策模块,配置为基于所述店铺地址、所述至少一个候选地址和所述至少一个聚类结果,采用多人投票的方式,确定所述目标小程序的服务区域。
37、根据第四方面,提供了一种小程序服务区域的校验装置,包括:
38、第二数据获取模块,配置为获取目标小程序的提报区域;
39、所述小程序服务区域的确定装置,配置为确定所述目标小程序的服务区域;
40、区域单位统一模块,配置为将所述服务区域的区域层级调整至与所述提报区域的区域层级一致;
41、校验模块,配置为确定处于同一区域层级的所述服务区域和所述提报区域是否一致。
42、根据第五方面,提供了一种电子设备,包括:
43、至少一个存储器,用于存储程序;
44、至少一个处理器,用于执行所述存储器存储的程序,当所述存储器存储的程序被执行时,所述处理器用于执行所述的小程序服务区域的确定方法,或者,执行所述的小程序服务区域的校验方法。
45、根据第六方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序在电子设备上运行时,使得所述电子设备执行所述的小程序服务区域的确定方法,或者,执行所述的小程序服务区域的校验方法。
46、本说明书的一个或多个实施例所提供的一种小程序服务区域的确定方法,该方法融合了静态的基础文本信息解析和动态经营页面图像的意图理解,能够准确挖掘小程序的服务区域,大幅度改善小程序搜索流量分发和供给侧的服务区域不一致的问题。
47、本说明书的一个或多个实施例所提供的小程序服务区域的校验方法、小程序服务区域的确定装置以及小程序服务区域的校验装置同样具有上述有益效果。