一种线下店铺识别的方法及装置与流程

文档序号：16268003发布日期：2018-12-14 22:03阅读：222来源：国知局

本发明涉及互联网搜索技术领域，尤其涉及一种线下店铺识别的方法及装置。

背景技术

随着互联网的不断发展，基于互联网的业务不断涌现，如通过互联网搜索附近店铺门店，或基于店铺的名称，查找该店铺的位置，提供给用户最便捷的生活体验。

互联网公司在收集线下店铺信息时，数据来源渠道多，店铺的信息也比较杂，为了避免同一家店铺多次接入，会用一种既定的模式来识别店铺。但是，仍然容易出现漏识别或者误识别的情况，无法对待接入的店铺进行准确识别，因此，识别准确性并不高。如何提高识别线下店铺的准确性是亟待解决的技术问题。

技术实现要素：

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的线下店铺识别的方法及装置。

依据本发明的第一个方面，提供了一种线下店铺识别的方法，所述方法包括：

提取待接入的线下店铺信息中用于标识所述线下店铺类型的场景特征；

从预设的同店模型库中获取与所述类别对应的同店模型，所述同店模型库包含多种类别的线下店铺对应的同店模型，不同种类的同店模型对应不同的线下店铺的类别，每种同店模型已针对对应类别的线下店铺进行优化训练；

基于所述同店模型，判断所述待接入的线下店铺是否已接入到店铺信息平台。

依据本发明的第二个方面，提供了一种线下店铺识别的装置，包括：

提取模块，用于从待接入的线下店铺的店铺数据中提取出场景特征信息；

确定模块，用于基于所述场景特征信息，确定所述待接入的线下店铺的类别；

获取模块，用于从预设的同店模型库中获取与所述类别对应的同店模型，所述同店模型库包含多种类别的线下店铺对应的同店模型，不同种类的同店模型对应不同的线下店铺的类别，每种同店模型已针对对应类别的线下店铺进行优化训练；

判断模块，基于所述同店模型，判断所述待接入的线下店铺是否已接入到店铺信息平台。

依据本发明的第三个方面，提供了一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述线下店铺识别的方法的步骤。

依据本发明的第四个方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明第一个方面中的任一方法步骤。

本说明书实施例中的上述一个或多个技术方案，至少具有如下技术效果：

本说明书实施例提供的一种线下店铺识别的方法，首先，提取待接入的线下店铺数据中的场景特征信息，然后基于该场景特征信息确定该待接入的线下店铺的类别，从预设的包含多种同店模型的同店模型库中获取与该类别对应的同店模型，最后基于该同店模型，判断该待接入的线下店铺是否已接入到店铺信息平台中。本方案中根据场景特征信息的不同，区分店铺的类别，然后针对每种类别的店铺赋予一个与其对应的同店模型来做识别匹配，由于不同种类的同店模型对应不同的线下店铺类别，因此相当于针对不同种类的店铺使用不同的模型进行识别是否有相同的店铺，而不是如现有技术只用同一种模型识别所有类型店铺，而且每种同店模型是针对对应类别的线下店铺专门进行优化训练获得的，因此让该同店模型专门对该类别的店铺做识别，更具专业性，识别精度提高，识别准确性也提高。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考图形表示相同的部件。在附图中：

图1示出了本发明实施例中线下店铺识别的方法的流程图；

图2a、图2b示出了本发明实施例中确定店铺类别的示意图；

图3示出了本发明实施例中获取与店铺类别对应的同店模型的示意图；

图4示出了本发明实施例中线下店铺识别的装置的结构示意图；

图5示出了本发明实施例中线下店铺识别服务器的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明为了提高识别线下店铺的准确性，总体思路如下：

本说明书实施例提供的一种线下店铺识别的方法，首先，提取待接入的线下店铺数据中的场景特征信息，然后基于该场景特征信息确定该待接入的线下店铺的类别，从预设的包含多种同店模型库中获取与该类别对应的同店模型，最后基于该同店模型，判断该待接入的线下店铺是否已接入到店铺信息平台中。本方案中根据场景特征信息的不同，区分店铺的类别，然后针对每种类别的店铺赋予一个与其对应的同店模型来做识别匹配，由于不同种类的同店模型对应不同的线下店铺类别，因此，相当于针对不同种类的店铺使用不同的模型进行识别是否有相同的店铺，而不是如现有技术只用同一种模型识别所有类型店铺，而且每种同店模型是针对对应类别的线下店铺专门进行优化训练获得的，因此让该同店模型专门对该类别的店铺做识别，更具专业性，识别精度提高，识别准确性也提高。

一方面，本发明第一实施例提供一种线下店铺识别的方法，该方法用于线下店铺(尤其是海外线下店铺)接入的判断中，请参考图1，包括步骤s101～s104。

s101，提取待接入的线下店铺数据中的场景特征。

其中，该场景特征信息具体包括：线下店铺的经营类型信息、语言类型信息、收单类型信息、支付渠道类型信息、位置信息中的一种或多种信息。

比如，经营类型信息具体有美食、购物、娱乐、丽人等等大的类目信息，每个大的类目信息下又可以分为多个小的类目信息，美食类目信息下可以有小吃、西餐、中餐，或者根据口味进行分类等等信息，购物类目信息下有男装、女装、童装，或者按照用途的分类信息，如生活用品、家具家电等等。语言类型信息具体为待接入的线下店铺的名称信息、地址信息以及其他信息中采用的是中文还是英文，或者是其他小语种信息。收单类型信息具体为线上收单或者线下收单。支付渠道类型信息具体是现金付款，还是线上支付(例如：网银支付、或支付宝支付、或微信支付，其中网银支付还可以对应至具体的哪家银行，比如、建设银行、工商银行、交通银行等等)、或银行按揭(对于支付金额较大商品，比如，手机、电脑等)等等。位置信息具体为待接入的线下店铺所处的国家、区域、街道等详细的地址，当然还有其他的场景特征信息，这些场景特征信息能够有效标识该店铺的特征，在此就不再详细赘述了。

在提取店铺数据的场景特征信息时，对于语言类型信息是根据店铺名称、店铺地址以及用于描述店铺的其他信息中的字符串确定语言类型信息；对于经营类型信息是根据该待接入的店铺数据中填写的经营范围确定；对于收单类型信息是根据收单时的来源信息确定的；对于支付渠道类型信息根据收款时标记的渠道来源以及支付的银行来源确定。

该线下店铺具体为固定店铺或移动店铺，固定店铺，比如超市、便利店、商场等，可以是连锁的品牌店；移动店铺，比如出租车等。

s102，基于该场景特征，确定该待接入的线下店铺的类别。

比如，如图2a所示，提取了第一家餐馆的经营类型信息是中餐，确定该经营类型场景特征信息对应的是a类别。提取了第二家餐馆的经营类型是西餐，确定经营类型场景特征信息对应的是b类别。提取第三家餐馆的经营类型是蒙餐，确定该经营类型场景特征对应的是c类别。

上述是针对一种场景特征信息对应的类别，当然，还有多种场景特征信息对应的店铺类别。

请参见图2b，一个品牌连锁超市(店铺数据：家乐福，店铺地址：二环路西一段4号，经营类型：日用百货、文体用品、副食、图书影像、服饰等，支付渠道：现金、支付宝、微信……)，提取该品牌连锁超市的经营类型信息、支付渠道信息、位置信息，确定该品牌连锁超市的经营类型信息、支付渠道信息、位置信息结合对应的类别是d类别。另外一家品牌连锁超市(店铺数据：迪卡侬，店铺地址：中山路7号，经营类型：体育用品，支付渠道：现金、银行卡、支付宝、微信……)，提取该品牌连锁超市的经营类型信息、支付渠道信息、位置信息结合对应的类别的e类别。由于这两个品牌连锁超市的店铺数据中提取的场景特征信息的筛选条件一样，但是，根据筛选条件筛选出来的具体的内容并不相同，即一个是经营日用百货、文体用品、副食、图书影像、服饰等的经营类型信息，另一个是经营体育用品(包括体育器械、运动服饰等)的经营类型信息；地址也不相同，支付渠道大致相同。因此，这两个品牌连锁超市具体所属的店铺类别就不相同。

当然，如果店铺场景特征信息的筛选条件不相同，自然，店铺的类别也不相同。

比如，一个便利店(店铺数据：全家，使用的语言名称是英文，收单类型是线下收单和线上收单)，另一个便利店(店铺数据：红旗，经营类型包括日用品以及生活便民服务项目(例如：电费充值、公交卡充值、车票售卖，支付渠道是线上和线下支付)。可见，这两个便利店的场景特征的筛选条件不相同，一个是采用使用的语言类型信息结合收单类型信息，另一个是采用经营类型信息结合支付渠道类型信息，因此，这两个便利店对应的店铺类型也不同。

当然，店铺场景信息的筛选条件数量不同，店铺的类别也不相同。

比如，一个连锁服装店(店铺数据，经营类型：男装+女装，收单类型：线上收单+线下收单)，另一个普通服装店(店铺数据：经营类型：男装+女装)。可见，这两个服装店的场景特征的筛选条件数量不同，连锁服装店有两个场景特征信息，普通服装店有一个场景特征信息。因此，这两个服装店对应的店铺类别也不同。

在确定待接入的店铺的类别之后，执行s103，从预设的同店模型库中获取与该类别对应的同店模型，该同店模型包含多种同店模型，不同种类的同店模型对应不同的线下店铺的类别，每种同店模型已针对对应类别的线下店铺进行优化训练。

对于从预设的同店模型库中获取与该类别对应的同店模型，具体有两种实现方式：

一种实现方式，根据该待接入的线下店铺的类别，获得与该类别对应的编号；基于该编号与已有的同店模型之间的对应关系表，获取与该编号对应的同店模型。

比如该店铺具体是一家中餐馆，从中提取了该中餐馆的经营类型信息(例如：主营菜品类型、口味类型)，中餐馆的语言类型信息(例如：中文)，收单类型信息(例如：线上收单+线下收单)。请参见图3，根据上述的中餐馆的经营类型信息、语言类型信息、收单类型信息结合获得该中餐馆的类别是g类别，找到与g类别店铺对应的编号为11001；然后，基于该编号11001与已有的同店模型库之间的对应关系表，获取与该编号11001对应的同店模型为同店模型18，也就是根据对应关系表，获取对应该类别的同店模型。

另一种实现方式，基于上述的店铺类别，通过分类器映射至对应的同店模型，从而获得该同店模型。比如，基于中餐馆的g类别，由分类器将该中餐馆的g类别映射至对应的同店模型18；基于线下商超的h类别，由分类器将该线下商超的h类别映射至对应的同店模型2。该分类器是基于店铺类别映射至具有该店铺类别属性的同店模型。

该分类器的输入是店铺类别(a类别、b类别、c类别……)，输出是与该店铺类别对应的同店模型(同店模型1、同店模型2……同店模型n)。该同店模型(同店模型n)能够对与之对应的x类别的店铺进行有效识别，即专门的模型做对专门类别的店铺的识别，专业性强，识别精度提高，因此，识别准确性也得到提高。

该同店模型库包含多种同店模型，不同种类的同店模型对应不同的线下店铺的类别。

其中，每种同店模型已针对对应类别的线下店铺进行优化训练，比如，针对无人超市类别(结合线上支付渠道信息和经营类型信息)的店铺，可以采集现有的位于不同区域位置的无人超市的店铺数据(比如，店铺名称：xx店、店铺地址：高新区天晖路17号、经营类型：生活用品和食品、支付渠道：支付宝……)作为店铺数据样本进行优化训练。针对品牌连锁超市类别(结合多种支付渠道信息和经营类型信息)的店铺，可以采集现有多种品牌的连锁超市对应的店铺数据(比如，店铺名称:家乐福(carrefour)，店铺地址：二环路西一段4号，经营类型：日用百货、文体用品、副食、图书影像、服饰等，支付渠道：现金、支付宝、微信……)作为店铺数据样本进行优化训练。

该同店模型训练过程中，需要对训练该同店模型所采集的店铺数据中各数据的权重进行设定。比如，对于无人超市类别的店铺，设定线上支付信息的权重系数以及经营类型信息的权重系数均为30％，其他数据的权重和为40％；

不同种类的同店模型是针对不同类别的线下店铺的店铺数据要素进行优化训练的。

比如，针对支付类型的店铺(比如品牌连锁超市)，根据店铺数据中的支付渠道场景信息确定该店铺是支付类型的店铺。因此，在采集该支付类型的店铺数据作为数据样本进行优化训练时，通过采集银行渠道信息、支付宝、微信支付等等信息进行优化训练，同时增加这些数据的权重系数。针对非支付类型的店铺(比如黄页店铺)，由于黄页店铺仅是展示数据，因此，在采集该黄页店铺的店铺数据作为数据样本进行优化训练时，通过采集店铺名称、店铺位置信息进行优化训练，同时增加该数据的权重系数。如果该支付类型的店铺在优化训练中采用的是非支付类型的店铺的店铺数据，具体是仅采集店铺名称和店铺地址信息，那么优化训练得到的同店模型无法对多个支付类型的店铺进行有效识别，造成店铺识别失误率提高。因此，不同类别的线下店铺对应的同店模型在训练时，采集的店铺数据的要素侧重点不同，该店铺数据要素的权重也不一样。通过优化训练得到的同店模型也不一样。

s104，基于该同店模型，判断该待接入的线下店铺数据是否已接入到店铺信息平台。

具体地，包括：

基于该同店模型的要求，对该待接入的线下店铺的店铺数据进行配置；将配置好的店铺数据输入给同店模型；将该店铺信息平台中已有的店铺数据输入给同店模型；基于该同店模型的输出结果来判断待接入的线下店铺是否已接入到店铺信息平台。

在具体实施过程中，不同的同店模型对于输入的数据有不同的要求，所以，需要根据每个同店模型的要求，来配置输入数据。

在具体的实现方式中，该同店模型有两个输入，第一个输入是经过处理后的待接入的店铺数据，该处理即上述的配置过程，该配置过程被认为是该同店模型所允许的配置，配置后的店铺数据中保留了该同店模型在做识别匹配时所需的数据，剔除了无用的数据。第二个输入是该店铺信息平台中已有的店铺数据，采用全部已有的店铺数据作为第二个输入，当然，该第二个输入可以是每个同店模型已经输入好的，不用每次都输入。在对每个待接入的店铺数据进行识别匹配时，能够保证匹配过程将已有的店铺数据与待接入的店铺数据都做过匹配，避免漏掉可能存在的相同店铺。该同店模型有一个输出，输出的结果是经过将待接入的店铺数据与店铺信息平台中已有的店铺数据进行匹配后，确定有相同店铺的结果或者没有相同店铺的结果。

该同店模型在对待接入的店铺的店铺数据与店铺信息平台中已有的店铺数据进行匹配时，需要考虑待接入的店铺的店铺数据中各数据的权重系数，该权重系数是同店模型预先设置的，按照同店模型预先设置的各数据的权重系数来识别店铺，从而获得识别结果。

比如，一个待接入的店铺的店铺数据中经营类型信息的权重系数为50％、地址信息的权重系数为30％、支付渠道的权重系数为10％、剩余其他信息的权重系数和为10％，根据上述这些信息的权重系数，从而在匹配中结合权重系数，使得识别的结果准确性更高。

在执行s104之后，如果确定该待接入的店铺已接入到店铺信息平台，就禁止该待接入的线下店铺再次接入。如果确定该待接入的店铺未接入到店铺信息平台，此时，允许该待接入的线下店铺接入。这样，有效避免相同店铺的重复接入。

在对待接入的线下店铺进行场景特征信息识别时，已有的场景特征信息是根据线上店铺信息的场景特征信息来总结归纳的。比如，线上店铺有超市类别(经营类型主要为日用品)、衣物购物类别(经营类型主要为衣物)、商城类别(综合了日用品、衣物、家电等经营类型)等等，在对线下店铺的场景特征信息提取过程中，按照线上店铺的总结归纳的场景特征信息进行区分。

在该线下店铺的识别中，还包括：对同店模型的动态配置过程。具体的配置是增加，删除，调整同店模型。

第一种，对于增加的情况，该增加是开发人员对同店模型通过开发得到的。比如，当前输入夜间便利店(经营类型为小吃和日用品)，在已有的场景特征库中没有找到对应的夜间便利店的场景特征信息类别的店铺，确定该夜间便利店是新类别的店铺，对应增加该夜间便利店的同店模型。

第二种，对于调整的情况，该调整也是开发人员对同店模型通过开发得到的。比如，自动售卖机类别的店铺，由于在使用过程中，之前的自动售卖机大多是投币支付方式，而现有的自动售卖机已经逐渐采用线上支付方式，之前投币支付方式对应的同店模型中支付类型是现金支付，但是，由于投币支付的自动售卖机已经不存在了，对应该投币支付的自动售卖机的同店模型的使用频率降低，或者不再使用，使得当前的自动售卖机类别的店铺发生变化，与之对应的同店模型也需要进行调整，具体是对该自动售卖机类别的店铺对应的同店模型中的支付类型进行调整，具体的调制是修改支付渠道信息中的投币支付为扫码的线上支付。

第三种，对于删除的情况，该删除的操作是在识别线下店铺中进行的，具体地，在检测已有的同店模型已经不符实际情况，不具有保留价值时，即该同店模型使用率低于预设使用率时，则对该同店模型进行删除。

比如，一个销售电器的门店，经营类型是经营dvd或者vcd的店铺，随着经济的发展，这一类店铺都关门或者改变了经营类型，原有经营dvd或者vcd的店铺对应的经营类型场景特征信息也逐渐不存在，对应的同店模型相应删除。

采用上述动态配置的方式，具体的配置是增加，删除，调整同店模型，使得同店模型更加适应实际环境的需求。

基于同一发明构思，本发明第二实施例还提供一种线下店铺识别装置，请参见图4，包括：

提取模块401，用于从待接入的线下店铺的店铺数据中提取出场景特征信息；

确定模块402，用于基于所述场景特征信息，确定所述待接入的线下店铺的类别；

获取模块403，用于从预设的同店模型库中获取与所述类别对应的同店模型，所述同店模型库包含多种类别的线下店铺对应的同店模型，不同种类的同店模型对应不同的线下店铺的类别，每种同店模型已针对对应类别的线下店铺进行优化训练；

判断模块404，基于所述同店模型，判断所述待接入的线下店铺是否已接入到店铺信息平台。

作为一种可选的实施方式，获取模块403具体包括：

第一获取单元，用于基于所述待接入的线下店铺的类别，获得与所述类别对应的编号；

第二获取单元，用于基于所述编号与已有的同店模型之间的对应关系表，获取与所述编号对应的同店模型。

作为一种可选的实施方式，判断模块403具体为：

配置单元，用于基于所述同店模型的要求，对所述待接入的线下店铺的店铺数据进行配置；

第一输入单元，用于将配置好的店铺数据输入给所述同店模型；

第二输入单元，用于将所述店铺信息平台中已有的店铺数据输入给所述同店模型；

判断单元，用于基于所述同店模型的输出结果来判断所述待接入的线下店铺是否已接入到店铺信息平台。

作为一种可选的实施方式，还包括：

检测模块，用于检测已有的同店模型的使用率是否低于预设使用率；

删除模块，用于在低于预设使用率时，对同店模型进行删除。

关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关方法的实施例中进行了详细描述，此处不再详细阐述。

基于与前述实施例中线下店铺识别的方法同样的发明构思，本发明还提供一种服务器，如图5所示，包括存储器504、处理器502及存储在存储器504上并可在处理器502上运行的计算机程序，所述处理器502执行所述程序时实现前文所述线下店铺识别的方法中的任一方法的步骤。

其中，在图5中，总线架构(用总线500来代表)，总线500可以包括任意数量的互联的总线和桥，总线500将包括由处理器502代表的一个或多个处理器和存储器504代表的存储器的各种电路链接在一起。总线500还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口506在总线500和接收器501和发送器503之间提供接口。接收器501和发送器503可以是同一个元件，即收发机，提供用于在传输介质上与各种其他装置通信的单元。处理器502负责管理总线500和通常的处理，而存储器504可以被用于存储处理器502在执行操作时所使用的数据。

基于与前述实施例中线下店铺识别的方法相同的发明构思，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前文所述线下店铺识别的方法的任一方法的步骤。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品，该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本说明书的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

显然，本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样，倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内，则本说明书也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：熊剑
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种墨盒自动化真空包装机的制作方法
上一篇：一种眼底成像光学系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。