优质品牌的识别方法及装置与流程

文档序号:17015157发布日期:2019-03-02 02:25阅读:188来源:国知局
优质品牌的识别方法及装置与流程

本发明涉及软件领域,具体涉及一种优质品牌的识别方法及装置。



背景技术:

品牌是区分不同店铺、不同商品乃至不同商品系列的核心指标之一。品牌的优质与否从一定程度上反应了店铺或商品的质量、人气值、受欢迎程度等。对于拥有多个品牌的平台而言,优质的品牌可以提升平台的人气,吸引用户关注并使用平台;对于商家而言,优质的品牌可以建立良好的口碑。同时,商家也可以借鉴优质品牌的商品。

但由于平台当前拥有的品牌五花八门,且数量较多,无法确定其中哪些品牌是优质品牌,哪些品牌属于非优质品牌。隶属优质品牌的店铺所销售的的商品一般都具有关联性,优质品牌的店铺相关之间也会相互影响,更提高优质品牌对用户的吸引力。非优质品牌包括了真实品牌和伪品牌,其中,伪品牌下的多家店铺不具有关联性或共性,其多家店铺间的商品均不相似,如某“xxx”品牌下有3家店铺,1家是川菜类店铺,1家是粤菜类店铺,1家是麻辣烫店铺。明显在这个品牌下的各家店铺销售的商品不具有相似性,均为不同类型的店铺,其不具备优质品牌的特性。隶属真实品牌的大多店铺所销售的商品也具有关联性,但真实品牌下也存在“挂羊头卖狗肉”的情况,如某真实品牌下的一家店铺,其销售的商品与该品牌相关性极低,与该品牌下的其他家店铺销售的商品没有相似性,这家店铺大大拉低了该真实品牌的质量,使得该品牌无法产生优质品牌的效益。

综合上述情况,急需一种品牌进行识别的方法,以确认品牌是否为优质品牌。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的优质品牌的识别方法及装置。

根据本发明的一个方面,提供了一种优质品牌的识别方法,其包括:

获取待识别品牌的品牌数据;其中,品牌数据包括品牌信息、隶属该待识别品牌的多个店铺的店铺信息以及各个店铺对应的多种商品的商品信息;

对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵;

对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果;

根据品牌聚类结果识别待识别品牌是否为优质品牌。

可选地,获取待识别品牌的品牌数据进一步包括:

获取待识别品牌的品牌信息以及隶属该待识别品牌的多个店铺的店铺信息;

针对每个店铺,按照预设整合规则将该店铺对应的所有商品的商品信息进行整合处理,得到该店铺对应的多种商品的商品信息;其中,预设整合规则包括根据各种商品的销售量过滤其中低于预设销售量的商品的商品信息;和/或,根据各种商品的商品名称进行去重。

可选地,对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果进一步包括:

按照预设聚类规则选取中心点和半径值;计算商品特征矩阵中各个店铺的商品向量与中心点的距离向量;根据距离向量计算得到中心点偏移向量;判断中心点偏移向量是否大于或等于预设偏移值;若是,根据中心点偏移向量更新中心点,重复执行以上步骤,直至中心点偏移向量小于预设偏移值;

返回品牌聚类结果;其中,品牌聚类结果包括各个店铺的商品向量与中心点的距离向量、中心点和半径值。

可选地,对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量进一步包括:

遍历店铺对应的多种商品的商品名称,对各种商品的商品名称进行分词处理,得到店铺对应的多个商品分词;

对多个商品分词进行向量化处理,得到店铺的商品向量。

可选地,方法还包括:

预先设置商品分词的向量值和权重值;其中,权重值与商品分词在对应的品牌的所有商品信息中出现的次数相关;

对多个商品分词进行向量化处理,得到店铺的商品向量进一步包括:

获取多个商品分词的向量值和权重值,得到店铺的商品向量。

可选地,在得到待识别品牌对应的商品特征矩阵之后,方法还包括:

判断商品特征矩阵是否为稀疏矩阵;

若是,对商品特征矩阵进行压缩处理。

可选地,预设聚类规则为选取商品特征矩阵中任一店铺的商品向量为中心点,和/或;计算商品特征矩阵中所有店铺的商品向量的平均向量为中心点。

可选地,根据品牌聚类结果识别待识别品牌是否为优质品牌进一步包括:

统计品牌聚类结果中商品特征矩阵中各个店铺的商品向量与中心点的距离向量小于或等于半径值的店铺的数量;

根据店铺的数量识别待识别品牌是否为优质品牌。

可选地,根据店铺的数量识别待识别品牌是否为优质品牌进一步包括:

判断店铺的数量是否等于隶属该待识别品牌的店铺的数量;

若是,识别待识别品牌为优质品牌;否则,识别待识别品牌为非优质品牌。

可选地,若待识别品牌为非优质品牌,根据店铺的数量识别待识别品牌是否为优质品牌进一步包括:

统计品牌聚类结果中各个店铺的商品向量与中心点的距离向量大于半径值的店铺;

识别店铺为伪品牌店铺。

可选地,获取待识别品牌的品牌数据进一步包括:

采集各个品牌的品牌数据;

根据预设品牌筛选规则对各个品牌的品牌数据进行筛选处理,得到待识别品牌的品牌数据;其中,预设品牌筛选规则包括过滤隶属品牌的多个店铺的店铺数量低于预设值的品牌。

根据本发明的另一方面,提供了一种基于优质品牌进行商品推荐方法,其包括:

利用上述优质品牌的识别方法对多个品牌进行识别得到优质品牌,获取隶属优质品牌的店铺对应的商品信息,推荐给商家。

可选地,方法还包括:

获取商家的店铺信息和/或店铺中的商品信息;

获取隶属优质品牌的店铺对应的商品信息,推荐给商家进一步包括:

根据商家的店铺信息和/或店铺中的商品信息,获取与其具有关联性的隶属优质品牌的店铺对应的商品信息,推荐给商家;其中,关联性为与商家的店铺类别信息和/或商品类别信息相同。

可选地,方法还包括:

接收商家触发的商品录入操作请求,获取商家从隶属优质品牌的店铺对应的商品信息选取的商品信息,生成商家商品录入信息。

根据本发明的又一方面,提供了一种优质品牌的识别装置,其包括:

获取模块,适于获取待识别品牌的品牌数据;其中,品牌数据包括品牌信息、隶属该待识别品牌的多个店铺的店铺信息以及各个店铺对应的多种商品的商品信息;

向量化模块,适于对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵;

聚类模块,适于对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果;

识别模块,适于根据品牌聚类结果识别待识别品牌是否为优质品牌。

可选地,获取模块进一步适于:

获取待识别品牌的品牌信息以及隶属该待识别品牌的多个店铺的店铺信息;

针对每个店铺,按照预设整合规则将该店铺对应的所有商品的商品信息进行整合处理,得到该店铺对应的多种商品的商品信息;其中,预设整合规则包括根据各种商品的销售量过滤其中低于预设销售量的商品的商品信息;和/或,根据各种商品的商品名称进行去重。。

可选地,聚类模块进一步适于:

按照预设聚类规则选取中心点和半径值;计算商品特征矩阵中各个店铺的商品向量与中心点的距离向量;根据距离向量计算得到中心点偏移向量;判断中心点偏移向量是否大于或等于预设偏移值;若是,根据中心点偏移向量更新中心点,重复执行以上处理,直至中心点偏移向量小于预设偏移值;

返回品牌聚类结果;其中,品牌聚类结果包括各个店铺的商品向量与中心点的距离向量、中心点和半径值。

可选地,向量化模块进一步适于:

遍历店铺对应的多种商品的商品名称,对各种商品的商品名称进行分词处理,得到店铺对应的多个商品分词;

对多个商品分词进行向量化处理,得到店铺的商品向量。

可选地,装置还包括:

向量预设模块,适于预先设置商品分词的向量值和权重值;其中,权重值与商品分词在对应的品牌的所有商品信息中出现的次数相关;

向量化模块进一步适于:获取多个商品分词的向量值和权重值,得到店铺的商品向量。

可选地,装置还包括:

判断模块,适于判断商品特征矩阵是否为稀疏矩阵;若是,对商品特征矩阵进行压缩处理。

可选地,预设聚类规则为选取商品特征矩阵中任一店铺的商品向量为中心点,和/或;计算商品特征矩阵中所有店铺的商品向量的平均向量为中心点。

可选地,识别模块进一步适于:

统计品牌聚类结果中商品特征矩阵中各个店铺的商品向量与中心点的距离向量小于或等于半径值的店铺的数量;

根据店铺的数量识别待识别品牌是否为优质品牌。

可选地,识别模块进一步适于:

判断店铺的数量是否等于隶属该待识别品牌的店铺的数量;

若是,识别待识别品牌为优质品牌;否则,识别待识别品牌为非优质品牌。

可选地,识别模块进一步适于:

统计品牌聚类结果中各个店铺的商品向量与中心点的距离向量大于半径值的店铺;

识别店铺为伪品牌店铺。

可选地,获取模块进一步适于:

采集各个品牌的品牌数据;

根据预设品牌筛选规则对各个品牌的品牌数据进行筛选处理,得到待识别品牌的品牌数据;其中,预设品牌筛选规则包括过滤隶属品牌的多个店铺的店铺数量低于预设值的品牌。

根据本发明的再一方面,提供了一种基于优质品牌进行商品推荐装置,其包括:

推荐模块,适于利用上述优质品牌的识别装置对多个品牌进行识别得到优质品牌,获取隶属优质品牌的店铺对应的商品信息,推荐给商家。

可选地,装置还包括:

商家获取模块,适于获取商家的店铺信息和/或店铺中的商品信息;

推荐模块进一步适于:根据商家的店铺信息和/或店铺中的商品信息,获取与其具有关联性的隶属优质品牌的店铺对应的商品信息,推荐给商家;其中,关联性为与商家的店铺类别信息和/或商品类别信息相同。

可选地,装置还包括:

生成模块,适于接收商家触发的商品录入操作请求,获取商家从隶属优质品牌的店铺对应的商品信息选取的商品信息,生成商家商品录入信息。

根据本发明的再一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;

存储器用于存放至少一可执行指令,可执行指令使处理器执行上述优质品牌的识别方法对应的操作。

根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述优质品牌的识别方法对应的操作。

根据本发明的再一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;

存储器用于存放至少一可执行指令,可执行指令使处理器执行上述基于优质品牌进行商品推荐方法对应的操作。

根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述基于优质品牌进行商品推荐方法对应的操作。

根据本发明提供的优质品牌的识别方法及装置,获取待识别品牌的品牌数据;其中,品牌数据包括品牌信息、隶属该待识别品牌的多个店铺的店铺信息以及各个店铺对应的多种商品的商品信息;对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵;对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果;根据品牌聚类结果识别待识别品牌是否为优质品牌。基于品牌数据本身进行向量化处理、聚类处理,可以精准的识别品牌中的商品是否高度内聚,从而准确识别出品牌是否为优质品牌。利用本发明可以准确的对品牌进行识别,更精准的发现优质品牌。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的优质品牌的识别方法的流程图;

图2示出了根据本发明另一个实施例的优质品牌的识别方法的流程图;

图3示出了根据本发明一个实施例的基于优质品牌进行商品推荐方法的流程图;

图4示出了根据本发明一个实施例的优质品牌的识别装置的功能框图;

图5示出了根据本发明一个实施例的基于优质品牌进行商品推荐装置的功能框图;

图6示出了根据本发明一个实施例的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明可以对一个品牌进行识别,一次识别一个品牌是否为优质品牌;也可以对多个品牌进行识别,识别其中是否存在优质品牌。具体的,在对多个品牌进行识别时,可以一次获取多个品牌的品牌数据,针对每个品牌的品牌数据分别执行本发明的各个步骤,依次识别每个品牌是否优质品牌,从而得到多个品牌中是否存在优质品牌;也可以一次仅获取一个品牌的品牌数据,执行本发明各步骤,在识别该品牌是否优质品牌后,对下一品牌的品牌数据执行本发明各步骤,直至识别完成多个品牌。

图1示出了根据本发明一个实施例的优质品牌的识别方法的流程图。如图1所示,优质品牌的识别方法具体包括如下步骤:

步骤s101,获取待识别品牌的品牌数据。

品牌可以涉及任一商业,如餐饮类品牌、服务类品牌、休闲娱乐类品牌等,本实施例中涉及的品牌数据以餐饮类品牌数据为例进行说明,但本发明不仅限定于餐饮类品牌。

对于一个品牌而言,一般其旗下包括了多个店铺,这些店铺均隶属该品牌。多个店铺可以以分店、连锁等方式隶属该品牌,且多个店铺会记录其隶属的品牌。为方便更好的理解本发明,本实施例以一个待识别品牌为例进行说明,当需要对多个品牌进行识别时,可以针对每个品牌作为待识别品牌分别进行识别。对一个待识别品牌,需要先获取待识别品牌的品牌数据。其中,品牌数据包括如品牌信息、隶属该待识别品牌的多个店铺的店铺信息以及各个店铺对应的多种商品的商品信息。品牌信息包括如品牌id、品牌名称、品牌类别、品牌描述等信息,本实施例中主要根据品牌id、品牌名称等品牌数据进行识别;根据店铺信息所包括的品牌id可以筛选出隶属该待识别品牌的多个店铺的店铺信息,店铺信息包括店铺id、店铺名称、店铺类别、店铺地址等信息,本实施例中主要根据店铺id、店铺名称等品牌数据进行识别;店铺对应的多种商品的商品信息可以根据店铺id筛选出店铺对应的多种商品的商品信息,商品信息包括商品id、商品名称、商品类别、商品图片、商品描述等信息,本实施例中主要根据商品id、商品名称等品牌数据进行识别。

进一步,对获取到的待识别品牌的品牌数据进行整理,方便后续处理,如利用队列、数组、堆栈等数据存储结构存储品牌数据。以队列为例,建立多个队列,一个店铺信息对应一个队列,在一个队列中存储一个店铺对应的多种商品的商品信息,方便可以准确的定位店铺以及商品信息。

步骤s102,对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵。

从商品信息中提取商品特征,如商品为菜品,菜品信息中包括了菜品名称、菜品类别等信息,根据菜品信息提取最能代表菜品的菜品特征,将菜品特征向量化处理为具体的向量值,以向量值来代表各个菜品。在向量化处理各个商品特征时,可以根据商品特征在待识别品牌所有店铺中出现的次数、频率、相关度等因素设置对应的向量值。即在对商品特征进行向量化处理后,得到每个店铺的商品向量。聚合各个店铺的商品向量,得到的是该待识别品牌对应的商品特征矩阵,即隶属该待识别品牌的各个店铺中商品特征的向量值集合。

步骤s103,对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果。

利用各种聚类算法,对待识别品牌对应的商品特征矩阵的各向量值进行聚类处理,如使待识别品牌对应的商品特征矩阵中的向量值向某中心点进行聚合,从而可以检测得到待识别品牌中各个店铺的商品间是否高度内聚、是否具有关联性等品牌聚类结果。

步骤s104,根据品牌聚类结果识别待识别品牌是否为优质品牌。

通过聚类处理得到的品牌聚类结果,表明了待识别品牌中各个店铺的商品间是否高度内聚,若待识别品牌中各个店铺的商品间高度内聚,说明待识别品牌中各个店铺的商品间具有关联性,隶属该待识别品牌的各个店铺也具有关联性,因此,可以识别该待识别品牌为优质品牌;否则,识别该待识别品牌为非优质品牌。

根据本发明提供的优质品牌的识别方法,获取待识别品牌的品牌数据;其中,品牌数据包括品牌信息、隶属该待识别品牌的多个店铺的店铺信息以及各个店铺对应的多种商品的商品信息;对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵;对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果;根据品牌聚类结果识别待识别品牌是否为优质品牌。基于品牌数据本身进行向量化处理、聚类处理,可以精准的识别品牌中的商品是否高度内聚,从而准确识别出品牌是否为优质品牌。利用本发明可以准确的对品牌进行识别,更精准的发现优质品牌。

图2示出了根据本发明另一个实施例的优质品牌的识别方法的流程图。如图2所示,优质品牌的识别方法具体包括如下步骤:

步骤s201,采集各个品牌的品牌数据。

针对一个平台而言,其拥有多个品牌,在对各个品牌进行识别时,需要先对各个品牌进行采集,获取各个品牌的品牌数据,方便根据各个品牌的品牌数据进行识别,识别出平台拥有的品牌是否为优质品牌。

其中,品牌数据包括如品牌信息、隶属该待识别品牌的多个店铺的店铺信息以及各个店铺对应的多种商品的商品信息。

步骤s202,根据预设品牌筛选规则对各个品牌的品牌数据进行筛选处理,得到待识别品牌的品牌数据。

在采集到各个品牌的品牌数据后,直接根据品牌数据可以看到品牌本身存在良莠不齐的情况,为减轻后续步骤的工作量,可以先根据预设品牌筛选规则对各个品牌的品牌数据进行筛选处理,去除明显非优质品牌的品牌数据。预设品牌筛选规则包括过滤隶属品牌的多个店铺的店铺数量低于预设值的品牌。当一个品牌数据中,如隶属该品牌的店铺数量低于3,该品牌仅有1家或2家店铺,从店铺数量、品牌规模上可以排除该品牌为优质品牌。

根据预设品牌筛选规则对各个品牌的品牌数据进行筛选处理后,过滤掉明显非优质品牌的品牌数据,得到待识别品牌的品牌数据。当待识别品牌的品牌数据为多个品牌的品牌数据时,针对每个品牌,均执行以下步骤,完成对所有待识别品牌的识别。

步骤s203,获取待识别品牌的品牌信息以及隶属该待识别品牌的多个店铺的店铺信息。

获取待识别品牌的如品牌id、品牌名称、品牌类别、品牌描述等信息品牌信息,并根据品牌id筛选出隶属该待识别品牌的多个店铺,获取对应的如店铺id、店铺名称、店铺类别、店铺地址等店铺信息。

步骤s204,针对每个店铺,按照预设整合规则将该店铺对应的所有商品的商品信息进行整合处理,得到该店铺对应的多种商品的商品信息。

对于获取到的多个店铺的信息,针对每个店铺均执行该步骤,从而得到各个店铺对应的多种商品的商品信息。

具体的,预设整合规则包括根据各种商品的销售量过滤其中低于预设销售量的商品的商品信息、根据各种商品的商品名称进行去重等。以菜品为例进行说明,店铺在应对不同季节时,会准备多种菜单,每种菜单中除包括了基础菜品外,还包括不同的时令菜品以应对不同季节,或者,店铺针对各个节假日会推出包括基础菜品和特色菜品的菜单等,这样导致店铺中的菜品信息存储上会存在重复的问题。当店铺在盘点菜品的销售量时,也会将销售量小的菜品从菜单上下架不再销售,但这些菜品对应的菜品信息还会存储,导致在获取店铺对应的菜品信息时依然会获取到销售量小的菜品信息,这些菜品信息一般销售期短,销售量小,其不是店铺的主要菜品信息,在后续计算中,反而影响店铺中其他菜品信息的聚合性、关联性,因此,需要过滤这些菜品信息。基于上述因素影响,在获取到一个店铺中所有的商品信息后,根据预设整合规则,对商品信息进行整合,过滤掉其中商品销售量低于预设销售量的商品的商品信息,并根据各种商品的商品名称进行去重处理,商品名称重复的商品信息仅保留一份商品信息即可等。

针对一个待识别品牌的每个店铺在均执行完该步骤后,得到该待识别品牌的各个店铺对应的多种商品的商品信息。此处,待识别品牌的各个店铺的商品信息可以利用如队列、数组、堆栈等数据存储结构存储。以队列为例,建立多个队列,一个店铺信息对应一个队列,在一个队列中存储一个店铺对应的多种商品的商品信息,方便可以准确的定位店铺以及商品信息。

步骤s205,遍历店铺对应的多种商品的商品名称,对各种商品的商品名称进行分词处理,得到店铺对应的多个商品分词。

步骤s206,对多个商品分词进行向量化处理,得到店铺的商品向量。

对于获取到的各个店铺的多种商品的商品信息,还需要针对每个店铺均执行步骤s205-s206,得到各个店铺的商品向量。

在一个实施例中,如以菜品为例,当前菜品名称为“西红柿鸡蛋”,将该菜品名称进行分词处理,得到该菜品的两个菜品分词“西红柿”和“鸡蛋”。在处理当前菜品名称后,在继续处理下一菜品名称,直至遍历处理完该店铺所有菜品名称,得到该店铺对应的多个菜品分词。

针对一个店铺,需遍历该店铺对应的多种商品的商品信息,获取商品的商品名称,对每个商品的商品名称都进行分词处理,得到每一个商品名称的商品分词。整理多个商品的商品名称的商品分词,得到店铺对应的多个商品分词。分词处理可以利用现有分词算法对商品名称进行匹配,完成对商品名称的分词处理,此处不做限定。为方便分词处理,可以预先收集各个商品分词,在分词处理时,将商品名称与商品分词进行匹配,得到对应的商品分词。

进一步,还可以预先设置商品分词的向量值和权重值。其中,权重值与商品分词在对应的品牌的所有商品信息中出现的次数相关,当商品分词在对应的品牌的所有商品信息中出现的次数越多时,其权重值越小;当商品分词在对应的品牌的所有商品信息中出现的次数越少时,其权重值越大。向量值与商品分词本身相关,具体向量值根据实施情况具体设置,此处不做限定。在对多个商品分词进行向量化处理时,可以根据预先设置的商品分词的向量值和权重值,得到店铺的商品向量。

步骤s207,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵。

对每一个店铺均执行上述步骤s205和s206后,得到各个店铺的商品向量。将各个店铺的商品向量进行聚合,得到待识别品牌对应的商品特征矩阵。其中,商品特征矩阵包括了各个店铺的商品向量,为多维的向量矩阵。

步骤s208,判断商品特征矩阵是否为稀疏矩阵。

在得到商品特征矩阵后,判断商品特征矩阵是否为稀疏矩阵,如判断商品特征矩阵中是否存在多个商品向量为0的数据,若是,则执行步骤s209;否则,直接执行步骤s210。

步骤s209,对商品特征矩阵进行压缩处理。

当商品特征矩阵为稀疏矩阵时,可以对商品特征矩阵进行压缩处理,降低商品特征矩阵维度,可以加快后续聚类处理的执行速度。

具体的,压缩处理可以预先设定压缩阈值,对商品特征矩阵中的商品向量进行过滤。如商品特征矩阵中存在多个商品向量为0的数据,过滤其中商品向量为0的数据,可以压缩商品特征矩阵。

步骤s210,对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果。

聚类处理时可以采用如均值漂移算法。具体的,按照预设聚类规则先选取一个中心点和半径值。根据预设聚类规则可以选取商品特征矩阵中任一店铺的商品向量为中心点,以此中心点进行聚类处理;也可以计算商品特征矩阵中所有店铺的商品向量的平均向量,选取平均向量为中心点,减少聚类处理的次数。半径值根据实施的具体情况设置。进行聚类处理时,根据中心点和半径值生成圆形区域。(当商品特征矩阵维度较高时,根据中心点和半径值生成的为球形区域。)商品特征矩阵中的各个店铺向量会散落在圆形区域中或圆形区域外。此时,计算商品特征矩阵中各个店铺的商品向量与中心点的距离向量。将各个距离向量相加计算得到中心点偏移向量,即中心点与各个店铺的商品向量的距离向量之和。当商品特征矩阵中的多个店铺向量散落在圆形区域外时,该中心点偏移向量的值会很大,说明该中心点和半径值生成的圆形区域没有较多的覆盖商品特征矩阵中的多个店铺向量。需要进一步修正中心点。通过判断中心点偏移向量是否大于或等于预设偏移值进行修正,若中心点偏移向量大于或等于预设偏移值,根据中心点偏移向量更新中心点,将中心点根据中心点偏移向量标记方向移动,移动距离为中心点偏移向量模值,得到更新后的中心点。根据更新后的中心点和半径值重新生成圆形区域,重复执行以上步骤,直至判断中心点偏移向量小于预设偏移值,即聚类处理结果趋于收敛,圆形区域覆盖较多店铺向量,返回此时的品牌聚类结果。其中,品牌聚类结果包括各个店铺的商品向量与中心点的距离向量、最终的中心点和半径值。

步骤s211,根据品牌聚类结果识别待识别品牌是否为优质品牌。

根据品牌聚类结果,可以统计品牌聚类结果中商品特征矩阵中各个店铺的商品向量与中心点的距离向量小于或等于半径值的店铺的数量。根据店铺的数量识别待识别品牌是否为优质品牌。具体的,判断店铺的数量是否等于隶属该待识别品牌的店铺的数量,若是,则说明隶属该待识别品牌的所有店铺中的商品信息具有高度内聚性、店铺具有关联性,识别待识别品牌为优质品牌;否则,识别待识别品牌为非优质品牌。

进一步,当识别待识别品牌为非优质品牌时,进一步判断店铺的数量是否低于等于预设伪品牌阈值,如预设伪品牌阈值为1,当店铺的数量为1时,即待识别品牌下的店铺相互间不具有高度内聚性,识别该待识别品牌为伪品牌。判断店铺的数量是否高于预设伪品牌阈值,低于隶属该待识别品牌的店铺的数量,当店铺的数量为3,隶属该待识别品牌的店铺的数量为4时,识别该待识别品牌为真实品牌,但其旗下店铺不是均为该品牌的店铺,存在伪品牌店铺。可以进一步统计品牌聚类结果中各个店铺的商品向量与中心点的距离向量大于半径值的店铺,即没有被中心点和半径值生成的圆形区域覆盖的店铺,识别该店铺为伪品牌店铺,其属于伪装该品牌的店铺。

根据本发明提供的优质品牌的识别方法,可以先对各个品牌数据进行筛选处理,去除明显非优质品牌的品牌数据,减少后续聚类处理的计算量。对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵。对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果。根据品牌聚类结果识别待识别品牌是否为优质品牌或非优质品牌。进一步,对非优质品牌进行细化,并可以识别出真实品牌中存在的伪品牌店铺。

图3示出了根据本发明一个实施例的基于优质品牌进行商品推荐方法的流程图。如图3所示,基于优质品牌进行商品推荐方法具体包括如下步骤:

步骤s301,对多个品牌进行识别得到优质品牌。

现有各线上平台存在如商品推荐的快速入口,帮助消费者用户推荐商品,便于消费者用户进行消费。但在线上商家所使用的各平台中,还没有针对商家所做的商品推荐,无法帮助商家发现优质的商品,提供给商家学习参考。

本实施例基于商家所使用的线上平台,从线上平台的多个品牌中识别得到优质品牌,以便推荐给商家。识别得到优质品牌的方法可以利用图1和图2实施例所描述的步骤对平台的品牌进行识别,得到优质品牌。此处不再展开说明。

步骤s302,获取隶属优质品牌的店铺对应的商品信息,推荐给商家。

在得到优质品牌后,可以获取隶属该优质品牌的各个店铺对应的商品信息,将商品信息推荐给商家。

为使推荐更具有针对性,还可以在推荐前,获取商家的店铺信息、店铺中的商品信息等。根据商家的店铺信息、店铺中的商品信息,获取与其具有关联性的隶属优质品牌的店铺对应的商品信息,推荐给商家。如获取到商家的店铺类别信息,商家的店铺类别信息为火锅,则获取隶属优质品牌的店铺的店铺类别信息为火锅的店铺,将该店铺的商品信息推荐给商家;获取到商家的店铺中的商品信息,商品类别信息为甜品,则获取隶属优质品牌的店铺的商品类别信息为甜品的商品,推荐给商家,方便商家学习和参考优质品牌的商品信息,也方便商家根据优质品牌的商品信息制定自己的商品信息。

步骤s303,接收商家触发的商品录入操作请求,获取商家从隶属优质品牌的店铺对应的商品信息选取的商品信息,生成商家商品录入信息。

本步骤为可选步骤。在推荐给商家隶属优质品牌的店铺对应的商品信息后,还可以根据商家触发的商品录入操作请求,获取商家从隶属优质品牌的店铺对应的商品信息中选取的商品信息。根据商家选取的商品信息,对应的生成商家商品录入信息,减少商家完全手动进行商品录入操作的工作量,且使得生成的商家商品录入信息均为隶属优质品牌的店铺对应的商品信息,提高商品信息的优质度。

根据本发明提供的基于优质品牌进行商品推荐方法,主动推荐给商家优质品牌的商品信息,帮助商家学习和参考优质品牌的商品信息,商家可以根据推荐的商品信息,完成自己商品的制定。进一步,商家还可以在推荐的商品信息中自由选取商品信息,根据商家选取的商品信息,为商家生成商品录入信息,完成商家的商品信息录入,提升了商家商品的录入效率和用户体验。

图4示出了根据本发明一个实施例的优质品牌的识别装置的功能框图。如图4所示,优质品牌的识别装置包括如下模块:

获取模块410适于:获取待识别品牌的品牌数据。

向量化模块420适于:对由商品信息提取得到的商品特征进行向量化处理,得到每个店铺的商品向量,聚合各个店铺的商品向量,得到待识别品牌对应的商品特征矩阵。

聚类模块430适于:对待识别品牌对应的商品特征矩阵进行聚类处理,得到品牌聚类结果。

识别模块440适于:根据品牌聚类结果识别待识别品牌是否为优质品牌。

可选地,获取模块410进一步适于:获取待识别品牌的品牌信息以及隶属该待识别品牌的多个店铺的店铺信息;针对每个店铺,按照预设整合规则将该店铺对应的所有商品的商品信息进行整合处理,得到该店铺对应的多种商品的商品信息;其中,预设整合规则包括根据各种商品的销售量过滤其中低于预设销售量的商品的商品信息;和/或,根据各种商品的商品名称进行去重。

可选地,聚类模块430进一步适于:按照预设聚类规则选取中心点和半径值;计算商品特征矩阵中各个店铺的商品向量与中心点的距离向量;根据距离向量计算得到中心点偏移向量;判断中心点偏移向量是否大于或等于预设偏移值;若是,根据中心点偏移向量更新中心点,重复执行以上处理,直至中心点偏移向量小于预设偏移值;返回品牌聚类结果;其中,品牌聚类结果包括各个店铺的商品向量与中心点的距离向量、中心点和半径值。

可选地,向量化模块420进一步适于:遍历店铺对应的多种商品的商品名称,对各种商品的商品名称进行分词处理,得到店铺对应的多个商品分词;对多个商品分词进行向量化处理,得到店铺的商品向量。

可选地,装置还包括:向量预设模块450。

向量预设模块450适于:预先设置商品分词的向量值和权重值。

向量化模块420进一步适于:获取多个商品分词的向量值和权重值,得到店铺的商品向量。

可选地,装置还包括:判断模块460。

判断模块460适于:判断商品特征矩阵是否为稀疏矩阵;若是,对商品特征矩阵进行压缩处理。

可选地,识别模块440进一步适于:统计品牌聚类结果中商品特征矩阵中各个店铺的商品向量与中心点的距离向量小于或等于半径值的店铺的数量;根据店铺的数量识别待识别品牌是否为优质品牌。

可选地,识别模块440进一步适于:判断店铺的数量是否等于隶属该待识别品牌的店铺的数量;若是,识别待识别品牌为优质品牌;否则,识别待识别品牌为非优质品牌。

可选地,识别模块440进一步适于:统计品牌聚类结果中各个店铺的商品向量与中心点的距离向量大于半径值的店铺;识别店铺为伪品牌店铺。

可选地,获取模块410进一步适于:采集各个品牌的品牌数据;根据预设品牌筛选规则对各个品牌的品牌数据进行筛选处理,得到待识别品牌的品牌数据。

以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。

图5示出了根据本发明一个实施例的基于优质品牌进行商品推荐装置的功能框图。如图5所示,优质品牌的识别装置包括如下模块:

推荐模块510适于:利用图4中优质品牌的识别装置对多个品牌进行识别得到优质品牌,获取隶属优质品牌的店铺对应的商品信息,推荐给商家。

可选地,装置还包括:商家获取模块520。

商家获取模块520适于:获取商家的店铺信息和/或店铺中的商品信息。

推荐模块510进一步适于:根据商家的店铺信息和/或店铺中的商品信息,获取与其具有关联性的隶属优质品牌的店铺对应的商品信息,推荐给商家;其中,关联性为与商家的店铺类别信息和/或商品类别信息相同。

可选地,装置还包括:生成模块530。

生成模块530适于:接收商家触发的商品录入操作请求,获取商家从隶属优质品牌的店铺对应的商品信息选取的商品信息,生成商家商品录入信息。

以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。

本申请还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的优质品牌的识别方法。

图6示出了根据本发明一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。

如图6所示,该电子设备可以包括:处理器(processor)602、通信接口(communicationsinterface)604、存储器(memory)606、以及通信总线608。

其中:

处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。

通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。

处理器602,用于执行程序610,具体可以执行上述优质品牌的识别方法实施例中的相关步骤。

具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。

处理器602可能是中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。

存储器606,用于存放程序610。存储器606可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

程序610具体可以用于使得处理器602执行上述任意方法实施例中的优质品牌的识别方法。程序610中各步骤的具体实现可以参见上述优质品牌的识别实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。

本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的基于优质品牌进行商品推荐方法。

本发明还提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行上述的基于优质品牌进行商品推荐方法对应的操作。该计算设备的结构示意图与图6所示的计算设备的结构示意图相同,此处不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的优质品牌的识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1