基于服装色彩特征采集分类统计销量的大数据分析方法与流程

文档序号:11433163阅读:177来源:国知局

本发明涉及大数据分析领域,具体是指一种基于服装色彩特征采集分类统计销量的大数据分析方法。



背景技术:

随着电子商务和互联网技术的快速发展,通过电商平台的大数据信息得知当前服装颜色偏好及流行程度成为可能,这对服装生产者和消费者作出更为理性经济的决策具有极为重要的意义。面对浩如烟海的信息,人们迫切需要一种能够快速准确获知某类商品各种颜色畅销度的大数据分析工具,申请号为201610590862.3的发明专利申请公开了一种服装图像前景颜色特征提取方法及服装检索方法和系统,通过分权重加权计算图像各分区颜色特征值统计服装图像数据库中服装图像的颜色特征值。该方法及系统存在的问题有:1)没有说明图像数据库如何建立,因而无法为决策者提供决策参考;2)图像分区无法判断该区域是否为该产品的一部分,因此加权计算结果往往与实际情况大相径庭;3)各步骤中的参数设定过于机械,不能自动调整适应,进一步加大了数据失真度;4)获取颜色特征值过程计算量较大,影响获取最终结果速度。



技术实现要素:

本发明的发明目的在于针对现有技术存在的上述问题,提供一种基于服装色彩特征采集分类统计销量的大数据分析方法。

上述发明目的通过以下方案实现:

基于服装色彩特征采集分类统计销量的大数据分析方法,包括以下步骤:(1)按产品分类设置关键词列表,通过关键词列表中的主关键词搜索并抓取电商平台产品展示图片;(2)读取产品展示图片对应的产品文档,产品文档出现与关键词列表中互斥的文档信息时,将该产品展示图片作为非本类产品加以剔除;(3)检测图片是否有水印,若有则去除,本类产品对应的去除水印的所有产品展示图片作为处理图片集;(4)将处理图片集中的每张图片分为m×n块区域,绘制m×n块区域内每块区域像素点rgb值变化曲线,选取rgb值变化曲线平缓且像素点rgb值极限差值最小的区域作为基准区域,对各区域赋予相应权重系数,基准区域以外的其余区域权重系数小于基准区域权重系数;(5)加权计算各区域rgb均值得到该图片rgb均值;(6)遍历处理图片集内所有图片,一一计算所有图片rgb均值,各图片rgb均值在设定阈值内的视为同颜色图片;(7)读取同颜色图片对应的店铺销量数据并读取对应的后台发货数据,取后台发货数据和店铺销量数据中较小者作为该颜色图片对应的可接受销量;(8)将每一店铺的该颜色图片可接受销量加和结果作为该颜色图片的复现值,绘制各颜色图片复现值的分布图。

进一步地,基准区域以外的其余区域根据中心点位置与基准区域中心点距离由近至远排列递减设置权重系数。

进一步地,基准区域以外的其余区域根据区域rgb均值大小成比例设置权重系数。

进一步地,m和n的取值均为3。

进一步地,步骤(3)中还包括预处理步骤(3-1):设置基准尺寸,将处理图片集中所有图片缩放使之与基准尺寸一致。

本发明有益效果在于:通过关键词列表排除非本类产品,分析结果可靠且完整,该类产品颜色流行程度一目了然;通过计算图片内各区域rgb均值确定基准区域,远比选择几何中心区域精准可靠。

具体实施方式

以下结合具体实施例对本发明作进一步说明。基于服装色彩特征采集分类统计销量的大数据分析方法,包括以下步骤:(1)按产品分类设置关键词列表,通过关键词列表中的主关键词搜索并抓取电商平台产品展示图片;(2)读取产品展示图片对应的产品文档,产品文档出现与关键词列表中互斥的文档信息时,将该产品展示图片作为非本类产品加以剔除;(3)检测图片是否有水印,若有则去除,本类产品对应的去除水印的所有产品展示图片作为处理图片集;(4)将处理图片集中的每张图片分为m×n块区域,绘制m×n块区域内每块区域像素点rgb值变化曲线,选取rgb值变化曲线平缓且像素点rgb值极限差值最小的区域作为基准区域,对各区域赋予相应权重系数,基准区域以外的其余区域权重系数小于基准区域权重系数;(5)加权计算各区域rgb均值得到该图片rgb均值;(6)遍历处理图片集内所有图片,一一计算所有图片rgb均值,各图片rgb均值在设定阈值内的视为同颜色图片;(7)读取同颜色图片对应的店铺销量数据并读取对应的后台发货数据,取后台发货数据和店铺销量数据中较小者作为该颜色图片对应的可接受销量;(8)将每一店铺的该颜色图片可接受销量加和结果作为该颜色图片的复现值,绘制各颜色图片复现值的分布图。

基准区域以外的其余区域根据中心点位置与基准区域中心点距离由近至远排列递减设置权重系数。基准区域以外的其余区域根据区域rgb均值大小成比例设置权重系数。m和n的取值均为3。步骤(3)中还包括预处理步骤(3-1):设置基准尺寸,将处理图片集中所有图片缩放使之与基准尺寸一致。

虽然本发明已通过参考优选的实施例进行了描述,但是,本领域普通技术人员应当了解,可以不限于上述实施例的描述,在权利要求书的范围内,可作出形式和细节上的各种变化。



技术特征:

技术总结
本发明提供一种基于服装色彩特征采集分类统计销量的大数据分析方法,包括以下步骤:(1)搜索并抓取电商平台产品展示图片;(2)剔除非本类产品;(3)去除水印;(4)将每张图片分区,绘制RGB值变化曲线,选取基准区域,对各区域赋予相应权重系数;(5)加权计算各区域RGB均值得到该图片RGB均值;(6)遍历处理图片集内所有图片,计算所有图片RGB均值,各图片RGB均值在设定阈值内的视为同颜色图片;(7)读取可接受销量;(8)绘制各颜色图片复现值的分布图。本发明有益效果在于:通过关键词列表排除非本类产品,分析结果可靠且完整,该类产品颜色流行程度一目了然。

技术研发人员:王振宇;杨克杰
受保护的技术使用者:温州市鹿城区中津先进科技研究院
技术研发日:2017.04.20
技术公布日:2017.08.29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1