一种基于区块链的电商平台仿冒商品大数据识别方法与流程

文档序号:32350267发布日期:2022-11-26 12:45阅读:75来源:国知局
一种基于区块链的电商平台仿冒商品大数据识别方法与流程

1.本发明涉及仿冒商品识别领域,具体而言,涉及一种基于区块链的电商平台仿冒商品大数据识别方法。


背景技术:

2.随着网络电商平台的兴起,越来越多的商品在电商平台上进行销售,给企业和消费者提供了极大的方便。同时,仿冒商品无法避免地也涌入电商平台,给正规企业、电商平台、消费者都带来了损失。人工筛查侵权商品效率极低,传统的图像检测、识别等相关方法能够检测出部分仿冒商品,但是准确性不高。
3.一般采用传统的图像去噪方法提高图像识别的准确性,但会消耗较多的计算资源,并且难以达到优良的去噪结果。因此目前需要一种能提高商品侵权识别准确性和筛查效率的方法。


技术实现要素:

4.本发明的目的在于提供一种基于区块链的电商平台仿冒商品大数据识别方法,其能够提高商品侵权识别准确性和筛查效率。
5.本发明的实施例是这样实现的:本技术实施例提供一种基于区块链的电商平台仿冒商品大数据识别方法,其包括如下步骤:(1)多个浏览者通过电商平台采集商品首次发布的基准商品图像,并将首次发布平台和上述基准商品图像进行上链;(2)获取该商品的待检测图像,基于图像金字塔的相似性检测方法计算上述待检测图像和上述基准商品图像的相似性,若相似度高于预设阈值时则进入下一步骤(3);(3)将上述待检测图像和得到的上述基准商品图像分别进行显著性检测,并基于多卷积核的相似度检测对两个显著区域进行相似度检测,若显著区域的相似度高于预设阈值时进入下一步骤(4),且将相似度高的两个上述显著区域进行上链;(4)利用目标检测方法分别检测出上述待检测图像和上述基准商品图像的商标区域,且将两个上述商标区域进行上链;(5)利用ocr技术分别检测上述待检测图像和上述基准商品图像的上述商标区域中的字符,判定检测到的两个字符是否相同;利用图像熵技术分别检测上述商标区域的熵值,判断检测到的两个上述熵值是否相似;如果检测到的字符相同且上述熵值相似,则将上述待检测图像和上述基准商品图像认定为同一品牌,将上述待检测图像列为疑似侵权商品发布,并发送给审查人员核查;如果检测到的字符相同和上述熵值相似中的任意一项符合,则将待检测图像列为疑似仿冒商品,并发送给审查人员核查;如果检测到的字符不相同且上述熵值不相似,则将待检测图像列为上述疑似仿冒商品发布,并发送给审查人员核查;将审查后确认为仿冒商品的上述待检测图像进行上链存储。
6.在本发明的一些实施例中,上述基于图像金字塔的相似性检测方法具体包括如下步骤:(a)将基准商品图像和待检测图像进行稀疏编码,利用欧式距离计算它们之间的相似度,如果相似度较低认定两幅图像不相似,如果相似度较高继续进行下一步;(b)将上述基准商品图像和待检测图像进行4等分,每个等分区域分别进行稀疏编码,分别计算4个对应区域的相似度,如果4个区域中相似度较高的低于3个,则认定为两幅图像不相似,如果4个区域中相似度较高的不低于3个,则继续进行下一步;(c)将上述基准商品图像和上述待检测图像进行16等分,每个等分区域分别进行稀疏编码,分别计算16个对应区域的相似度,如果16个区域中相似度较高的低于12个,则认定为两幅图像不相似;如果16个区域中相似度较高的不低于12个,则认定基准商品图像和待检测图像相似度较高。
7.在本发明的一些实施例中,基于多卷积核的相似度检测具体包括如下步骤:利用平滑卷积核分别对上述基准商品图像的上述显著区域和上述待检测图像的上述显著区域进行处理,得到过滤后的结果;在稀疏编码后利用欧式距离计算相似度。
8.在本发明的一些实施例中,基于多卷积核的相似度检测具体包括如下步骤:利用锐化卷积核对上述基准商品图像的上述显著区域和上述待检测图像的上述显著区域进行处理,得到过滤后的结果;在稀疏编码后利用欧式距离计算相似度。
9.在本发明的一些实施例中,基于多卷积核的相似度检测具体包括如下步骤:利用去噪卷积核对上述基准商品图像的上述显著区域和上述待检测图像的上述显著区域进行处理,得到过滤后的结果;在稀疏编码后利用欧式距离计算相似度。
10.在本发明的一些实施例中,上述步骤(5)中,上述利用图像熵技术分别检测上述商标区域的熵值具体包括如下步骤:(a)计算图像中每个像素点的灰度值i(0《=i《=255);(b)计算某个灰度在该图像中出现的概率;(c)利用公式对图像熵进行计算。
11.在本发明的一些实施例中,基于多卷积核的相似度检测具体还包括步骤(6):利用步骤(1)~步骤(5)对多个商品的上述待检测图像进行检测。
12.相对于现有技术,本发明的实施例至少具有如下优点或有益效果:本技术实施例通过采集商品首次发布的基准商品图像,从而根据基准商品图像判断待检测图像的是否侵权;其中利用待检测图像与基准商品图像的相似性,从而判断是否属于该基准商品图像的仿冒商品;并进一步将基准商品图像和待检测图像的显著区域进行识别和对比,从而根据相似性判断是否仿冒商品,提高仿冒商品识别的准确性;并结合通过检测商品图像和基准商品图像的商标的熵值大小判断是否属于仿冒品牌;并且将商标字符和商标熵值近似的商品列为疑似仿冒商品,并进行人工审查,进一步提高品牌仿冒的筛查效率,维护品牌方和消费者的权益。本技术通过多区域识别以及核心区域识别商品图像,从而提高了商品品牌仿冒识别的准确性和筛查效率。基于图像金字塔的相似性检测方法,并
基于多卷积核的相似度检测方法计算基准商品图像和待检测图像的多区域相似性以及核心区域相似性,能够提高图像的识别精度,保证图像仿冒识别的准确性;在此基础上,还利用 ocr 技术和图像熵计算模型对商标是否相同进行判别;从而进一步利用局部特征对商品仿冒侵权行为进行确认;利用查看到商品首次发布平台的多个浏览者对基准商品图像进行采集,保证被侵权商品的证据完整性和可靠性,便于溯洄查询数据;能将区块链的思想深度应用于商品仿冒侵权行为的核查。本技术能提高了识别仿冒商品的准确性和效率,便于应用于海量图像的仿冒商品识别。在仿冒商品的整个识别过程中,将获取到的首次发布平台和基准商品图像进行上链,便于加强对证据的保护,便于进行审核和后期商品维权;并且将相似度高的待检测图像和基准商品图像,以及相似度高的两个显著区域、识别出的两个商标区域进行上链存储,防止数据损毁的风险,提高商品仿冒证据的可靠性;便于人工依次审核各项信息进行筛除;通过将审查后的仿冒商品进行上链存储,便于统一管理被侵权商品以及进行商品维权处理。
附图说明
13.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
14.图1为本发明实施例基于区块链的电商平台仿冒商品大数据识别方法的流程示意图;图2为本发明实施例中步骤(5)的流程示意图。
具体实施方式
15.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
16.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
17.在本技术的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
18.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
实施例
19.请参阅图1~图2,图1~图2所示为本技术实施例提供的基于区块链的电商平台仿冒商品大数据识别方法的流程示意图。基于区块链的电商平台仿冒商品大数据识别方法,其包括如下步骤:(1)多个浏览者通过电商平台采集商品首次发布的基准商品图像,并将首次发布平台和上述基准商品图像进行上链;(2)获取该商品的待检测图像,基于图像金字塔的相似性检测方法计算上述待检测图像和上述基准商品图像的相似性,若相似度高于预设阈值时则进入下一步骤(3);(3)将上述待检测图像和得到的上述基准商品图像分别进行显著性检测,并基于多卷积核的相似度检测对两个显著区域进行相似度检测,若显著区域的相似度高于预设阈值时进入下一步骤(4),且将相似度高的两个上述显著区域进行上链;(4)利用目标检测方法分别检测出上述待检测图像和上述基准商品图像的商标区域,且将两个上述商标区域进行上链;(5)利用ocr技术分别检测上述待检测图像和上述基准商品图像的上述商标区域中的字符,判定检测到的两个字符是否相同;利用图像熵技术分别检测上述商标区域的熵值,判断检测到的两个上述熵值是否相似;如果检测到的字符相同且上述熵值相似,则将上述待检测图像和上述基准商品图像认定为同一品牌,将上述待检测图像列为疑似侵权商品发布,并发送给审查人员核查;如果检测到的字符相同和上述熵值相似中的任意一项符合,则将待检测图像列为疑似仿冒商品,并发送给审查人员核查;如果检测到的字符不相同且上述熵值不相似,则将待检测图像列为上述疑似仿冒商品发布,并发送给审查人员核查;将审查后确认为仿冒商品的上述待检测图像进行上链存储。
20.其中,可以根据商品的认证平台或者商品首次发布的平台采集各种匹配的基准商品图像。每种品牌的基准商品图像可以包括多种商品,每种商品可以包括多个方位的图像,从而利用多个图像进行精准识别,得到更准确的仿冒商品。详细的,采集基准商品图像的首次发布平台由浏览过商品的用户进行记录,并依据记录人数确认该商品图像的首次发布平台。其中,上述两个预设阈值表示不同数值,可以根据实际情况自动或人为设定。通过多个浏览人记录商品图像的方式,能够共同维护商品首次发布记录,将区块链的思想深度应用于侵权和仿冒行为的核查。例如,300人同时在电商平台上观看到该商品图像时,300人同时记录下该商品由该电商平台某一商城平台首次发布。当所有人记录的商城平台为多个时,可以选择记录人数多的基准商品图像进行采集。
21.将首次发布平台的网址和基准商品图像进行上链,从而留存证据,便于后期进行人工审核和商品维权;将相似性高的待检测图像和基准商品图像进行上链,方便人工审核时进行比对;将相似度高的两个显著区域以及对应识别的两个商标区域进行上链,从而方便准确识别和人工复核;将疑似侵权商品和疑似仿冒商品审查后确认为仿冒商品的待检测图像进行上链存储,能够统一管理和进行维权处理。可选的,首次发布平台网站中的商品信息同时进行上链存储,浏览者浏览过的记录也可以同时进行上链存储,从而进一步提高首次发布商品的数据可靠性。可选的,将审查前的疑似侵权商品和疑似仿冒商品也进行上链存储,从而当人工复核以及供人们进行维权处理后,能够保存对发布信息的操作证据。其中,上述疑似仿冒商品和疑似侵权商品的发布均可以表示向商品相关人或公众所公开,便
于进行维权和申诉,也可以仅表示为发布给审核人员进行审核。
22.可选的,采集的待检测图像可以利用未经过品牌认证的商品来源的待检测图像,也可以是由用户(消费者)自行上传的商品图像。可选的,采集的多种品牌的多个基准商品图像可以分类存储,从而可以人为选择某一种或多种品牌的基准商品图像对待检测图像进行精准识别。详细的,将待检测图像和得到的基准商品图像分别进行显著性检测,从而对两者检测出的显著区域进行相似度判断。当显著区域的相似度较高时进入下一步对商标进行检测。详细的,利用目标检测方法对商标区域进行识别,并且利用ocr文字识别技术对其中的字符进行识别。并且利用商标区域计算出图像熵值,从而判断熵值的近似度。当识别出的字符相同且熵值近似度较低时判定为疑似仿冒商品,当识别出的字符不同且熵值近似度较高时判定为疑似仿冒商品。当识别出的字符相同且熵值近似度较高时判定为同一品牌,从而便于监管人员、品牌方或顾客进行人为筛查,缩小了人工筛查范围,根据同一品牌的待检测图像找出仿冒商品。其中,可以根据同一品牌的货物来源进行真品或仿冒品认证,便于进行监管和筛查。其中显著性的检测方法可以为任意一种视觉感知技术实现,比如参考专利申请号为cn201611202475.4公开的基于视觉感知正反馈的显著性检测方法。ocr文字识别技术和图像熵技术等均为现有技术,在此不必详细描述。
23.详细的,通过多卷积核分析局部多处的相似度,进一步提高了仿冒特征识别的准确性。待检测图像和基准商品图像的显著区域均可以为一个或多个。可选的,当显著区域为多个时,利用多个显著区域之间的相对位置进行一一对比,从而判断出相似度大小。利用图像金字塔的相似性检测方法计算待检测图像和基准商品图像的相似性,从而提高了图像识别的准确性。其中,利用待检测图像和基准商品图像为同一品牌后,可以根据发布平台是否经过认证从而将未经认证的商品发给审查人员核查,经核查成功后发送给消费者。其中,可以将同样品牌的商品发送给品牌方的审查人员进行核查,并且将疑似仿冒商品发送给监管部门的审查人员进行核查,从而减轻了核查压力,大大提高了维护品牌及消费者权益的效率。其中,当商标字符相同时表明品牌相同,而当两个字符不相同时认定为疑似仿冒商品。当商标字符相同时且商标区域的熵值近似时,表明商品为疑似侵权商品,通过人工审核后确认是否仿冒侵权。步骤(6)中,将审查后确认为仿冒商品的上述待检测图像进行上链存储,供审查人员随时存储和获取,防止了数据发生丢失和篡改,便于对仿冒商品进行统一管理,从而加强了对仿冒商品监督。
24.在本发明的一些实施例中,上述基于图像金字塔的相似性检测方法具体包括如下步骤:(a)将基准商品图像和待检测图像进行稀疏编码,利用欧式距离计算它们之间的相似度,如果相似度较低认定两幅图像不相似,如果相似度较高继续进行下一步;(b)将上述基准商品图像和待检测图像进行4等分,每个等分区域分别进行稀疏编码,分别计算4个对应区域的相似度,如果4个区域中相似度较高的低于3个,则认定为两幅图像不相似,如果4个区域中相似度较高的不低于3个,则继续进行下一步;(c)将上述基准商品图像和上述待检测图像进行16等分,每个等分区域分别进行稀疏编码,分别计算16个对应区域的相似度,如果16个区域中相似度较高的低于12个,则认定为两幅图像不相似;如果16个区域中相似度较高的不低于12个,则认定基准商品图像和待检测图像相似度较高。
25.详细的,等分区域的划分方式为任意一种,比如以长方形图像为例,以长边和短边的中心线划分成四个部分。同样的,可以以矩形分布方式将待检测图像分为16等分。其中分成各个部分后,对应区域比如四等分的对应区域为长方形的左上方部分对应左上方部分,右下方部分对应右下方部分。进行多重判断局部和整体图像,判断图像相似度大小,能缩小排查范围,从而得到与品牌高度相似的仿冒商品。
26.在本发明的一些实施例中,基于多卷积核的相似度检测具体包括如下步骤:利用平滑卷积核分别对上述基准商品图像的上述显著区域和上述待检测图像的上述显著区域进行处理,得到过滤后的结果;在稀疏编码后利用欧式距离计算相似度。
27.在本发明的一些实施例中,基于多卷积核的相似度检测具体包括如下步骤:利用锐化卷积核对上述基准商品图像的上述显著区域和上述待检测图像的上述显著区域进行处理,得到过滤后的结果;在稀疏编码后利用欧式距离计算相似度。
28.在本发明的一些实施例中,基于多卷积核的相似度检测具体包括如下步骤:利用去噪卷积核对上述基准商品图像的上述显著区域和上述待检测图像的上述显著区域进行处理,得到过滤后的结果;在稀疏编码后利用欧式距离计算相似度。
29.详细的,通常情况下卷积核的尺寸为 3*3,选择不同类型的多卷积核能够适应于不同类型的图像使用。利用上述三种步骤其中任何一个得到相似度较高的结果,都可以认定基准商品图像的显著区域和待检测图像的显著区域相似度较高。可选的,可以结合多种检测方法进行计算出的相似度大小依据图像类型加上一定权重,得到准确度较高的相似度大小。
30.在本发明的一些实施例中,上述步骤(5)中,上述利用图像熵技术分别检测上述商标区域的熵值具体包括如下步骤:(a)计算图像中每个像素点的灰度值i(0《=i《=255);(b)计算某个灰度在该图像中出现的概率;(c)利用公式对图像熵进行计算。
31.计算灰度值和该灰度出现的概率计算熵值,从而判断对应商标区域的相似性,并且利用得到的商品整体相似程度高的商标相似性核查是否为仿冒商品。
32.可选的,将商品图像的检测结果或经过审查后的结果进行采集,得到多组商品检测数据,每组商品检测数据均包括待检测图像、对应的基准商品图像以及用于标记该商品是否属于仿冒商品的检测结果,并通过机器学习训练得到用于输出检测结果的仿冒商品训练模型。其中,仿冒商品训练模型输入的数据为检测商品图像,从而判断出是否仿冒以及仿冒商品的对应品牌。可替换的,输入数据也可以为检测商品图像和基准商品图像,从而输出对应的检测结果。
33.相对于现有技术,本发明的实施例至少具有如下优点或有益效果:本技术实施例通过采集商品首次发布的基准商品图像,从而根据基准商品图像判断待检测图像的是否侵权;其中利用待检测图像与基准商品图像的相似性,从而判断是否属于该基准商品图像的仿冒商品;并进一步将基准商品图像和待检测图像的显著区域进行
识别和对比,从而根据相似性判断是否仿冒商品,提高仿冒商品识别的准确性;并结合通过检测商品图像和基准商品图像的商标的熵值大小判断是否属于仿冒品牌;并且将商标字符和商标熵值近似的商品列为疑似仿冒商品,并进行人工审查,进一步提高品牌仿冒的筛查效率,维护品牌方和消费者的权益。本技术通过多区域识别以及核心区域识别商品图像,从而提高了商品品牌仿冒识别的准确性和筛查效率。基于图像金字塔的相似性检测方法,并基于多卷积核的相似度检测方法计算基准商品图像和待检测图像的多区域相似性以及核心区域相似性,能够提高图像的识别精度,保证图像仿冒识别的准确性;在此基础上,还利用 ocr 技术和图像熵计算模型对商标是否相同进行判别;从而进一步利用局部特征对商品仿冒侵权行为进行确认;利用查看到商品首次发布平台的多个浏览者对基准商品图像进行采集,保证被侵权商品的证据完整性和可靠性,便于溯洄查询数据;能将区块链的思想深度应用于商品仿冒侵权行为的核查。本技术能提高了识别仿冒商品的准确性和效率,便于应用于海量图像的仿冒商品识别。在仿冒商品的整个识别过程中,将获取到的首次发布平台和基准商品图像进行上链,便于加强对证据的保护,便于进行审核和后期商品维权;并且将相似度高的待检测图像和基准商品图像,以及相似度高的两个显著区域、识别出的两个商标区域进行上链存储,防止数据损毁的风险,提高商品仿冒证据的可靠性;便于人工依次审核各项信息进行筛除;通过将审查后的仿冒商品进行上链存储,便于统一管理被侵权商品以及进行商品维权处理。
34.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,流程图中的每个方框、以及流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
35.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
36.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
37.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
38.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其它的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1