一种电商产品质量信用指数分析方法及系统与流程

文档序号:16512153发布日期:2019-01-05 09:24阅读:270来源:国知局
一种电商产品质量信用指数分析方法及系统与流程

本发明是关于电子商务领域,特别涉及一种电商产品质量信用指数分析方法及系统。



背景技术:

电子商务运用越来越广泛,很多电商平台如天猫、京东都极大地便利了人们的生活,用户对产品质量的关注不断增加,然而仅仅凭借电商平台的网上用户评论来判断商品的好坏仍具有一定的局限性,比如部分商家通过不正常的手段刷好评,或者恶意评论竞争对手的商品,这些都会给用户造成误导。信息的不对称、不全面、不透明,致使用户无法科学有效决策,进而无法根据自己意愿选择电商平台的高质量商品,长此以往不仅会造成不愉快的使用体验,甚至会扰乱电商市场。因此,需要公开透明许多有关商品的信息,使用户和商家信息对等,用户方能全面地了解商品的各个维度。

传统的商品评价方法有因子分析法,对评论真实度情感分析,提取产品质量特征词进行产品综合评价等方法。这些方法普遍都过于重视对评论的情感分析,没有将线下如产品质检报告,制造商的劳动力资本等要素考虑在内,而且采用的机器学习方法如神经网络训练权重价格昂贵,不同商品采用普遍性的标准不够准确,上述方案均不能很好的完成。

针对目前电子商务领域存在的假冒伪劣、消费者对产品良莠难辨、传统产品质量监管手段不适用等现状,产生了很多基于互联网环境的产品质量信用评价模型,它们一般包含如下几个主要工作流程:首先从异构的系统数据源中采集跨域数据,将不同类型和结构的原始数据清洗、处理成统一框架下的标准化数据,对非结构化数据中的关键信息通过相应信息抽取算法提取出来完成结构化过程,将这些综合性的数据提交给统一的产品质量数据仓库;然后通过大数据分析计算,建立统一的产品质量检测与管理信息模型,得到产品质量信用分数;最后权威发布电商产品质量信用指数评价结果。

在学术界,国内外对于电子商务产品质量评价体系的研究也开始从大量的理论研究进入数据引用阶段。王立志等人以产品质量的符合性、适用性和外部性为基础,构建了包含固有质量、感知质量和损失质量的产品质量概念模型,设计了具有可操作性质量评价指标体系。骆庆华从电子商务的发展背景入手,分析了电子商务产品质量及监管体系建设问题。lkcmlwu开发了一种九步的qfd产品质量评价系统。zeithaml等人的研究通过与有在线购物经验的客户进行了六焦点小组访谈,得出可靠性、可访问性、安全性、易于登录、担保/信任、网站美观、反应性、个性化/定制化、价格知识、灵活性、效用11个维度为电子服务质量的影响因素。

近年来提出了以消费者为授信方、生产者为受信方的产品质量信用概念,目前我国已推出国家产品质量信用平台,包含了基础信息、标准信息、原材料信息、添加剂信息、产品防伪信息、产品监督抽查记录等,但是这个平台信息上的信息量还是比较缺乏,无法满足大多数消费者的需求。在学术界,陈欢等人通过分析我国产品质量信用现状,建立一套完善的产品质量信用评价体系,并为我国建立产品质量信用评价体系提供一些建议。王立志在对产品质量信用基本内涵和信用等级划分的基础上,研究了产品质量信用及其构成要素。vaidyao.s提出了层次分析法在电子商务质量评估环境下的应用。刘松国等人在此基础上,结合应用电子商务理论、产品质量管理和信用评价理论,建立b2c电子商务产品质量信用评价指标体系的模型,并利用模糊综合ahp结构层次分析法来对电子商务企业信用管理体系进行评价。

如上所述,目前关于电商产品质量信用指数评估模型的研究成果很多,采用的方法也很广泛,与本发明最相近似的实现方案有下面几种。

1、基于大数据的电子商务行业景气度指数系统和方法(201610138024.2)。提出了一种基于大数据的电子商务行业评价方法,其特点是对主要体现指标进行数据统计,组成矩阵并进行标准化处理,通过pearson相关系数检验,得到相关性分析,再采用因子旋转的方法确定其实际意义。但是,在因子分析中,因子个数需要人为指定,而且在众多影响因素中,公因子的实际意义往往不那么明显。针对不同类目的产品,都使用同一组指标缺乏灵活性,比如水和拉杆箱显然无法用相同的衡量标准。

2、一种信用评分模型更新方法及系统(201711308017.3)。提供一种可实时监测当前信用评分模型的运行情况,解决了现有技术中不能及时更新信用评分模型导致信用评分不准确等的问题,可自动识别目前舆情、法律、条例等对模型信息属性集中属性的可靠性,减少目前政策波动期中面临的外部风险,进一步提升了信用评分模型的适应性,合理地设置信用评分模型的更新周期,提高信用评分系统的性能。它的不足之处在于没有考虑模型指标在时间维度上的变化情况,因此缺乏对时间维度上信用指数变化情况的表示。

3、一种电子商务产品质量的风险评价方法(201711392410.5)。该方法包括三个步骤:语料库获取、中文自然语言处理和质量风险评价,核心是后两个步骤:对原始数据清理后,用自然语言处理工具对评论语料进行初次分词及词性标注、新词识别、评论真实度情感分析等预处理获得结构化的情感分析结果并保存到数据库中,进一步,训练条件随机场模型,最后利用其提取质量特征词;提出商家信用综合评价表,统计出信用指数,设计出评价融合模型,根据评分计算产品的风险等级。但是,该算法只考虑了评论文本来对产品进行风险预测,较为片面,没有综合考虑产品质检数据等其他因素。

4、一种互联网药品质量信用评估方法(201510507262.1)。该方法通过获取的药品识别信息来识别药品,获取药品质量指标数据,根据药品质量指标数据对药品的各项药品质量指标进行评估,得出药品的各项药品质量指标的评估结果。最后计算得出药品的药品质量风险指数。该发明的局限在于质量指标数据仅针对互联网药品这个类别,而无法对其他互联网产品类别进行评估和分析。另外,互联网内容处于不断变化和发展的过程,该发明所述的互联网药品质量信用评估方法没有考虑到时间因素对质量信用的影响。

5、企业质量信用数据获取方法和系统(201611129883.1)。该发明通过对企业质量信用相关的数据进行预处理,并进行知识挖掘得到模板数据从而提取从语料中提取出与模板对应的企业质量信用数据。其重点在于如何得到具有一致性,准确性和全面性的企业质量信用数据,但未明确介绍如何将该数据用于构建质量信用模型,从而对企业的质量信用进行评估。

上面五个专利虽然都能在一定程度上对产品质量评价,但是要适用到具体产品,他们还存在如下的不足:

商品评价过分依赖线上数据。但在电商平台评论不一定起了决定性作用,更重要的是线下国家质监局及政府委托的第三方质检公司对商品的检测报告;针对不同商品的评价过于一般化,比如纯净水和拉杆箱的评价标准显然很难一样,相同指标的重要程度也大不一样,不同类目产品之间存在很大差异性,用单一评价标准无法确保评价的有效性,给消费者提供准确参考。



技术实现要素:

本发明的主要目的在于克服现有技术中的不足,提供一种更加灵活、完善的针对电商产品质量的评价方法及系统。为解决上述技术问题,本发明的解决方案是:

提供一种电商产品质量信用指数分析方法,具体包括下述步骤:

步骤(1):采集并融合多源跨平台的电商产品质量数据;

先从异构的系统数据源中采集数据对象,采集完成后,将不同类型和不同结构的原始数据清洗、处理成统一框架下的标准化数据;

异构的系统数据源包括结构化的数据源和非结构化的数据源;结构化的数据源中存储结构化数据,结构化数据包括产品质量检验报告、商家征信记录和电商平台产品属性数据;非结构化的数据源中存储非结构化数据,非结构化数据包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本和产品质量舆情信息;

标准化数据是指:将原始数据按比例缩放到一个特定区间,去除数据的单位限制,形成的无量纲的纯数值的数据(标准化数据便于不同单位或量级的指标能够进行比较和加权);

不同类型和不同结构的原始数据处理后,得到的标准化数据分为结构化的标准化数据和非结构化的标准化数据:

对于结构化的标准化数据,直接提交给统一的产品质量数据仓库(产品质量数据仓库用于存储数据);

对于非结构化的标准化数据,先将非结构化的标准化数据中的关键信息,通过相应信息抽取算法提取出来完成结构化过程,变成结构化的标准化数据后,再提交给统一的产品质量数据仓库;

步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量;

电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层;

目标层设置指标:电商产品质量信用,电商产品质量信用于作为评价该电商产品质量的数据;

概念层设置指标:固有质量、损失质量、感知质量、商家信用和质量追溯;其中,固有质量、损失质量和感知质量共同构成产品质量;

指标层设置指标:标准化指标、生产指标、设计指标、原材料指标、安全性指标、环保性指标、消费者指标、三方指标、服务指标、基础指标、金融指标、信用指标和溯源指标;

数据层即步骤(1)所述的产品质量数据仓库,存储有:产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据(平台自身运行数据),用于作为电商产品质量信用指数评价模型的数据来源;

技术层对各层指标进行降维操作,用于减少指标数量(把多指标转化为少数几个综合指标),计算得到最终的电商产品质量信用指数(技术层贯穿这个电商产品质量信用指数模型的关键技术,一方面可以解决“维数灾难”,缓解“信息丰富、知识贫乏”现状,降低复杂度,提高运算精度和运算效率;另一方面可以更好地认识和理解数据,寻找质量信用数据内部的本质结构特征);

在电商产品质量信用指数评价模型中,存在层次指标框架,具体是指:

概念层的指标,共同对应上层次目标层的电商产品质量信用指数;

指标层的指标,对应上层次概念层的指标:标准化指标、生产指标、设计指标和原材料指标对应概念层的固有质量,安全性指标和环保性指标对应概念层的损失质量,消费者指标、三方指标和服务指标对应概念层的感知质量,基础指标、金融指标和信用指标对应概念层的商家信用,溯源指标对应概念层的质量追溯;

指标层的指标,分别对应不同的工具变量:标准化指标对应制造许可证和节能环保认证;生产指标对应流水线管理和生产环境控制;设计指标对应功能实用性;原材料指标对应原材料质量检验和原材料运输存储;安全性指标对应安全损害性;环保性指标对应环保损害性;消费者指标对应消费者满意度;三方指标对应行业协会评价和媒体评价;服务指标对应售前和售后服务;基础指标对应工商登记信息、纳税情况、法定资质和劳动力投入;金融指标对应信贷信息和保险信息;信用指标对应企业质量信用;溯源指标对应产品质量追溯网络;

步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型;

制定量化标准(根据专业知识对各个工具变量划分等级区间,以工具变量所在区间作为量化值,这里的量化标准可由专家制定),并根据量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值;

指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量;

步骤(4):构造判断矩阵并计算各层次指标权重;

分别对目标层、概念层、指标层中的各指标的相对重要性给出判断,并用数值表示出来,写成矩阵形式即形成判断矩阵(判断矩阵表示针对上一层次某因素而言,本层次与之有关的各因素之间的相对重要性);然后,对判断矩阵按行进行归一化,得到每一个指标的权重;

每一层次指标的权重计算方法具体为:

计算该层次对应判断矩阵的行中元素的乘积mi,i=1~n,n是指该行元素的数量;然后计算mi的n次方根ni,即得到向量n=(n1,n2,...,nn)t;

其中,t是指矩阵转置;

对向量n进行归一化处理,即求得该行每一个元素的权重pi:

步骤(5):按权重合成每个商品的初始电商产品质量信用指数;

对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数conceptionindexij0:

其中,bk是商品i的工具变量k的初始数值;wk是商品i的工具变量k所对应的指标的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;

然后,对概念层的初始质量信用指数进行加权,得到目标层指标的初始质量信用指数indexi0:

其中,uj是概念层指标j的权重,即由步骤(4)计算得到;

步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率;

对应数值类型的增长率算法:

其中,i是指商品i;t是指月份t;relativeratioit是指商品i在t月的工具变量的原始增长率;xit是指商品i在t月的工具变量的值,xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指标层的每个指标所对应的工具变量值;

对应状态类型的增长率算法:

对应比例类型的增长率算法:

其中,zit是指商品i在t月的比例类型工具变量值,zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指标层的每个指标所对应的工具变量值;

步骤(7):修正原始增长率以获得修正后增长率;

根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+inf],其中inf是指无穷大;

电商产品质量信用指数评价模型中的指标类型分为:流量类型指标、比例类型指标和状态类型指标;

根据工具变量对应的指标的类型,标准化增长率的方式具体为:

方式1)对于流量类型或者比例类型的指标对应的工具变量:

其中,relativeratio’it是指商品i在t月的工具变量的修正增长率;x是指商品i在t月的工具变量的原始增长率,由步骤(6)计算得到;

方式2)对于状态类型的指标对应的工具变量:

relativeratio′it=relativeratioit

步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数;

计算每个商品的产品质量信用指数的方法,具体为:

通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率indexrationit:

其中,relativeratio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;

利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数indexit:

indexit=indexit-1*(1+indexratioit)

其中,indexit-1是前一个月份的产品质量信用指数(因由步骤(5)计算得到了初始质量信用指数indexi0,故能得到indexit-1的值);所述符号“*”是指乘法运算;

步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数;

计算每个商品的投票权变量,具体包括下述方法步骤为:

方法步骤1):确定销量总和的占比超过市场总销量的固定百分比r的前topn商品;topn值的计算方法为:将商品销量按从大到小排序,取前topn个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;

其中,r为常数,取值范围为:10%~50%(r默认为30%);

方法步骤2):计算集中度ratio:

其中,为近n个月所述topn商品的销量和;n为常数,取值范围为:1~12;mean(volume)为该行业中的同类商品的平均销量;

方法步骤3):根据销量和集中度计算投票权voteit:

其中,volumeit为近m个月商品i的平均成交量;m为自然数,取值范围为1~5(m优选为3);voteit是商品i在t月的投票权;τ是指投票温度,取值范围为0~1,设置τ越小则销量高的商品权重越高;所述items是指该行业中的同类商品集合(要确定产品质量信用的商品i的市场同类商品集合);volumekt是指商品k在t月的销量,k指商品k;符号“*”是指乘法运算;

集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:

其中,items是指该行业中的同类商品集合;l默认值为100;

计算得到的总体产品质量信用指数indext,即为最终评价电商产品当前月份的质量信用的数据,该值越大,则产品质量信用越好。

提供一种电商产品质量信用指数分析系统,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适用于由处理器加载并执行:

步骤(1):采集并融合多源跨平台的电商产品质量数据;

先从异构的系统数据源中采集数据对象,采集完成后,将不同类型和不同结构的原始数据清洗、处理成统一框架下的标准化数据;

异构的系统数据源包括结构化的数据源和非结构化的数据源;结构化的数据源中存储结构化数据,结构化数据包括产品质量检验报告、商家征信记录和电商平台产品属性数据;非结构化的数据源中存储非结构化数据,非结构化数据包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本和产品质量舆情信息;

标准化数据是指:将原始数据按比例缩放到一个特定区间,去除数据的单位限制,形成的无量纲的纯数值的数据(标准化数据便于不同单位或量级的指标能够进行比较和加权);

不同类型和不同结构的原始数据处理后,得到的标准化数据分为结构化的标准化数据和非结构化的标准化数据:

对于结构化的标准化数据,直接提交给统一的产品质量数据仓库(产品质量数据仓库用于存储数据);

对于非结构化的标准化数据,先将非结构化的标准化数据中的关键信息,通过相应信息抽取算法提取出来完成结构化过程,变成结构化的标准化数据后,再提交给统一的产品质量数据仓库;

步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量;

电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层;

目标层设置指标:电商产品质量信用,电商产品质量信用于作为评价该电商产品质量的数据;

概念层设置指标:固有质量、损失质量、感知质量、商家信用和质量追溯;其中,固有质量、损失质量和感知质量共同构成产品质量;

指标层设置指标:标准化指标、生产指标、设计指标、原材料指标、安全性指标、环保性指标、消费者指标、三方指标、服务指标、基础指标、金融指标、信用指标和溯源指标;

数据层即步骤(1)所述的产品质量数据仓库,存储有:产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据(平台自身运行数据),用于作为电商产品质量信用指数评价模型的数据来源;

技术层对各层指标进行降维操作,用于减少指标数量(把多指标转化为少数几个综合指标),计算得到最终的电商产品质量信用指数(技术层贯穿这个电商产品质量信用指数模型的关键技术,一方面可以解决“维数灾难”,缓解“信息丰富、知识贫乏”现状,降低复杂度,提高运算精度和运算效率;另一方面可以更好地认识和理解数据,寻找质量信用数据内部的本质结构特征);

在电商产品质量信用指数评价模型中,存在层次指标框架,具体是指:

概念层的指标,共同对应上层次目标层的电商产品质量信用指数;

指标层的指标,对应上层次概念层的指标:标准化指标、生产指标、设计指标和原材料指标对应概念层的固有质量,安全性指标和环保性指标对应概念层的损失质量,消费者指标、三方指标和服务指标对应概念层的感知质量,基础指标、金融指标和信用指标对应概念层的商家信用,溯源指标对应概念层的质量追溯;

指标层的指标,分别对应不同的工具变量:标准化指标对应制造许可证和节能环保认证;生产指标对应流水线管理和生产环境控制;设计指标对应功能实用性;原材料指标对应原材料质量检验和原材料运输存储;安全性指标对应安全损害性;环保性指标对应环保损害性;消费者指标对应消费者满意度;三方指标对应行业协会评价和媒体评价;服务指标对应售前和售后服务;基础指标对应工商登记信息、纳税情况、法定资质和劳动力投入;金融指标对应信贷信息和保险信息;信用指标对应企业质量信用;溯源指标对应产品质量追溯网络;

步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型;

制定量化标准(根据专业知识对各个工具变量划分等级区间,以工具变量所在区间作为量化值,这里的量化标准可由专家制定),并根据量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值;

指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量;

步骤(4):构造判断矩阵并计算各层次指标权重;

分别对目标层、概念层、指标层中的各指标的相对重要性给出判断,并用数值表示出来,写成矩阵形式即形成判断矩阵(判断矩阵表示针对上一层次某因素而言,本层次与之有关的各因素之间的相对重要性);然后,对判断矩阵按行进行归一化,得到每一个指标的权重;

每一层次指标的权重计算方法具体为:

计算该层次对应判断矩阵的行中元素的乘积mi,i=1~n,n是指该行元素的数量;然后计算mi的n次方根ni,即得到向量n=(n1,n2,...,nn)t

其中,t是指矩阵转置;

对向量n进行归一化处理,即求得该行每一个元素的权重pi:

步骤(5):按权重合成每个商品的初始电商产品质量信用指数;

对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数conceptionindexij0:

其中,bk是商品i的工具变量k的初始数值;wk是商品i的工具变量k所对应的指标的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;

然后,对概念层的初始质量信用指数进行加权,得到目标层指标的初始质量信用指数indexi0:

其中,uj是概念层指标j的权重,即由步骤(4)计算得到;

步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率;

对应数值类型的增长率算法:

其中,i是指商品i;t是指月份t;relativeratioit是指商品i在t月的工具变量的原始增长率;xit是指商品i在t月的工具变量的值,xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指标层的每个指标所对应的工具变量值;

对应状态类型的增长率算法:

对应比例类型的增长率算法:

其中,zit是指商品i在t月的比例类型工具变量值,zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指标层的每个指标所对应的工具变量值;

步骤(7):修正原始增长率以获得修正后增长率;

根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+inf],其中inf是指无穷大;

电商产品质量信用指数评价模型中的指标类型分为:流量类型指标、比例类型指标和状态类型指标;

根据工具变量对应的指标的类型,标准化增长率的方式具体为:

方式1)对于流量类型或者比例类型的指标对应的工具变量:

其中,relativeratio’it是指商品i在t月的工具变量的修正增长率;x是指商品i在t月的工具变量的原始增长率,由步骤(6)计算得到;

方式2)对于状态类型的指标对应的工具变量:

relativeratio′it=relativeratioit

步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数;

计算每个商品的产品质量信用指数的方法,具体为:

通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率indexrationit:

其中,relativeratio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;

利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数indexit:

indexit=indexit-1*(1+indexratioit)

其中,indexit-1是前一个月份的产品质量信用指数(因由步骤(5)计算得到了初始质量信用指数indexi0,故能得到indexit-1的值);所述符号“*”是指乘法运算;

步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数;

计算每个商品的投票权变量,具体包括下述方法步骤为:

方法步骤1):确定销量总和的占比超过市场总销量的固定百分比r的前topn商品;topn值的计算方法为:将商品销量按从大到小排序,取前topn个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;

其中,r为常数,取值范围为:10%~50%(r默认为30%);

方法步骤2):计算集中度ratio:

其中,为近n个月所述topn商品的销量和;n为常数,取值范围为:1~12;mean(volume)为该行业中的同类商品的平均销量;

方法步骤3):根据销量和集中度计算投票权voteit:

其中,volumeit为近m个月商品i的平均成交量;m为自然数,取值范围为1~5(m优选为3);voteit是商品i在t月的投票权;τ是指投票温度,取值范围为0~1,设置τ越小则销量高的商品权重越高;所述items是指该行业中的同类商品集合(要确定产品质量信用的商品i的市场同类商品集合);volumekt是指商品k在t月的销量,k指商品k;符号“*”是指乘法运算;

集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:

其中,items是指该行业中的同类商品集合;l默认值为100;

计算得到的总体产品质量信用指数indext,即为最终评价电商产品当前月份的质量信用的数据,该值越大,则产品质量信用越好。

本发明的整体框架:先定义用于构建所述电商产品质量信用指数的指标,按层次得到每个商品的初始电商产品质量信用指数,再计算以时间为维度的每个商品所对应指标的工具变量的原始增长率,并修正所述原始增长率以获得修正后增长率的算法。利用修正后增长率对历史电商产品质量信用指数进行更新的算法。最后集合每个商品的质量信用指数及投票权来计算得到总体行业的电商产品质量信用指数。这一整套流程可以计算出电商产品质量信用指数,流程中的每一步都不可以改变。

与现有技术相比,本发明的有益效果是:

本发明通过电商产品质量信用指数评价模型,综合平台接入的产品质检数据、商家征信记录、用户评价数据、政府相关数据和质量舆情等信息,结合线上线下信息,进行量化综合评价,从而提供给用户更加全面可靠的商品质量指数,以便用户做出选择。

商品评价一定程度上依赖线上数据,而本发明更重要的是将线下数据,如企业的资本、劳动力、规模,以及国家质监局及政府委托的第三方质检公司对商品的检测报告,纳入考评维度,并将其分为数值、状态、比例等不同类型计算增长率;针对不同商品,根据其所属类目的不同由专家讨论确立其权重,如纯净水和拉杆箱的评价标准显然很难一样,同指标的重要程度也大不一样。

本发明将时间因素考虑在内,在时间维度不断更新电商产品的投票权和质量信用指数,而给消费者提供更加准确的参考。

本发明除了包含传统的电商平台评论及舆情分析,还提出新的思路,在不同类目对产品设置不同评价的指标,增强类目间产品区分度,为关心产品质量的用户提供了快捷、准确并且专业的结果。

本发明是一种对电商产品质量信用指数分析的创新性计算方法,能对电商产品进行深入分析,能够如实刻画电商产品发展波动的轨迹,有效监测电商产品行业的发展态势。

附图说明

图1为本发明中的电商产品质量信用指数评价模型示意图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述:

一种电商产品质量信用指数分析方法,通过建立电商产品质量信用指数,并通过指数值来展示分析结果;进一步具体来讲,通过采集某一类商品的各个制造商的商业数据,进而提炼指标,并量化指标,随后计算得到该类电商产品质量信用指数值。

该种电商产品质量信用指数分析方法,具体包括下述步骤:

步骤(1):采集并融合多源跨平台的电商产品质量数据。

数据抓取采集层主要负责从异构的系统数据源中采集数据对象,其中结构化的数据源包括产品质量检验报告、商家征信记录、电商平台产品属性数据等;非结构化的数据源包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本、产品质量舆情信息等。在完成数据采集工作后,将不同类型和结构的原始数据清洗、处理成统一框架下的标准化数据,对非结构化数据中的关键信息通过相应信息抽取算法提取出来完成结构化过程,将这些综合性的数据提交给统一的产品质量数据仓库,为后续操作奠定数据基础。

步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量。

如图1所示,电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层。目标层是整个模型最终的目标,即电商产品质量信用指标。概念层是产品质量信用包含的三个概念,即产品质量、商家信用和质量追溯,产品质量又包括固有质量、损失质量和感知质量;概念层是产品质量信用评价的在产品、商家、物流三个维度的粗粒度概念目标。指标层是评价体系模型的中间层,为将质量信用概念进行分解所得的评价质量信用指标集合;指标层对应于概念层的多方面的细粒度评价指标,它们分别对应于不同数据来源提取出来的产品质量信用特征。数据层是整个模型的数据来源,包含了产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据(平台自身运行数据)。技术层是质量大数据降维技术,是贯穿这个电商产品质量信用指数模型的关键技术。这五个层面的分工合作,组成完整的电商产品质量信用指数评价模型。

具体的,用于构建指数框架的指标层划分为:

1)用于构建所述产品质量指数的指标框架部分,其类型包括:固有质量指标、损失质量指标和感知质量指标。产品质量中的固有质量分为标准化指标、生产指标、设计指标和原材料指标。产品的损失质量分为安全性指标和环保性指标。产品的感知质量分为消费者指标、三方指标和服务指标。

2)用于构建所述商家信用指数的指标框架部分,其类型包括:基础指标、金融指标和信用指标。基础指标是企业的符合规范程度,包括企业基础信息、登记信息、法定资质、纳税等的情况;金融指标是企业的信贷和保险,这里就涉及到第三方信贷机构和保险机构的信任传播;信用指标主要是该企业生产的产品质量信用的综合。

3)用于构建所述质量追溯指数的指标框架部分,质量追溯的指标是溯源指标,需要对来自原材料供应商、生产环节、物流方和销售卖家的数据,对原材料供应商提供的原料、标准、关联的卖家和产品标签进行统计分类,对厂家产品进行登记录入,并记录产家和卖家使用的物流方信息,最后注册销售卖家的身份信息和检验信息,构建产品质量追溯网络。

所述产品质量指标框架、商家信用指标框架和质量追溯指标框架中的指标是分为树状结构的多级的,例如以下表1所示,展示所有指标与工具变量的关系。

表1评价指标层次表

需说明的是,表1中的各项指标仅为列举,在实际情况中均可以进行增、删或替代,并非以此表为限。

步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型。

根据专家制定的量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值。

然后,指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量。

专家制定的量化标准是指:根据专业知识对各个工具变量划分等级区间,以工具变量所在区间作为量化值。

步骤(4):构造判断矩阵并计算各层次指标权重。

判断矩阵表示对每一层次各指标的相对重要性给出的判断,这些判断用数值表示出来,写成矩阵形式就是判断矩阵。判断矩阵表示针对上一层次某因素而言,本层次与之有关的各因素之间的相对重要性。对判断矩阵按行进行归一化,得到每一个指标的权重。

目标层a到概念层b的判断矩阵如下表2所示,概念层指标对于电商产品质量信用的权重的计算方法为:

计算该层次对应判断矩阵的行中元素的乘积mi,i=1~5,然后计算mi的5次方根ni,即得到向量n=(n1,n2,n3,n4,n5)t

其中,t是指矩阵转置;

对向量n进行归一化处理,求得:p1=0.41,p2=0.26,p3=0.11,p4=0.04,p5=0.18。wi=(0.41,0.26,0.11,0.04,0.18)t

表2a-b判断矩阵及权重

表2中的各项权重仅为举例,可以根据实际情况进行修改,并非以此表为限。

步骤(5):按权重合成每个商品的初始电商产品质量信用指数。

对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数conceptionindexij0:

其中,bk是商品i的工具变量k的初始数值;wk是工具变量k在计算指数过程中的权重;indicators指属于概念层指标j的指标层对应的工具变量的集合;

然后,对概念层的初始质量信用指数进行加权,得到目标层的初始质量信用指数indexi0:

其中,uj是概念层指标j的初始质量信用指数在合成指数中的权重;

步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率。

对应数值类型的增长率算法:

其中,i是指商品i;t是指月份t;relativeratioit是指商品i在t月的工具变量的原始增长率;xit是指商品i在t月的工具变量的值,xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指指标层的每个指标所对应的工具变量值;

对应状态类型的增长率算法:

对应比例类型的增长率算法:

其中,zit是指商品i在t月的比例类型工具变量值,zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指指标层的每个指标所对应的工具变量值;

步骤(7):修正原始增长率以获得修正后增长率。

根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+inf],其中inf是指无穷大;

标准化增长率的方式为:

方式1)对于流量类型或者比例类型的指标对应的工具变量:

其中,relativeratio’it是指商品i在t月的工具变量的修正增长率;x是指修正前的工具变量;

方式2)对于状态类型的指标对应的工具变量:

relativeratio′it=relativeratioit

步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数。

计算每个商品的质量信用指数需要的方法,具体为:

通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率indexrationit:

其中,relativeratio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;

利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数indexit:

indexit=indexit-1*(1+indexratioit)

步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数。

计算每个商品的投票权变量,具体包括下述方法步骤为:

方法步骤1):计算销量总和的占比超过市场总销量的固定百分比r的前topn商品中的topn值;

topn值的计算方法为:将商品销量按从大到小排序,取前topn个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;

其中,r为常数,取值范围为:10%-50%(r默认为30%);

方法步骤2):计算集中度:

其中,为近n个月所述topn商品的销量和;n为常数,取值范围为:1-12-;mean(volume)为该行业中的同类商品的平均销量;

方法步骤3):根据销量和集中度计算投票权voteit:

其中,volumeit为近m个月商品i的平均成交量;m为自然数,取值范围为:1-5(m优选为3);voteit是商品i在t月的投票权;τ是指投票温度,取值范围为:0-1,τ越小则销量高的商品权重越高;所述items是指所有商品集合;

集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:

其中,items是指本专利要确定产品质量信用的商品i的市场同类商品集合;l默认值为100;

计算得到的总体产品质量信用指数indext,即为最终评价电商产品当前月份的质量信用的数据,该值越大,则产品质量信用越好。

最后,需要注意的是,以上列举的仅是本发明的具体实施例。显然,本发明不限于以上实施例,还可以有很多变形。本领域的普通技术人员能从本发明公开的内容中直接导出或联想到的所有变形,均应认为是本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1