一种电商服务质量综合评价的方法与流程

文档序号:15258415发布日期:2018-08-24 21:04阅读:479来源:国知局

本发明涉及电商技术领域,尤其涉及一种电商服务质量综合评价的方法。



背景技术:

随着电子商务蓬勃发展,网络购物已成为常见的购物方式之一。但是用户进行网络购物时,用户找不到合适的方式来便捷地获取有关商家综合服务质量的准确信息,造成这种情形的原因大致如下:首先,用户无法接触实际商品,因此对商品质量的感知非常有限;其次,由于商家所提供服务的远程性和延迟性,用户获取信息的过程常常效率较为低下,且获取到的信息有时难以辨别真伪;第三,国内电子商务标准化工作还相对滞后,各个商家和商品常常没有得到权威的标准化质量认证。

目前,比较传统的评价方式为以问卷形式参与调研和评价,通常以某段时间的集中调研为主,数据和信息采集缺少连续性,同时由于与服务时间的间隔,信息的时效性缺失,继而会影响反馈的准确性。传统的评价方式以信用评价为主,顾客反馈只是评价中的一个环节,海量的顾客反馈数据没有得到充分的利用。大规模的收发、统计问卷需要非常多的人工操作,人力成本极高。

因此,一种更好地对电商平台的商品进行评价的方法成为亟待解决的技术问题。



技术实现要素:

本发明的目的旨在至少在一定程度上解决上述的技术问题之一。

为此,本发明的第一个目的在于提出的电商服务质量综合评价的方法,该方法通过评价维度发现技术挖掘关注商品的各个主题和对各个主题的评论短文本进行聚类;利用情感分类器对各个主题的各个评论短文本进行情感分析,获取每一主题的各个评论短文本的情感倾向信息;对每一主题的各个评论短文本的情感倾向信息进行统计,确定每一主题的满意率,进而实现对关注商品的多指标、多维度的服务质量综合评价。这种基于大数据的电子商务服务质量评价方法与传统思路相比具有一定的优势:首先,数据驱动的服务质量评价方法是基于真实使用者的产品服务体验进行认证的,因此能够更为客观地反应真实购买体验中用户的心理;其次,自动化采集分析数据的方式在节约了大量人力资源,能够更高效地进行大规模统计分析;第三,与抽样发放问卷相比,海量的用户评价数据覆盖面更广,更能反应整个用户群体的真实情况。

为了实现上述目的,本发明第一方面实施例的电商服务质量综合评价的方法,包括:

根据关注商品的商品信息查询预先构建的商品数据仓库,以获取所述关注商品的至少一个评论文本,其中,所述商品数据仓库包括各个商品的商品信息与用户反馈信息的对应关系,所述用户反馈信息包括用户对商品的评论文本和评分;

获取所述关注商品的数据预处理后的至少一个评论文本;

利用所述关注商品对应的主题模型对数据预处理后的所述关注商品的至少一个评论文本进行主题识别,确定所述关注商品的至少一个主题以及每个主题的短文本集合,其中,所述短文本集合包括至少一条评论短文本;

利用预先构建的情感分类器对所述关注商品的各个主题短文本集合的各条评论短文本进行情感分析,获取所述关注商品的各个主题的情感倾向信息,以及统计各个主题的情感分析结果以获取所述关注商品的各个主题的满意率。

如上所述的方法,还包括:

利用网络爬虫抓取电商平台上的各个商品的商品信息和用户反馈信息,其中,所述用户反馈信息包括用户对商品的评论文本和评分;

针对每个商品,建立当前商品的商品信息与用户反馈信息的对应关系;

根据各个商品的商品信息和用户反馈信息建立商品数据仓库,所述商品数据仓库包括各个商品的商品信息与用户反馈信息的对应关系。

如上所述的方法,还包括:

从所述商品数据仓库中获取各类商品的评论文本集,其中,每类商品包括至少一个商品,每个商品包括至少一条评论文本;

处理各类商品的各个评论文本,获取各类商品的全部的评论短文本;

利用每类商品的全部的评论短文本训练sentence-lda模型,以构建每类商品的主题模型。

如上所述的方法,所述处理各类商品的各个评论文本,获取各类商品的全部的评论短文本,包括:

针对每类商品的各个评论文本,确定提交各个评论文本的客户端类型和各个评论文本的句长;

根据每个评论文本对应的客户端类型和句长选择每个评论文本的中文分句规则;

根据每个评论文本对应的中文分句规则对每个评论文本进行中文分句以及至少进行以下数据预处理操作:中文分词、词频统计、词语过滤,以获取每个评论文本对应的至少一条评论短文本。

如上所述的方法,还包括:

确定每类商品的用于模型训练的明确情感倾向评论文本集,其中,明确情感倾向评论文本集包括至少一条明确情感倾向评论文本;

利用预先构建的词向量模型将各条明确情感倾向评论文本转化为对应的各个词向量序列;

将各个词向量序列输入到深度神经网络中进行训练,以构建每类商品的情感分类器。

如上所述的方法,所述确定每类商品的用于模型训练的明确情感倾向评论文本集包括:

从所述商品数据仓库中获取每类商品的全部的明确情感倾向评论数据,其中,明确情感倾向评论数据包括明确情感倾向评分和与明确情感倾向评分对应的明确情感倾向评论文本;

按照预设选取规则从全部的明确情感倾向评论数据中选取确定每类商品的用于模型训练的明确情感倾向评论文本集。

如上所述的方法,所述从所述商品数据仓库中获取每类商品的全部的明确情感倾向评论数据,包括:

对从所述商品数据仓库中获取每类商品的全部的用户反馈信息进行下采样;

对经过下采样得到的全部的用户反馈信息至少进行以下数据预处理操作:数据清洗、中文分句、中文分词、词频统计、词语过滤、统一句长操作,以获取全部的明确情感倾向评论数据。

如上所述的方法,所述深度神经网络为cnn、lstm、gru中的任一种。

如上所述的方法,还包括:

从所述商品数据仓库中获取全部商品的评论文本集,处理所述评论文本集以获取语料库;

利用语料库训练skip-gram模型,以构建词向量模型。

如上所述的方法,所述处理所述评论文本集以获取语料库,包括:

对全部的评论文本集至少进行以下数据预处理操作:数据清洗、中文分句、中文分词、词频统计、词语过滤,以获取语料库。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,

图1为本发明实施例的示例性的商品数据仓库的建立方法的流程示意图;

图2为本发明实施例的示例性的主题识别模型的建立方法的流程示意图;

图3为示例性的词云;

图4为本发明实施例的示例性的情感分类器的建立方法的流程示意图;

图5为示例性的某电商平台上的各星级的评论文本数量分布图;

图6为本发明实施例的示例性的词向量模型的建立方法的流程示意图;

图7为本发明一实施例的电商服务质量综合评价的方法的流程示意图;

图8为电商服务认证评审流程图;

图9为服务质量评价系统的交互方式的示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的电商服务质量综合评价的方法。

在信息技术高度发达的今天,用户对商家服务质量以及商品质量的评价数据具有较高的可获性——几乎所有电商平台均提供了用户评价、用户评分、咨询问答等功能。但由于用户评价常常为短文本且规范性较差,每条评论往往信息量较小,不同用户的评论甚至会相互出现矛盾,再加上数据量过于庞大等一系列原因,对于很多商品而言,用户往往不可能阅读完所有的历史评价。然而利用大数据分析技术对用户评分、评论文本等大规模数据进行深度挖掘分析,则可获取商家服务质量相关的丰富知识。例如,通过评价维度发现(aspectdiscovery)技术,可以提取用户对商品及服务进行评价的维度,挖掘用户针对产品及服务的关注点;通过情感分析(sentimentanalysis)技术,可以分析用户对产品及服务的好恶,并基于评论文本对商品及服务的好评度进行统计分析;而将二者结合,则可对文本语句中出现的每一个评价维度以及与该维度相应的情感进行识别,进而实现多指标、多维度的服务质量测评。

本发明设计了一个电子商务服务质量评价的交互式系统。本发明中解决的核心问题是挖掘出一类商品中用户较为关心的质量评价维度,并将评论文本中的语句按照上述维度进行聚类,分析各个维度上每条评论语句的情感倾向,进而对各个维度的满意率进行统计分析,得出对电商平台中商家或商品的综合评价。这里将这一问题定义为一种新的文本挖掘问题—维度情感挖掘(aspectsentimentmining,asm)。

维度情感挖掘包含两个子问题。第一个子问题是评价维度挖掘与评论语句聚类,以电子产品为例,挖掘到的评价维度可能包括屏幕效果、声音效果、配送速度、价格等等;而在评论语句的聚类中,首先需要将每条评论文本按照评价的维度进行拆解,比如对于“音效非常赞,而且配送很快!”这一条评论文本,首先应根据评价的维度拆解为“音效非常赞”与“配送很快”两个短句,其次是将分解得到的两个短句分别归入“声音效果”和“配送速度”两个评价主题。第二个子问题是对各个评价维度相应的评论语句集合进行情感分析,例如假设有一万条短句被归到“声音效果”这一主题,则需通过情感分类器对每一个短句分别进行情感分析,统计情感积极、消极的评论文本条数各有多少,最终计算出“声音效果”这一维度上某一产品或品牌的满意率。将两个子问题的模型结合,便可以实现对电商平台的某一商家或某一产品的多维度综合评价:即列出用户较为关心的评价指标以及相应的得分情况,同时对于每一指标的正面评价和负面评价都可以有相应的真实评论语句作为例证。

维度情感挖掘这一问题是基于电商服务质量综合评价这一背景提出的,它与电商平台数据的特点紧密结合。首先,电商平台中并不存在评价维度的标签,也即对于每一条评论语句而言并没有数据指明这条语句是针对哪一维度对商品做出评价的。其次,电商平台中可以找到有情感标签的文本集,因为用户的评分一定程度地反映了相应文本的感情倾向,而越是极端的评分(满分或者最低分)往往越是可以作为可靠的标签。第三,电商平台往往每名用户只为购买的商品打一个整体分数,不会有给各个分项分别打分的情况,因此原始数据只提供了各个产品或商家的整体分数,并不会提供它们在不同方面的表现情况。因此可以更进一步地说,电商平台原始数据的特殊性决定了维度情感挖掘这一问题的特殊性;利用维度情感挖掘的思路实现电商平台中产品与商家的多维度评价,可以最大程度地利用好电商平台的现有数据且无需额外的数据标注。

为实现对电商平台的商品进行维度情感挖掘,前期需要建立商品数据仓库、主题模型、情感分析器、词向量模型,下面开始介绍商品数据仓库、主题模型、情感分析器、词向量模型的建立方法。

图1为本发明实施例的示例性的商品数据仓库的建立方法的流程示意图。本实施例中通过商品数据仓库存储电商平台上诸如商品信息和用户反馈信息等海量数据,这样为后续利用大数据分析技术对诸如用户评分、评论文本等海量的用户反馈信息进行深度挖掘分析、获取商家服务质量相关的丰富知识等提供了可行性。

如图1所示,该商品数据仓库的建立方法包括如下步骤:

s101、利用网络爬虫抓取电商平台上的各个商品的商品信息和用户反馈信息。

其中,所述用户反馈信息包括用户对商品的评论文本和评分。

具体地,电商平台均提供了用户评价、用户评分、咨询问答等功能,用户可以在电商平台上评价商家服务质量以及商品质量等。举例来说,通过网络爬虫获取了a公司电商平台中三大类商品(分别为笔记本电脑、汽车座套、雨伞)的所有相关商品信息、用户反馈信息,数据规模为1.64g。商品信息共902条,包括商品id、商品名称、商品价格、商铺id、用户评论数量、不同星级的人数分布等;评论数据共7146603条,包括下单时间、用户名、用户省份、评论有用性票数、评论文本、客户端、评分、用户级别等。

s102、针对每个商品,建立当前商品的商品信息与用户反馈信息的对应关系;

s103、根据各个商品的商品信息和用户反馈信息建立商品数据仓库。

其中,所述商品数据仓库包括各个商品的商品信息与用户反馈信息的对应关系。

具体地,先建立各个商品的商品信息与其对应的用户反馈信息的对应关系,将商品信息与用户反馈信息的对应关系存储至基于hadoop和hive的数据仓库以建立数据仓库。hadoop是一个开发和运行处理大规模数据的软件平台,实现在大量计算机组成的集群中对海量数据进行分布式计算。hive是基于hadoop之上的数据仓库,可以存储、查询和分析存储在hadoop中的大规模数据。这样后续可以根据关注商品的商品信息查询数据仓库获取关注商品的诸如评论文本和评分等用户反馈信息。

本实施例提供的建立商品数据仓库的方法,先利用网络爬虫从电商平台获取海量数据,海量的数据可以包括商品信息、用户反馈信息等,并将海量数据进行分布式地存储于基于hadoop和hive的商品数据仓库中,以便进行大规模计算分析。

图2为本发明实施例的示例性的主题模型的建立方法的流程示意图。本实施例中的主题模型可以对商品的评论文本进行评论的维度挖掘。基于获取到的数据集,挖掘用户进行商品评论的主题,获取用户关注的商品及服务评价维度,并依据挖掘得到的主题对各个商品的评论文本进行主题识别,也即针对评论文本的各个短句识别出其描述的评价维度,从而对该商品的评论文本进行短句拆分与归类。

如图2所示,该主题模型的建立方法包括如下步骤:

s201、从所述商品数据仓库中获取各类商品的评论文本集。

在本实施例中,评论文本集可以理解为全部的评论文本组成的集合,每类商品包括至少一个商品,每个商品包括至少一条评论文本。电商平台上的商品种类繁多,在本实施例中,需要分门别类地获取各类商品的评论文本集,后续根据各类商品的评论文本集建立各类商品的主题模型。

s202、处理各类商品的各个评论文本,获取各类商品的全部的评论短文本。

具体地,由于电商平台中评论文本的标点极为不规范,因此,进行分句的规则也较为复杂。空格以及“~”、“。。。”等符号都有可能是句子分割符。一般来说,较短的文本往往是从移动端提交的,而移动端的输入中常会出现用空格代替标点的情况,这种情况在较长的文本中则不会发生。因此,在分句时需要依据句子的长度以及客户端的种类判断该条文本应该使用什么分类策略或规则。注意到一个长句的各个分句有可能描述的是不同主题,因此每个长句也被切分成了多个短句,以保证每句话的主题有较高的纯度。

在一种可能的实现方式中,步骤s202的具体实现方式包括:

步骤s21、针对每类商品的各个评论文本,确定提交各个评论文本的客户端类型和各个评论文本的句长。

步骤s22、根据每个评论文本对应的客户端类型和句长选择每个评论文本的中文分句规则。

步骤s23、根据每个评论文本对应的中文分句规则对每个评论文本进行中文分句以及至少进行以下数据预处理操作:中文分词、词频统计、词语过滤,以获取每个评论文本对应的至少一条评论短文本。

具体地,对评论文本完成中文分句后,开始进行其余数据预处理工作,包括中文分词、词频统计、词语过滤等,以去除原始评论短文本中的出现次数为3次或更低的低频词、标点及停用词等,进而得到评论短文本。

本实施例在训练主题模型之前,对从电商平台采集的评论文件进行中文分句、中文分词、词频统计、词语过滤等操作,所获取的评论短文本有较高纯度的主题,能够保证所建立的主题模型具有良好的主题识别能力。

s203、利用每类商品的全部的评论短文本训练sentence-lda模型,以构建每类商品的主题模型。

需要指出的是,在本实施例中,针对不同类别的商品,分别构建了不同的主题模型,后续根据关注商品的商品信息确定关注商品所属类别,利用与关注商品对应的主题模型识别关注商品的多个主题(即各个评价维度),以及各个主题的评论短文本。

表1列出了lda(latentdirichletallocation)部分主题以及相应权重较大的词语。以商品类别为笔记本电脑为例,表1列出的主题,例如价格、配送速度、开机速度等,基于直观印象来看确实是消费者购买笔记本电脑时较为关注的评估维度。

表1lda模型得出的部分主题及相应词语

表2列出了sentence-lda(sentence-latentdirichletallocation)部分主题以及相应权重较大的词语。值得注意的是,sentence-lda将评论文本中处于同一句话里的各个词语赋予了相同的主题,也即是将一个句子而非一整个文档作为一个词袋,因此一定程度上利用了文档内部结构中的信息。而从表2中,也可以发现,相比与lda模型,sentence-lda模型能够挖掘出一些具有更细粒度的主题,例如“游戏效果”、“外观”等。

表2sentence-lda模型得出的部分主题及相应词语

sentence-lda模型为每个短句都分配了主题,因此可依据所分配主题对短句进行主题聚类。这样,对于每个主题,都会有大量短句作为该主题所属的实例集合。这里以“配送速度”、“售后服务”、“价格”三个主题为例,表随机列举了上述三个主题所属的若干句子(句子中的公司名称被替换成了“a公司”)。可以看出每个主题所属的句子集合的确能够与该主题较好地吻合。例如“这么晚了a公司师傅还给我送货上门了”、“双十一第二天到货”都是典型的描述配送速度的真实用户评论。

表3sentence-lda模型中部分主题所属句子示例

图3为示例性的词云。图3更直观地反应了“配送速度”、“售后服务”、“价格”三个样例主题所包含文本数据的整体情况。在图3中的三个词云中,词语所占的面积与词频成正比,也即越大的词语出现的约频繁。不难看出在各个主题下的高频词都能够与相应主题保持一致,例如“配送速度”这一主题中,“收到”、“物流”、“第二天”等词语都是与该主题密切相关的。

本实施例提供的主题模型的建立方法,通过sentence-lda模型深度挖掘商品的评价维度,并根据评价维度对商品的评论短文本进行主题聚类,从而实现了用户对商品的关注点的挖掘。

图4为本发明实施例的示例性的情感分类器的建立方法的流程示意图。本实施例中的所训练的情感分类器可以用来对各个评价维度上的各条评论短文本进行情感分析。

如图4所示,该情感分类器的建立方法包括如下步骤:

s301、确定每类商品的用于模型训练的明确情感倾向评论文本集。

其中,明确情感倾向评论文本集包括至少一条明确情感倾向评论文本。

在本实施例中,明确情感倾向评论文本即包括积极情感倾向评论文本,也包括消极情感倾向评论文本。举例来说,a公司平台提供了可供用户对商品及其服务的星级评分窗口,通过星级评分窗口,用户可以对商品及其服务给出一颗星至五颗星区间内的评分。一颗星评分说明用户对对商品及其服务很不满意,可以理解为消极情感倾向评分,用户给出消极情感倾向评分时所写出的评论被认为是带有消极情感倾向。五颗星评分说明用户对商品及其服务很满意,可以理解为积极情感倾向评分,用户给出积极情感倾向评分时写出的评论被认为是带有消极情感倾向。当然,消极情感倾向评分和积极情感倾向评分根据实际情形进行设定,在此不做限制。

在一种可能的实现方式中,步骤s301的具体实现方式为:

步骤s31、从所述商品数据仓库中获取每类商品的全部的明确情感倾向评论数据。

其中,明确情感倾向评论数据包括明确情感倾向评分和与明确情感倾向评分对应的明确情感倾向评论文本。明确情感倾向评分包括积极情感倾向评分和消极情感倾向评分;明确情感倾向评论文本包括积极情感倾向评论文本和消极情感倾向评论文本。

具体地,对从所述商品数据仓库中获取每类商品的全部的用户反馈信息进行下采样;对经过下采样得到的全部的用户反馈信息至少进行以下数据预处理操作:数据清洗、中文分句、中文分词、词频统计、词语过滤、统一句长操作,以获取全部的明确情感倾向评论数据。

图5为示例性的某电商平台上的各星级的评论文本数量分布图。如图5所示,某电商平台上,五星的评论文本数量远多于一星的评论文本数量,数据存在着较强的有偏性,正面评论的条目数是负面的37倍。进行数据清洗和中文分句后,发现得到正面评论句子8,371,347条和负面评论句子444,781条,二者比例降低到18.8倍。比例降低是由于差评的文本往往倾向于篇幅更长、句子更多,这一点比较容易理解,然而正面评论和正面评论数量相差依然较为悬殊。对于这一数据不平衡(dataimbalances)问题,本实施例通过下采样(undersampling)加以克服。

对全部的用户反馈信息依次进行下采样、数据清洗、中文分句、中文分词、词频统计、词语过滤、统一句长操作等数据预处理操作,去除低频词、过滤标点与停用词,得到明确情感倾向评论数据。

需要指出的是,通过数据清洗,可以从全部的用户反馈信息剔除情感倾向不明确的用户反馈信息,留下情感倾向明确的用户反馈信息。举例来说,一颗星评分表示消极情感倾向评分,五颗星评分表示积极情感倾向评分,两颗星评分、三颗星评分、四颗星评分则被理解为情感倾向不明确的评分。在数据清洗时,剔除情感倾向不明确的评分及其对应的评论文本。

在此简要介绍统一句长操作。由于评论文本很多是有移动端提交的,会有大量的超短文本,并且导致很多句子只包含一个词语,例如“好”、“不错”、“很赞”、“垃圾”等词语常常能够独立构成一个句子甚至一条评论。有鉴于绝大多数句子序列长度在20以内,可对句子进行截断和补零(zeropadding),从而将句子长度统一成20。当然,根据实际需要将句子长度统一成设计长度。

步骤s32、按照预设选取规则从全部的明确情感倾向评论数据中选取确定每类商品的用于模型训练的明确情感倾向评论文本集。

具体地,经过步骤s31对用户反馈信息的数据预处理操作,获取到全部的明确情感倾向评论数据。预设选取规则可以是按一定的比例从全部的明确情感倾向评论数据选取部分的明确情感倾向评论数据,作为用于模型训练的明确情感倾向评论文本集。当然,后续还可以从全部的明确情感倾向评论数据选取部分的明确情感倾向评论数据,作为用于模型验证的明确情感倾向评论文本集和作为用于模型测试的明确情感倾向评论文本集。预设选取规则具体根据实际情形进行设定。

在本实施例中,明确情感倾向评论文本可以反映用户对商品及其服务较为可靠的体验度,将其作为情感分析器的训练数据,可以保证所训练得到的情感分析器能准确地进行情感分析。

s302、利用预先构建的词向量模型将各条明确情感倾向评论文本转化为对应的各个词向量序列。

s303、将各个词向量序列输入到深度神经网络中进行训练,以构建每类商品的情感分类器。

由于词向量能够最大程度地理解词语间的语义关系,将词向量作为诸如深度神经网络等深度学习模型的输入,有助于提升分类效果。在本实施例中,深度神经网络可以是cnn(convolutionalneuralnetwork,卷积神经网络)、lstm(longshort-termmemory,长短期记忆网络)、gru(gatedrecurrentunit,门限循环单元)中的任一种,但并不以此为限。

需要指出的是,在构建好情感分类器之后,还可以将用于模型验证的明确情感倾向评论文本集输入到情感分类器进行验证,以及将作为用于模型测试的明确情感倾向评论文本集输入到情感分类器进行测试,通过验证和测试持续优化情感分类器的性能。

本实施例提供的情感分类器的建立方法,通过确定每类商品的用于模型训练的明确情感倾向评论文本集;利用预先构建的词向量模型将各条明确情感倾向评论文本转化为对应的各个词向量序列;将各个词向量序列输入到深度神经网络中进行训练,以构建每类商品的情感分类器。该方法,利用具有明确情感倾向评论文本训练深度神经网络,构建情感分类器,该情感分类器可以用来对各个评价维度上的各条评论短文本进行准确的情感分析。

图6为本发明实施例的示例性的词向量模型的建立方法的流程示意图。本实施例所建立词向量模型使输入到情感分类器中的输入量为词向量序列,有助于提升分类效果。

如图6所示,本实施例提供的词向量模型的建立方法,包括:

s401、从所述商品数据仓库中获取全部商品的评论文本集,处理所述评论文本集以获取语料库。

在一种可能的实现方式中,步骤s401的具体实现方式为:对全部的评论文本集至少进行以下数据预处理操作:数据清洗、中文分句、中文分词、词频统计、词语过滤,以获取语料库。

本实施例通过对商品的全部的评论文本集进行数据清洗、中文分句、中文分词、词频统计、词语过滤等一系列的数据预处理操作,去除获取的语料库中不存在低频词、标点、停用词等,获取商品的语料库。

s402、利用语料库训练skip-gram模型,以构建词向量模型。

在本实施例中,基于skip-gram模型的词向量模型可以更好的理解词语间的语义关系。

表4列出了示例词语的最佳词向量及夹角余弦。以语料库为笔记本语料库为例,选取部分词语(部分词语分别为联想、英雄联盟、糟糕、两分钟、北京)作为验证的示例,分别求取与它们语义相似度最高的10个词语以及夹角余弦一同列于表4中。由表4可以看出,与词语“a品牌电脑”最接近的词语包括“b品牌电脑”、“c品牌电脑”、“d品牌电脑”等,同样均为电脑品牌名;与“英雄联盟”一词夹角最小的词向量分别对应“lol”、“lol”、“联盟”等,其中最相近的两个词都是游戏“英雄联盟”的英文缩写;与“糟糕”一词最相近的词语则为“差劲”、“差”等同样表达负面情绪的词汇;与“两分钟”一词夹角最小的词向量分别对应“一分钟”、“三分钟”等表示分钟或秒级别时间长度的词语;而与“北京”这一地名语义最为接近的同样为“广州”、“上海”等地名。值得注意的是,在与“a品牌电脑”这一词语语义最相近的词语还包括“d1品牌电脑”,实际上这一词语是电脑品牌“d品牌电脑”一词的别字版本,也即词向量实际上识别了文本中常见的错别字,并能够识别包含错别字词语的语义。以此类推,表4中的b1品牌电脑、b2品牌电脑均为b品牌电脑的别字版本,表4中的c1品牌电脑、c2品牌电脑均为c品牌电脑的别字版本。经过上述例子的验证可知,基于整个笔记本语料库构建出的词向量模型能够很大程度地理解词语间的语义关系,将词向量模型输出的词向量作为深度学习模型的输入将有助于提升分类效果。

表4示例词语的最相近词向量及夹角余弦

图7为本发明一实施例的电商服务质量综合评价的方法的流程示意图。本实施例为对用户所关注的商品如何进行维度情感分析进行说明。

如图7所示,该电商服务质量综合评价的方法包括如下步骤:

s501、根据关注商品的商品信息查询预先构建的商品数据仓库,以获取所述关注商品的至少一个评论文本。

其中,所述商品数据仓库包括各个商品的商品信息与用户反馈信息的对应关系,所述用户反馈信息包括用户对商品的评论文本和评分。

以关注商品为某品牌笔记本电脑为例,在电商平台上很多其他用户对某品牌笔记本进

s502、获取所述关注商品的数据预处理后的至少一个评论文本。

具体地,来自于不同用户对关注商品的评论文本,长短不一,有的写的很专业,有的写的很随意,需要对其进行一系列的数据预处理,可以在构建主题模型的时候完成对电商平台上的各个商品的数据预处理。

数据预处理的流程如下:

步骤s51、针对每个商品的各个评论文本,确定提交各个评论文本的客户端类型和各个评论文本的句长。

步骤s52、根据每个评论文本对应的客户端类型和句长选择每个评论文本的中文分句规则。

步骤s53、根据每个评论文本对应的中文分句规则对每个评论文本进行中文分句以及至少进行以下数据预处理操作:中文分词、词频统计、词语过滤,以获取每个评论文本对应的至少一条评论短文本。

经过上述步骤之后,每个评论文本被划分为多个评论短文本。该评论短文本不会出现各种低频词、标点、停用词等,且具有较高纯度的主题。

s503、利用所述关注商品对应的主题模型对经过数据预处理的所述关注商品的至少一个评论文本进行主题识别,确定所述关注商品的至少一个主题以及每个主题的短文本集合,其中,所述短文本集合包括至少一条评论短文本。

以关注商品为某品牌笔记本电脑为例,用户对某品牌笔记本电脑的评价维度分别为促销价格、售后服务、物流速度、硬件配置、机体外观,每个评价维度对应一个主题。本实施例中的主题模型可以将某品牌笔记本电脑的全部的评价文本进行主题识别和主题聚类,输出各个主题对应短文本集合,短文本集合包括至少一条评论短文本。

s504、利用预先构建的情感分类器对所述关注商品的各个主题短文本集合的各条评论短文本进行情感分析,获取所述关注商品的各个主题的情感倾向信息,以及统计各个主题的情感分析结果以获取所述关注商品的各个主题的满意率。

经过步骤s503,完成了对关注商品的主题挖掘和基于评论维度的短文本聚类。以关注商品为某品牌笔记本电脑为例,分别挖掘出促销价格、售后服务、物流速度、硬件配置、机体外观等5个主题,每个主题对由评论短文本。情感分析器逐一对各个主题的评论短文本进行情感分析,确定各个评论短文本的情感倾向信息。

例如,针对促销价格这一评价维度,共对应100个评价短文本,情感分析器的情感倾向信息为:60个评价短文本的情感倾向信息为五星评分,30个评价短文本的情感倾向信息为四星评分,10个评价短文本的情感倾向信息为一星评分。根据设定的统计方法对促销价格这一评价维度的情感倾向信息进行统计,确定促销价格这一评价维度的满意率80%。本实施例中,统计方法根据实际情形设定,具体不限。

本发明实施例提供的电商服务质量综合评价的方法,通过评价维度发现技术挖掘关注商品的各个主题并对各个主题的评论短文本进行聚类;利用情感分类器对各个主题的各个评论短文本进行情感分析,获取每一主题的各个评论短文本的情感倾向信息;对每一主题的各个评论短文本的情感倾向信息进行统计,确定每一主题的满意率,进而实现对关注商品的多指标、多维度的服务质量综合评价。这种基于大数据的电子商务服务质量评价方法与传统方法相比具有一定的优势:首先,数据驱动的服务质量评价方法是基于真实使用者的产品服务体验进行认证的,因此能够更为客观地反应真实购买体验中用户的心理;其次,自动化采集分析数据的方式在节约了大量人力资源,能够更高效地进行大规模统计分析;第三,与抽样发放问卷相比,海量的用户评价数据覆盖面更广,更能反应整个用户群体的真实情况。

以下对电商服务认证评审系统的整体架构进行说明。图8为电商服务认证评审流程图,图9为服务质量评价系统的交互方式的示意图。图8中的服务质量评价系统可以理解为用于执行电商服务质量综合评价的方法的执行主体。

参见如8,网络爬虫为电商服务认证评审系统提供了的数据驱动功能,用于从电商平台中抓取数据;核心的模型为服务质量评价系统中的基于sentence-lda的主题模型以及基于深度学习的情感分类器。训练好的主题模型首先执行评价维度挖掘与评论短句聚类,接下来用情感分类器进行各个评论维度的满意率统计,最终给出各个商品在不同指标上的综合评分,所生成的大数据分析报告与评审员(人工进行服务质量认证的工作人员)。其主要作用有二:一是可以建议性地对现有评价指标进行扩充;二是为评审员提供一个初步的服务质量评审结果。评审员在获得上述支持后,继续进行后续的评审环节。

应当注意的是,用户评论文本以及对商品的评分中包含了大量信息,但仍无法囊括对电商进行服务质量综合评价的全部维度。电子商务平台服务质量评价指标中,如物流配送服务、售后保障服务、技术性能等是常常被用户在评论文本里提及的,而商家的主体资质、管理体系、制度措施内容披露等则只能通过审核员通过其他手段进行审核,从用户的评价数据中无法挖掘出足够的相关知识。因此,算法和审核员的协同交互式评价应是此系统的运行模式。图8中的认证方案与评价准则由《电子商务平台服务质量评价与等级划分》等国家标准提供,这些国家标准里规定了服务质量评价的指标以及分数占比。于此系统而言,方案与准则里的评估指标可以作为重点关注的评论主题应用与评价维度挖掘中;而模型挖掘出的主题同样能够建议性地用于现有标准中评价指标的扩充。

另外,此系统通过主动学习和在线学习持续地提升自身的性能。如图所示,在这一交互式评价过程中,在评价某一类商品时,首先通过算法识别出用户较为关心的一系列评价维度与指标;针对需要进行认证评价的商品或商家,计算出相应评价语句里在上述各个维度中积极情感的占比,即可获得各个商品或商家分别在上述各个维度中得到的好评率,最终输出各商家服务质量数据分析报告。审核员基于系统生成的数据分析报告选定需要进一步了解的评价维度,系统返回该维度所有相关评论的摘要,同时抽取与此主题相关性较高的评论文本进行进一步的主题分析。

对于抽取出的文本,审核员可以通过标注一定量的数据更新分类器模型帮助审核员进一步对文本进行更高粒度的分类,这一过程通过主动学习(activelearning)与在线学习(onlinelearning)两种机器学习方法得到实现。其中,主动学习在数据标注的过程中有选择地从大量未标记数据中选择最需要得到领域专家标注的样本向数据标注者提问,也即通过“优先标注权重高的样本”来提高数据标注与模型训练的效率;而在线学习则通过新数据持续地更新模型以使模型性能不断提升。电商平台上新出现的数据、审核员新标注的数据都会使得此系统得到优化。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1