产品简介生成方法及系统的制作方法

文档序号:9418043阅读:247来源:国知局
产品简介生成方法及系统的制作方法
【技术领域】
[0001] 本发明涉及数据挖掘技术领域,尤其涉及基于产品信息及用户评论生成产品简 介。
【背景技术】
[0002] 当人们从在线商城购买产品时,通常能够获知与产品相关的信息,例如产品描述、 产品图像以及用户的评论。通常,产品说明能够有条理的描述产品的性能,特别是对于那些 由许多电子模块组成的高科技产品,并且能够提供丰富的信息使用户理解产品。如图1所 示,为某一数码相机的典型的产品说明。
[0003] 但是,当消费者不熟悉这些产品时,他们很难正确的理解产品说明内容的真正含 义。例如,当毫无经验的消费者阅读上述数码相机的产品描述时,由于其对此非常陌生,所 以他们对于"自动对焦"功能中的" TTL相位检测"的作用将毫无概念。这些消费者不仅会 对某些功能的参数感到疑惑,并且他们也无法理解这些功能参数的真正含义。
[0004] 为了选择"正确"的产品功能,消费者通常希望得到那些已经拥有这些产品的消费 者的使用经验,来解答那里诸如"这功能的是否适合其他人"这样一些疑问。如图2所示, 为一个典型的在线商城产品购买界面。当消费者点击某产品的链接时,消费者能够获知产 品相关信息,例如产品描述、评论以及说明。若用户购买产品,他/她在使用产品后通常会 对产品进行评论来和其他人分享使用经验。消费者能够通过维基百科或者互联网搜索来了 解某一功能参数的具体意义,但寻找源自于其他消费者对于具有这一功能的产品的评论的 对于这一功能参数的描述是相当费力的。另外,若产品功能的相关信息不足,被迫从其他产 品的评论中收集相同功能的相关信息的操作是相当费时的。
[0005] 意见挖掘和总结已经被广泛的研究。而大部分的研究工作都在包含有大量意见的 产品评价以及网络日志数据集合中进行。为了了解意见的真正含义以及更有效地进行意见 挖掘,基于文本倾向(aspect-based)意见挖掘和总结是在这一领域的主流研究方向。为了 寻找产品的描述方面,许多研究应用那些寻找文本中隐藏主题的典型模型。大部分这一方 面的现有研究成果均为对于某一预设或者隐藏的产品功能进行意见挖掘。
[0006] 尽管产品说明已经在许多电子商务领域中应用,但对于在用户评论分析中应用产 品说明的研究非常少。例如,本体支持极性挖掘(ontology-supported polarity mining, 0SPM),利用从Hffib的本体领域数据库,以实现评论的情感分类。但是,这些方法仅研究电 影特点(即功能)而不包括功能参数。也有其他的方法应用产品评论分析,但是其目标在 于文本分类。产品说明及评论均可以用于构建一个描述方面层次结构,但是这一方法也没 有涉及功能参数的作用,其他利用产品说明来总结产品功能的研究也并未涉及功能参数的 作用。
[0007] 因此,绝大部分的基于主体模型的意见挖掘以及总结技术均未使用预先定义的主 体(例如产品说明)来进行产品评论分析。进一步的,现有意见挖掘技术与产品说明的结合 依然无法解决无经验消费者对某一产品说明中的功能的参数作用认知程度非常低的问题。
[0008] 本发明公开的方法及其系统用于解决现有技术中的一个或者多个问题。
[0009] 发明概述
[0010] 本发明一方面公开了一种基于用户评论生成产品简介的方法。所述方法获取若干 个产品的用户评论和产品说明作为输入数据,其中每个产品分别与多个产品说明和用户评 论对应。每个产品说明至少包括一个产品功能和与该功能相关联的功能参数。所述方法还 通过在产品的用户评论之间建立联系来形成产品文档,每个产品文档与该产品相关联的用 户评论对应。所述方法进一步应用主题模型对所述输入数据进行处理并且生成在产品文档 中的主题分布和在主题中的单词分布,所述主题包括产品的说明。所述主题模型是一个挖 掘在选出的产品文档中存在的主题的统计模型,每个产品文档中均包含有一个或者多个主 题并且每个主题都会存在于一个或者多个产品文档。所述方法可以基于所述主题模型向用 户提供产品简介,所述产品简介包括一个或者多个与功能参数相关的语句、产品功能重要 程度信息以及产品特点描述单词。
[0011] 本发明另一方面还公开了一种存储有用于在处理器运行时,执行基于用户评论生 成产品简介的系统。所述系统包括:预处理模块,用于获取若干个产品的用户评论和产品说 明作为输入数据,其中每个产品分别与多个产品说明和用户评论对应,每个产品说明至少 包括一个产品功能和与该功能相关联的功能参数。所述预处理模块还用于通过在产品的用 户评论之间建立联系来形成产品文档,每个产品文档与该产品相关联的用户评论对应。主 题模型生成模块,用于应用主题模型对所述输入数据进行处理并且生成在产品文档中的主 题分布和在主题中的单词分布,所述主题包括产品的说明;所述主题模型是一个挖掘在选 出的产品文档中存在的主题的统计模型,每个产品文档中均包含有一个或者多个主题并且 每个主题都会存在于一个或者多个产品文档。所述系统还包括产品简介生成模块,用于基 于所述主题模型向用户提供产品简介,所述产品简介包括一个或者多个与功能参数相关的 语句、产品功能重要程度信息以及产品特点描述单词。
[0012] 本发明的其他方面,所属技术领域技术人员能够依据本发明的权利要求书,说明 书,以及附图有效实施并充分公开。
[0013] 附图简要说明
[0014] 图1为现有产品说明的具体例子的屏幕截图。
[0015] 图2为现有产品购买循环系统的结构框图。
[0016] 图3为本发明【具体实施方式】的具体工作系统的示意图。
[0017] 图4为本发明【具体实施方式】的计算系统的结构框图。
[0018] 图5为本发明【具体实施方式】的提供产品简介系统的结构框图。
[0019] 图6为本发明【具体实施方式】的产品购买循环的框图。
[0020] 图7为本发明【具体实施方式】的生成产品简介程序的框图。
[0021] 图8为本发明【具体实施方式】的产品简介的屏幕截图。
[0022] 图9为本发明【具体实施方式】的生成产品简介的方法的方法流程图。
[0023] 图10为本发明【具体实施方式】的LDA模型的图模型。
[0024] 图11为本发明【具体实施方式】的半监督LDA模型的图模型。
[0025] 图12为本发明【具体实施方式】的DuanLDA模型的图模型。
[0026] 图13为本发明【具体实施方式】的DuanLDA+模型的图模型。
[0027] 图14为本发明【具体实施方式】的SpecLDA模型的图模型。
[0028] 详细说明
[0029] 附图中展示的部分将被引用以具体说明,阐述本发明具体技术实施方案。说明书 中引用的数字代表附图的相应部分。应当说明的是,下述的【具体实施方式】仅为本发明的其 中一些具体实施方案,而非本发明全部可能的实施方案。依据下述的【具体实施方式】的启示, 本领域技术人员获得的其他技术方案均在本发明的保护范围内。
[0030] 当消费者从在线商城购买产品时,消费者通常会得知产品相关信息,例如产品说 明、产品图片以及用户评论。但是,消费者可能并不知道产品的某些功能和功能参数的真正 意义。随着越来越多的高科技模块和产品的功能数量的增长,功能参数会发散。因此,解决 上述问题变得越来越重要。
[0031] 现实中,最新的数码相机或者电脑产品通常包含有超过50项以上的功能,其中的 大部分功能对于普通消费者而言很难理解。例如,数码相机"佳能70D"在CNET上的产品 说明中包括了 79项功能。它包括许多功能与参数的高级联系,例如("电池类型"与"佳能 LP-E6")以及("感光度"与"IS025600")。一个没有经验的消费者基本上很难了解其他 消费者是否喜欢这些功能或者这些功能对于自己是过多还是恰好合适。这一问题可以从其 他用户的使用经验中找到答案。以下的句子是对其他产品的"佳能LP-E6"和"IS0256000" 这两项功能参数的手动检索结果。结果如下:"60D使用和7D-样的LP-E6电池,这一电 池的优点在于能够满足一整天的拍照需求,但其缺陷为……,并且在最高ISO档位时(即 256000)噪点太多几乎无法使用。"
[0032] 通过阅读上述有用的评论,消费者能够了解功能参数,从而帮助他们更有效和更 经济的选择合适的产品。例如,用户从上述句子中得知电池"LP-E6"的相关信息:它能够维 持一整天的拍照并且是一个非常好的功能,表明评论者认可这一功能参数。当用户考虑照 相机需要较高的电池续航能力而又不清楚"LP-E6"时,上述评论对于用户选择产品就非常 有用。虽然上述评论中还可能包括了一些不相同的意见,但用户也可以据此得知对于同一 功能参数存在的不同的观点。
[0033] 本发明提供了一个依据用户评论自动生成产品简介的系统。图3为本发明具体实 施方式中的工作系统300。如图3所示,所述工作系统300可以包括:web用户终端301、网 络303以及产品信息网站304。当然,还可以包括其他合适的设备。
[0034] 用户302可以连接网络303 (如因特网)并且通过web用户终端301登入产品信 息网站304。Web用户终端301可以是任何能够连接网络303,实现用户302和产品信息网 站304交互的设备,例如桌上电脑、手提电脑、平板电脑、智能手机等等。所述产品信息网站 304可以提供不同产品的多种信息,例如样板、说明、价格、用户评论等等。所述产品信息网 站304还可以提供产品购买渠道。用户302可以在产品信息网站304上获取产品信息并且 购买产品。用户302还可以写下对已购产品的评论。所述网站304可以通过任何合适的网 络接入,例如因特网。计算模块3041用于依据产品信息以及用户评价生成产品简介。在本 发明的一个具体实施例中,所述计算模块3041可以整合在产品信息网站304中。在其他实 施例中,所述计算模块3014也可以是独立的,与产品信息网站304通信连接的模块。
[0035] 计算模块3041和/或web用户终端301可以在任何合适的电子计算平台上运行。 图4为本发明具体实施例中,能够执行所述依据用户评论自动生成产品简介的系统的电子 计算系统400。
[0036] 如图4所示,计算系统400可以包括处理模块402、存储模块404、监视器406、通信 模块408、数据库410以及外围设备412。所述计算系统可以减省上述设备,也可以添加一 些其他类型的设备,而不限于上述设备。
[0037] 所述处理模块402可以是任何合适的处理器或处理器组。具体的,所述处理模块 402为能够进行多线程处理的多核心处理器。存储模块404可以是任何合适的存储设备,例 如ROM,RAM,闪存或者大容量存储器,例如CD-ROM,硬盘等。存储模块404用于存储为进行 各种数据处理而预设的由处理模块402执行的计算机运行程序。
[0038] 进一步的,所述外围设备412包括:各种类型的传感器以及输入,输出设备,例如 键盘,鼠标。通信模块408包括用于在设备间通过网络建立通信连接的各类网络交互设备。 数据库410包括一到多个用于存储不同数据以及对数据进行一些处理,例如搜索数据的数 据库。
[0039] 图5为本发明依据用户评论自动生成产品简介的系统的具体实施例的结构框图。 如图5所示,所述系统500 (即计算模块3041)包括:产品信息数据库5
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1