产品简介生成方法及系统的制作方法_5

文档序号:9418043阅读:来源:国知局
将所述相关句子、功能重要程度信息以及产品特点描述单词加入到前述步骤(即 S901)获得的产品的产品简介中(S909)。所述产品简介能够帮助用户更好的理解产品的功 能参数。
[0170] 本发明提供了一种依据用户评论生成产品简介的方法及其系统。所述产品简介可 以提高购物体验。所述系统使用基于改进的LDA模型的新方法来学习在文档中的主题分布 以及在主题中的单词分布。所述主题生成模型可以用于检索与产品的一个功能-参数配对 相关的评论语句。所述主题生成模型还可以用于对功能重要程度进行排序并且提供产品特 点单词。与现有技术相比,本发明能够通过提供具有额外信息展示的产品说明来提升用户 购物体验。
[0171] 在电子商务网站上也经常使用产品说明。但是,没有经验的消费者通常没有足够 的背景知识来了解产品的所有功能,尤其是那些高级功能。为了向消费者提供有用的信息, 本发明提供了一种能够结合当今网站上丰富的产品评论,自动分析产品说明的系统。具体 的,本发明的具体实施例提供了一种新的LDA模型,它能够提供有用的信息,例如功能重要 性程度、产品特点以及检索与产品说明相关的评论,向消费者展示其他消费者对于该产品 或者其他不同产品的同一产品说明的评论。
[0172] 应当指出的是,本发明所述的用于生成产品简介的方法及系统不仅限于应用在产 品购买领域,还可以应用其他任何结合先验知识的说明类型(关键功能参数)的文本收集。
[0173] 依据上述说明和本发明具体实施例,本领域普通技术人员不需要通过创造性劳动 可以实现其他任何合适的【具体实施方式】。应当指出的是,本发明所述的具体实施例仅用于 解释和说明,不用于限制本发明的权利要求保护范围。
【主权项】
1. 一种基于用户评论生成产品简介的方法,其特征在于,所述方法包括如下步骤: 获取若干个产品的用户评论和产品说明作为输入数据,其中每个产品分别与多个产 品说明和用户评论对应,每个产品说明至少包括一个产品功能和与该功能相关联的功能参 数; 通过在产品的用户评论之间建立联系来形成产品文档,每个产品文档与该产品相关联 的用户评论对应; 应用主题模型对所述输入数据进行处理并且生成在产品文档中的主题分布和在主题 中的单词分布,所述主题包括产品的说明;所述主题模型是一个挖掘在选出的产品文档中 存在的主题的统计模型,每个产品文档中均包含有一个或者多个主题并且每个主题都会存 在于一个或者多个产品文档,以及 基于所述主题模型向用户提供产品简介,所述产品简介包括一个或者多个与功能参数 相关的语句、产品功能重要程度信息以及产品特点描述单词。2. 根据权利要求1所述的方法,其特征在于,所述应用主题模型的步骤具体包括: 获取包括在产品文档中已知的主题分布和主题中已知的单词分布的先验知识; 整合所述先验知识并且应用主题模型处理输入数据以生成在产品文档中的主题分布 和在主题中的单词分布;并且 获取主题模型的输出结果,所述输出结果包括学习生成的在产品文档中的主题分布和 在主题中的单词分布。3. 根据权利要求2所述的方法,其特征在于, 所述主题模型为三层贝叶斯概率分布模型; 所述在产品文档中的主题分布服从狄利克雷分布; 所述在主题中的单词分布服从狄利克雷分布。4. 根据权利要求2所述的方法,其特征在于,所述获取先验知识的步骤具体包括: 获取每个单词的类型,所述单词的类型具体为产品说明单词或者产品特点描述单词。5. 根据权利要求4所述的方法,其特征在于, 所述主题包括产品说明主题和用户评论主题;并且 所述先验知识的在产品文档中已知的主题分布具体包括在产品文档中已知的产品说 明主题分布和在产品文档中已知的用户评论主题分布。6. 根据权利要求5所述的方法,其特征在于,所述获取先验知识的步骤还包括: 获取每个产品说明单词的类型,所述产品说明单词的类型具体为产品功能单词或者功 能参数单词。7. 根据权利要求6所述的方法,其特征在于,所述应用主题模型步骤还包括: 将产品说明主题分为产品功能主题和功能参数主题; 获取在产品文档中已知的产品说明主题分布的先验知识,具体包括在产品文档中已知 的产品功能主题分布和在产品文档中已知的功能参数主题分布;以及 整合所述先验知识并应用主题模型处理输入数据以生成在产品文档中的产品功能主 题分布、在产品文档中的功能参数主题分布、在产品文档中的评论主题分布以及在主题中 的单词分布。8. 根据权利要求4所述的方法,其特征在于,所述获取先验知识的步骤还包括: 引入先验分布大小控制子,依据主题的大小对先验分布进行归一化,所述先验分布具 体为属于先验知识的,在主题中的单词分布。9. 根据权利要求5所述的方法,其特征在于,由p (w I f)表示先验知识中在功能主题f 中的单词w的分布,所述在功能主题中已知的单词分布服从齐夫定律分布,单词w的调整后 先验分布p' (w I f)具体表示如下:其中,V(f)为f中的词汇表,V表示所有评论的词汇表,rankf (w)为不包括V(f)的单 词时,w在p (w I f)中的排序位置; 齐夫定律分布的函数Zipf (i)具体表示如下:其中,s为分布的特征参数。10. 根据权利要求2所述的方法,其特征在于,所述基于所述主题模型向用户提供产品 简介的步骤具体包括: 应用即席查询检索系统生成与检索条件相关的语句,所述检索条件为产品的产品功能 及与其相关联的功能参数的配对,其中 所述即席检索系统通过整合检索条件信息和主题模型输出结果,计算用户评论中的语 句的相关程度。11. 根据权利要求5所述的方法,其特征在于,所述基于所述主题模型向用户提供产品 简介的步骤还包括: 令f表示产品功能,Ni表示在文档i中的单词数量,s表示产品说明,z表示主题, 若获取先验知识时,没有将产品功能和功能参数分开,在获取主题模型的输出结果后, 所述功能的重要程度具体表示如下:若获取先验知识时,将产品功能和功能参数分开,在获取主题模型的输出结果后,所述 功能的重要程度具体表示如下:12. 根据权利要求1所述的方法,其特征在于,所述基于所述主题模型向用户提供产品 简介的步骤进一步包括: 当用户将光标点击于产品功能参数框时,依据光标的位置,在悬浮框中展示相关的语 句; 对产品功能重要程度信息进行排序,并在一个独立的,与产品功能相对应的列表中展 示;以及 将产品特点描述单词在独立的一排中展示,其中,描述单词的字体大小及字体颜色与 产品特点的特别程度相对应。13. 根据权利要求7所述的方法,其特征在于,令P表示产品,产品有M个,R表示产品 评论,T表示评论语句,S表示分析后的产品说明,每个文档p中包含N p个单词w,0表示文 档中的主题分布,巾表示主题中的单词分布,f表示产品功能,u表示产品功能参数, 所述获取先验知识的步骤具体包括: 将产品功能变量f与f对应的可能的功能参数变量Uf分离,并且引入功能参数主题〇 以实现在产品功能主题(J)中分离出功能参数主题; 当创建者书写产品的评论单词'^时,其首先使用基于A p的转换子Xpil选择单词关于 产品功能主题还是产品特点主题,其中,Ap由带对称向量y的贝尔塔分布所描述; 若选择了产品功能主题,创建者从功能集合If1,...,f|Fi, f|Fi+1,...,f|Fi+iE|}中选择其 中一个功能fPil,其中{f\,...,f|F|}为来源于产品说明的功能集合,{f |F|+1,...,f|F|+|E|}为产 品说明中没有出现而在评论中提及的,依据由带参数a和对称向量a ' p的狄利克雷分布 描述的0p形成的功能集合; 若功能fPil属于产品说明的功能,创建者通过基于f的转换子y Pil进一步选择单词为 功能单词还是功能参数单词;其中,Jif由带对称向量Y ^勺贝尔塔分布所描述; 若创建者进一步依据I Pif选择功能fPii的功能参数单词uf,则结合选中的功能参数u f, 依据选择单词;其中,I Pif由带常数T和非对称先验知识T p,f的狄利克雷分布所描 述由带常数P和非对称先验分布P ' flU的狄利克雷分布所描述;以及 对功能单词和功能参数单词的先验分布进行归一化处理; 基于先验知识,应用吉布斯采样来构建主题模型;其中,所述主题模型具体如下:14. 一种基于用户评论生成产品简介的系统,其特征在于,所述系统包括: 预处理模块,用于获取若干个产品的用户评论和产品说明作为输入数据,其中每个产 品分别与多个产品说明和用户评论对应,每个产品说明至少包括一个产品功能和与该功能 相关联的功能参数; 所述预处理模块还用于通过在产品的用户评论之间建立联系来形成产品文档,每个产 品文档与该产品相关联的用户评论对应; 主题模型生成模块,用于应用主题模型对所述输入数据进行处理并且生成在产品文档 中的主题分布和在主题中的单词分布,所述主题包括产品的说明;所述主题模型是一个挖 掘在选出的产品文档中存在的主题的统计模型,每个产品文档中均包含有一个或者多个主 题并且每个主题都会存在于一个或者多个产品文档,以及 产品简介生成模块,用于基于所述主题模型向用户提供产品简介,所述产品简介包括 一个或者多个与功能参数相关的语句、产品功能重要程度信息以及产品特点描述单词。15. 根据权利要求14所述的系统,其特征在于,所述主题模型生成模块的具体包括: 先验知识生成单元,用于获取包括在产品文档中已知的主题分布和主题中已知的单词 分布的先验知识; 改进的LDA模型生成单元,用于整合所述先验知识并且应用主题模型处理输入数据以 生成在产品文档中的主题分布和在主题中的单词分布;并且 获取主题模型的输出结果,所述输出结果包括学习生成的在产品文档中的主题分布和 在主题中的单词分布。16. 根据权利要求15所述的系统,其特征在于, 所述主题模型为三层贝叶斯概率分布模型; 所述在产品文档中的主题分布服从狄利克雷分布; 所述在主题中的单词分布服从狄利克雷分布。17. 根据权利要求16所述的系统,其特征在于,所述先验知识生成单元具体用于: 获取每个单词的类型,所述单词的类型具体为产品说明单词或者产品特点描述单词。18. 根据权利要求17所述的系统,其特征在于,所述主题包括产品说明主题和用户评 论主题;并且 所述先验知识的在产品文档中已知的主题分布具体包括在产品文档中已知的产品说 明主题分布和在产品文档中已知的用户评论主题分布。19. 根据权利要求18所述的系统,其特征在于,所述先验知识生成单元用于: 获取每个产品说明单词的类型,所述产品说明单词的类型具体为产品功能单词或者功 能参数单词。
【专利摘要】本发明提供了一种产品简介生成方法及系统。所述方法包括获取若干个产品的用户评论和产品说明作为输入数据,其中产品分别与多个产品说明和用户评论对应,每个产品说明至少包括一个产品功能-功能参数配对。在产品的用户评论之间建立联系来形成产品文档并与所述用户评论对应。应用主题模型处理输入数据并生成文档中的主题分布和主题中的单词分布,主题包括产品说明。所述主题模型是一个挖掘在产品文档中存在主题的统计模型,每个产品文档中均包含有若干主题并且每个主题都在若干产品文档中。基于所述主题模型向用户提供产品简介,其包括一个或者多个与功能参数相关的语句、产品功能重要程度信息以及产品特点描述单词。
【IPC分类】G06F17/30, G06Q30/00, G06F17/27
【公开号】CN105139211
【申请号】CN201510465911
【发明人】朴旲焄, 郭立帆, 丁婉莹, 汪灏泓
【申请人】Tcl集团股份有限公司
【公开日】2015年12月9日
【申请日】2015年7月30日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1