一种提取观点的方法和设备的制造方法

文档序号:9471475阅读:224来源:国知局
一种提取观点的方法和设备的制造方法
【技术领域】
[0001] 本发明的实施方式设及计算机领域,更具体地,本发明的实施方式设及一种提取 观点的方法和设备。
【背景技术】
[0002] 本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的 描述不因为包括在本部分中就承认是现有技术。
[0003] 随着互联网技术的普及,论坛等虚拟社区不断发展。在虚拟社区中,每天都会产生 大量对某个评价对象的评论内容,该评价对象可W是汽车,手机,或者食品等实物产品,也 可W是社交软件,购物平台,或者游戏道具等虚拟产品。商家可W统计消费者在虚拟社区中 对产品的评论内容,分析消费者对产品的需求,不断对产品进行改进,提升产品质量。
[0004] 虚拟社区中对某个评价对象的评论内容,一般包括四部分:主题(topic),观点持 有者化older),观点(claim)W及情感极性判断。一般情况下,从评论内容中所提取的观点 是分析消费者对产品需求的主要依据。所提取的一个评价对象的观点中,不仅包括对该评 价对象的观点,还包括对该评价对象的属性的观点。
[0005] 目前,现有技术中采用固定的句式结构实现对观点的提取,W两个标点符号间的 一串文字作为一个整体进行分析,当所述两个符号间的一串文字满足表1所示的句式结构 时,将所述两个符号间的一串文字作为观点进行提取。
[0006] 表1中的n表示名词,a表示形容词,V表示动词,d表示副词,U表示助词,C表示 连词,"+ "表示词的组合,表1中括号里面的内容可W替换括号外面没被"+ "隔开的内容。 举例说明:表1中n(n+n或n+n+n等)+a,观点的句式结构为名词(n)与形容词(a)的组合, 其中,可W用两个名词(n+n)或S个名词(n+n+n)组成的名词短语代替名词(n)。
[0007] 表1观点的句式结构
[0008]



【发明内容】

[0009] 但是,现有技术中采用表1所示的固定的句式结构提取观点的方法,一方面,固定 的句式结构中没有否定的句式结构,无法识别否定的观点;另一方面,固定的句式结构中评 价观点不一定是对评价对象进行评价的观点,导致提取的观点错误;再一方面,该方法W两 个标点符号之间的一串文字为一个整体进行分析,无法识别评价对象和评价观点在不同的 短句中的观点。由于现有技术所采用的提取观点的方法存在上述问题,因此,采用现有技术 提取的观点的准确率低,完整程度低,导致提取的观点实用性差。
[0010] 因此,在现有技术中,提取的观点的准确率低,完整程度低,导致的观点实用性差, 运是非常令人烦恼的过程。
[0011] 为此,非常需要一种改进的提取观点的方法和设备,W使得提取观点时可W识别 否定的观点,避免提取错误观点,能够识别评价对象和评价观点在不同的短句中的观点,提 高所提取观点的正确率,完整程度W及实用性。
[0012] 在本上下文中,本发明的实施方式期望提供一种提取观点的方法和设备。
[0013] 本发明实施例的第一方面,提供了一种提取观点的方法,包括:从虚拟社区获取用 户针对评价对象的评语;对所述评语进行分词,获得所述评语中每个词的词性;根据所述 每个词的词性对所述评语进行依存分析,获得所述评语中各个词之间的依存关系;根据所 述评语中各个词之间的依存关系,从所述虚拟社区的评语中提取用户对所述评价对象或预 设的所述评价对象的属性的评价观点。
[0014] 本发明实施例的第二方面,提供了一种提取观点的设备,包括:第一获取模块,用 于从虚拟社区获取用户针对评价对象的评语;分词模块,用于对所述评语进行分词,获得所 述评语中每个词的词性;分析模块,用于根据所述每个词的词性对所述评语进行依存分析, 获得所述评语中各个词之间的依存关系;提取模块,用于根据所述评语中各个词之间的依 存关系,从所述虚拟社区的评语中提取用户对所述评价对象或预设的所述评价对象的属性 的评价观点。
[0015] 根据本发明提供的提取观点的方法和设备,可W在提取观点时,对所述评语进行 分词,获得所述评语中每个词的词性,根据所述每个词的词性对所述评语进行依存分析,获 得所述评语中各个词之间的依存关系,根据所述评语中各个词之间的依存关系提取观点, 可W识别否定的观点,避免提取错误观点,能够识别评价对象和评价观点在不同的短句中 的观点,从而显著地降低了提取观点的错误率,提高了所提取的观点的实用性。
【附图说明】
[0016] 通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述W及其他目 的、特征和优点将变得易于理解。在附图中,W示例性而非限制性的方式示出了本发明的若 干实施方式,其中:
[0017] 图1为本发明的实施方式的一个示例性应用场景的框架示意图;
[0018] 图2为本发明的实施方式一个示例性应用场景提取的评价观点的结果示意图;
[0019] 图3示意性地示出了本发明中提取观点的方法一实施例的流程图;
[0020] 图4示意性地示出了根据本发明中依存关系的实例示意图;
[0021] 图5示意性地示出了本发明中提取观点的设备一实施例的结构示意图。
[0022] 在附图中,相同或对应的标号表示相同或对应的部分。
【具体实施方式】
[0023] 下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出运 些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非W任何 方式限制本发明的范围。相反,提供运些实施方式是为了使本公开更加透彻和完整,并且能 够将本公开的范围完整地传达给本领域的技术人员。
[0024] 本领域技术人员知道,本发明的实施方式可W实现为一种系统、装置、设备、方法 或计算机程序产品。因此,本公开可W具体实现为W下形式,即:完全的硬件、完全的软件 (包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
[00巧]根据本发明的实施方式,提出了一种提取观点的方法和设备。
[0026] 在本文中,需要理解的是,所设及的符号"+ "不表示数学中常规意义的求和,而是 表示该"+ "前后的内容按照顺序组合。例如:属性A+介词C+属性B+观点D,表示由属性 A,介词C,属性BW及观点D依次组合所得的句式。此外,附图中的任何元素数量均用于示 例而非限制,W及任何命名都仅用于区分,而不具有任何限制含义。
[0027] 下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
[0028] 发巧概沐
[0029] 本发明人发现,现有技术中采用固定的句式结构实现对观点的提取时,一方面,固 定的句式结构中没有否定的句式结构,无法识别否定的观点。例如:"完全不觉得运部手机 漂亮",根据现有技术中的句式结构"n+a",提取出的观点为"手机漂亮",但是实际的观点是 "手机不漂亮"。
[0030] 另一方面,固定的句式结构中评价观点不一定是对评价对象进行评价的观点,导 致提取的观点错误。例如:"手机麻烦你帮我修理一下",提取出的观点为"手机麻烦",实际 上"麻烦"不是修饰手机的。
[0031] 再一方面,该方法W两个标点符号之间的一串文字为一个整体进行分析,无法识 别评价对象和评价观点在不同的短句中的观点。例如:"我新买了一台电脑,可好用了 ",由 于分析的最小单位是两个标点符号之间的短语,则无法识别观点"电脑好用"。
[0032] 因此,采用现有技术中固定的句式结构提取观点存在上述问题,提取的观点的准 确率低,完整程度低,导致提取的观点实用性差。
[0033] 基于上述发现,本发明的基本思想在于:对用户针对评价对象的评语进行分词,获 得所述评语中每个词的词性;根据所述每个词的词性对所述评语进行依存分析,获得所述 评语中各个词之间的依存关系;根据所述评语中各个词之间的依存关系提取观点。一方面, 本发明中根据所述评语中各个词之间的依存关系,可W分析得到否定的观点,并且分析出 观点所属的评价对象;另一方面,本发明中分析的最小单元是评语,即一般情况下是针对评 价对象进行评论的完整的语句,而不是由任意两个标点符号隔开的短句,可W识别评价对 象和评价观点在不同的短句中的观点。因此,本发明提供的提取观点的方法能够识别评价 对象和评价观点在不同的短句中的观点,提高所提取观点的正确率,完整程度W及实用性。
[0034] 在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方 式。
[00巧]麻用场景总哈
[0036] 首先参考图1,图1为本发明的实施方式的一个示例性应用场景的框架示意图。虚 拟社区的存储设备,用于存储有所有评语的原始数据。虚拟社区的评语捜索设备,W评价对 象为关键词,从虚拟社区的存储设备存储的评语中检索针对评价对象的评语,并将针对评 价对象的评语输出至虚拟社区的提取观点设备。虚拟社区的观点设备,按照本发明所提供 的提取观点的方法提取对所述评价对象或预设的所述评价对象的属性的评价观点。
[0037] 图2为本发明的实施方式一个示例性应用场景提取的评价观点的结果示意图。从 针对天气的320条评语中,提取出5条关于"天气变化快"的评价观点,还提取出5条关于 "天气变化大"的评价观点。
[003引"天气变化快"的评价观点对应的原始的评语为:
[0039]
[0040] "天气变it大"的评价观点对应的原始的评语为: '
[0041]
[0042] 需要注意的是,本发明所提供的提取观点的方法可W应用在客户端,也可W应用 在服务器。此处的客户端可W是现有的、正在研发的或将来研发的、能够通过任何形式的
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1