一种提取观点的方法和设备的制造方法_4

文档序号:9471475阅读:来源:国知局
r>【主权项】
1. 一种提取观点的方法,其特征在于,所述方法包括: 从虚拟社区获取用户针对评价对象的评语; 对所述评语进行分词,获得所述评语中每个词的词性; 根据所述每个词的词性对所述评语进行依存分析,获得所述评语中各个词之间的依存 关系; 根据所述评语中各个词之间的依存关系,从所述虚拟社区的评语中提取用户对所述评 价对象或预设的所述评价对象的属性的评价观点。2. 根据权利要求1所述的方法,其特征在于,获取预设的所述评价对象的属性的方法 包括: 根据所述评语中各个词之间的依存关系,获得与所述评价对象为联合关系UR的词; 将所述评价对象以及所述与所述评价对象为UR的词组成的短语作为所述评价对象的 属性。3. 根据权利要求1所述的方法,其特征在于,所述根据所述评语中各个词之间的依存 关系,从所述虚拟社区的评语中提取用户对所述评价对象或预设的所述评价对象的属性的 评价观点包括: 判断所述评语是否满足预设的句式; 当所述评语满足预设的句式时,根据所述评语中各个词之间的依存关系,判断所述评 语中存在二元关系的词是否满足该预设的句式的二元规则; 当所述评语中存在二元关系的两个词满足该预设的句式的二元规则时,从所述虚拟社 区的评语中提取对所述评价对象或预设的所述评价对象的属性的评价观点; 其中,所述预设的句式以及该预设的句式的二元规则包括以下任意一种: 第一种:所述预设的句式为:属性A+介词C+属性B+观点D; 所述预设的句式的二元规则包括:介词C为否定词或比较词,属性A和属性B的词性相 同,属性B依存于介词C,属性B是介词C的直接宾语,介词C依存于观点D,介词C是观点 D的介词,属性A依存于观点D,属性A是观点D的名词主语或副词状语; 第二种:所述预设的句式为:属性A+介词C+属性B+观点D+辅助结构E; 所述预设的句式的二元规则为:介词C为否定词或比较词,属性A和属性B的词性相 同,辅助结构E的词性为名词或动名词,属性B依存于介词C,属性B是介词C的直接宾语, 介词C依存于观点D,介词C是观点D的介词,属性A依存于观点D,属性A是观点D的名词 主语或副词状语,辅助结构E依存于观点D,辅助结构E是观点D的直接宾语,属性部分或副 词状语; 第三种:所述预设的句式为:属性A+观点D; 所述预设的句式的二元规则为:属性A和观点D是修饰关系; 所述修饰关系为:属性A的词性为名词、动名词或方位词,观点D的词性为形容词,观点D依存于属性A,观点D是属性A的复合名词、辅助结构、形容词修饰结构或直接宾语; 或者, 所述修饰关系为:属性A的词性为形容词,观点D的词性为名词、动名词或方位词,属性A依存于观点D,属性A是观点D的复合名词、辅助结构、形容词修饰结构或直接宾语; 第四种,所述预设的句式为:属性A+动作F+属性B+观点D; 所述预设的句式的二元规则为:属性A的词性为名词或动名词,动作F的词性为动词, 属性B的词性为名词或动名词,观点D的词性为形容词,属性A依存于动作F,属性A是动作 F的名词主语或形容词修饰结构,属性B依存于动作F,属性B是动作F的直接宾语,观点D 与所述预设句式中的任意一个词没有所述修饰关系; 第五种,所述预设的句式为:动作F+属性B+观点D; 所述预设的句式的二元规则为:动作F的词性为动词,属性B的词性为名词或动名词, 观点D的词性为形容词,属性B依存于动作F,属性B是动作F的直接宾语,观点D与所述预 设句式中的任意一个词没有所述修饰关系; 第六种,所述预设的句式为:属性A+G+观点D; 所述预设的句式的二元规则为:属性A的词性为名词或动名词,G是动词"是",观点D的词性为名词,动名词或形容词,属性A依存于G,属性A是G的名词主语或副词状语。4. 根据权利要求1-3任意一项所述的方法,其特征在于,所述方法还包括: 对所述针对评价对象的评语进行语句处理,所述语句处理包括:去掉所述评语中无意 义的符号,用逗号代替所述评语中的空格,保留重复出现的标点中的一个,以及从超过预设 阈值的所述评语中输出含有所述评价对象的短句中的任意一种或多种。5. 根据权利要求1-3任意一项所述的方法,其特征在于,所述方法还包括: 查询从所述虚拟社区的评语中提取的评价观点中是否存在第一词+第二词,所述第二 词依存于所述第一词,并且所述第二词是所述第一词的否定词; 当所述评价观点中是否存在第一词+第二词时,交换所述第二词和所述第一词的位 置。6. -种提取观点的设备,其特征在于,所述设备包括: 第一获取模块,用于从虚拟社区获取用户针对评价对象的评语; 分词模块,用于对所述评语进行分词,获得所述评语中每个词的词性; 分析模块,用于根据所述每个词的词性对所述评语进行依存分析,获得所述评语中各 个词之间的依存关系; 提取模块,用于根据所述评语中各个词之间的依存关系,从所述虚拟社区的评语中提 取用户对所述评价对象或预设的所述评价对象的属性的评价观点。7. 根据权利要求6所述的设备,其特征在于,所述设备还包括: 第二获取模块,用于根据所述评语中各个词之间的依存关系,获得与所述评价对象为 联合关系UR的词; 组合模块,用于将所述评价对象以及所述与所述评价对象为UR的词组成的短语作为 所述评价对象的属性。8. 根据权利要求6所述的设备,其特征在于,所述提取模块包括: 第一判断单元,用于判断所述评语是否满足预设的句式; 第二判断单元,用于当所述评语满足预设的句式时,根据所述评语中各个词之间的依 存关系,判断所述评语中存在二元关系的词是否满足该预设的句式的二元规则; 观点提取单元,用于当所述评语中存在二元关系的两个词满足该预设的句式的二元规 则时,从所述虚拟社区的评语中提取对所述评价对象或预设的所述评价对象的属性的评价 观点; 其中,所述预设的句式以及该预设的句式的二元规则包括以下任意一种: 第一种:所述预设的句式为:属性A+介词C+属性B+观点D; 所述预设的句式的二元规则包括:介词C为否定词或比较词,属性A和属性B的词性相 同,属性B依存于介词C,属性B是介词C的直接宾语,介词C依存于观点D,介词C是观点 D的介词,属性A依存于观点D,属性A是观点D的名词主语或副词状语; 第二种:所述预设的句式为:属性A+介词C+属性B+观点D+辅助结构E; 所述预设的句式的二元规则为:介词C为否定词或比较词,属性A和属性B的词性相 同,辅助结构E的词性为名词或动名词,属性B依存于介词C,属性B是介词C的直接宾语, 介词C依存于观点D,介词C是观点D的介词,属性A依存于观点D,属性A是观点D的名词 主语或副词状语,辅助结构E依存于观点D,辅助结构E是观点D的直接宾语,属性部分或副 词状语; 第三种:所述预设的句式为:属性A+观点D; 所述预设的句式的二元规则为:属性A和观点D是修饰关系; 所述修饰关系为:属性A的词性为名词、动名词或方位词,观点D的词性为形容词,观点D依存于属性A,观点D是属性A的复合名词、辅助结构、形容词修饰结构或直接宾语; 或者, 所述修饰关系为:属性A的词性为形容词,观点D的词性为名词、动名词或方位词,属性A依存于观点D,属性A是观点D的复合名词、辅助结构、形容词修饰结构或直接宾语; 第四种,所述预设的句式为:属性A+动作F+属性B+观点D; 所述预设的句式的二元规则为:属性A的词性为名词或动名词,动作F的词性为动词, 属性B的词性为名词或动名词,观点D的词性为形容词,属性A依存于动作F,属性A是动作 F的名词主语或形容词修饰结构,属性B依存于动作F,属性B是动作F的直接宾语,观点D 与所述预设句式中的任意一个词没有所述修饰关系; 第五种,所述预设的句式为:动作F+属性B+观点D; 所述预设的句式的二元规则为:动作F的词性为动词,属性B的词性为名词或动名词, 观点D的词性为形容词,属性B依存于动作F,属性B是动作F的直接宾语,观点D与所述预 设句式中的任意一个词没有所述修饰关系; 第六种,所述预设的句式为:属性A+G+观点D; 所述预设的句式的二元规则为:属性A的词性为名词或动名词,G是动词"是",观点D的词性为名词,动名词或形容词,属性A依存于G,属性A是G的名词主语或副词状语。9. 根据权利要求6-8任意一项所述的设备,其特征在于,所述设备还包括: 处理模块,用于对所述针对评价对象的评语进行语句处理,所述语句处理包括:去掉所 述评语中无意义的符号,用逗号代替所述评语中的空格,保留重复出现的标点中的一个,以 及从超过预设阈值的所述评语中输出含有所述评价对象的短句中的任意一种或多种。10. 根据权利要求6-8任意一项所述的设备,其特征在于,所述设备还包括: 查询模块,用于查询从所述虚拟社区的评语中提取的评价观点中是否存在第一词+第 二词,所述第二词依存于所述第一词,并且所述第二词是所述第一词的否定词; 交换模块,用于当所述评价观点中是否存在第一词+第二词时,交换所述第二词和所 述第一词的位置。
【专利摘要】本发明的实施方式提供了一种提取观点的方法。该方法包括:从虚拟社区获取用户针对评价对象的评语;对所述评语进行分词,获得所述评语中每个词的词性;根据所述每个词的词性对所述评语进行依存分析,获得所述评语中各个词之间的依存关系;根据所述评语中各个词之间的依存关系,从所述虚拟社区的评语中提取用户对所述评价对象或预设的所述评价对象的属性的评价观点。通过评语中各个词之间的依存关系提取评价观点,本发明的方法显著地提高了所提取的评价观点的正确率,使得所提取的评价观点实用性强。此外,本发明的实施方式提供了一种提取观点的设备。
【IPC分类】G06Q50/00, G06F17/27, G06F17/30
【公开号】CN105224640
【申请号】CN201510622213
【发明人】毛成军
【申请人】杭州朗和科技有限公司
【公开日】2016年1月6日
【申请日】2015年9月25日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1