文章的意见单元识别方法及其相关装置与计算机程序产品的制作方法_3

文档序号:9375565阅读:来源:国知局
一些实施例中,前述相应句法路径的特征可以包括句法路径中父节点指向子节点的方向数目,其中相应特征正规化后的特征值可以大于O。在一些实施例中,前述相应句法路径的特征可以包括句法路径中所有节点的数目,其中相应特征正规化后的特征值可以大于O。相同地,前述特征及其特征值皆为本案的例子,本案并不限定于此。任何足以依据语句结构及句法路径产生的特征皆可应用至本案中。如步骤S460,将特征值输入一意见单元识别模型,从而得到相应意见单元的识别结果。提醒的是,识别结果可以表示此意见单元是否为一正确组合或一错误组合。提醒的是,意见单元识别模型可以依据图3的方法进行训练,在此不再赘述。
[0040]在本案中,文章中语句经过字词的词性特性分析,自动化抽取文章中语句的评价对象与意见词,从而组成意见单元,并解析此文章语句的句法树中此意见单元的组成路径,接着通过自动化方式将此语句的语句结构及句法结构转换成相关特征值。最后,将特征值输入本案建立的意见单元识别模型,便可自动识别出此意见单元是否为正确的意见单元,也就是判断评价对象与意见词的搭配是否正确。举例来说,通过字词的词性特性,ΓiPhone不仅画质细腻且色彩准确」可以抽取出名词与不及物动词间的搭配作为可能的意见单元搭配。本例句包含6种意见单元可能的搭配:(iPhone,细腻)、(iPhone,准确)、(画质,细腻)、(画质,准确)、(色彩,细腻)、(色彩,准确)。以(画质,细腻)的意见单元搭配为例,通过自动化方式产生如前述的特征值,并将这些特征值输入本案的意见单元识别模型,即可产生识别结果R为1,代表(画质,细腻)的评价对象与意见词搭配,在本例句中为正确组成意见单元的搭配。
[0041]因此,通过本案的文章的意见单元识别方法及其相关装置可以对于网络文章的意见单元进行识别,从而增加从文章中选取的意见单元的正确性,并减少电子装置因相关处理而导致的系统资源浪费。
[0042]本发明的方法,或特定型态或其部分,可以以程序代码的型态存在。程序代码可以包含于实体媒体,如软盘、光盘片、硬盘、或是任何其它机器可读取(如计算机可读取)储存媒体,或者不限于外在形式的计算机程序产品,其中,当程序代码被机器,如计算机加载且执行时,此机器变成用以参与本发明的装置。程序代码也可以通过一些传送媒体,如电线或电缆、光纤、或是任何传输型态进行传送,其中,当程序代码被机器,如计算机接收、加载且执行时,此机器变成用以参与本发明的装置。当在一般用途处理单元实作时,程序代码结合处理单元提供一操作类似于应用特定逻辑电路的独特装置。
[0043]虽然在上文中已经描述了本发明的优选的实施例,然其并非用以限定本发明,本领域的技术人员在不脱离本发明的精神和范围内,可以做些许改动与修饰,因此本发明的保护范围应该以权利要求书所界定的范围为准。
【主权项】
1.一种文章的意见单元识别方法,适用于一电子装置,包括以下步骤: 取得一文章语句; 依据字词的词性特性取得该文章语句中的至少一评价对象及至少一意见词,并将该评价对象及该意见词组合成一意见单元; 将该文章语句转换为一句法树,并依据该句法树取得相应意见单元的句法路径; 依据该文章语句的语句结构及该句法路径产生多个特征的特征值; 将所述特征值输入一意见单元识别模型,从而得到相应意见单元的一识别结果,其中该识别结果表示该意见单元是否为一正确组合。2.如权利要求1所述的文章的意见单元识别方法,其中该文章语句中词性为名词的字被识别为该评价对象,且词性为不及物动词的字被识别为该意见词。3.如权利要求1所述的文章的意见单元识别方法,其中所述特征包括该文章语句的长度、该评价对象与该意见词在该文章语句中的距离、该文章语句中该评价对象之前一个词的词性、该文章语句中该评价对象之后一个词的词性、该句法路径中该意见词位于该评价对象之前或之后、该句法路径中子节点指向父节点的方向数目、该句法路径中父节点指向子节点的方向数目、或该句法路径中所有节点的数目。4.如权利要求1所述的文章的意见单元识别方法,其中该意见单元识别模型依据多个训练语句产生,其中各所述训练语句被剖析以取得该训练语句中的至少一评价对象及至少一意见词,并将该评价对象及该意见词组合成一意见单元,将该训练语句转换为一句法树,并依据该句法树取得相应意见单元的句法路径,依据该训练语句的语句结构及该句法路径产生所述特征的特征值,接收相应意见单元的该识别结果,且将相应训练语句的所述特征值及该识别结果输入一类神经网络,以训练该类神经网络从而产生该意见单元识别模型。5.如权利要求4所述的文章的意见单元识别方法,其中该识别结果表示该意见单元为一正确组合、或表示该意见单元为一错误组合。6.一种文章的意见单元识别装置,至少包括: 一储存单元,包括一文章语句、与一意见单元识别模型;以及 一处理单元,用以依据字词的词性特性取得该文章语句中的至少一评价对象及至少一意见词,并将该评价对象及该意见词组合成一意见单元,将该文章语句转换为一句法树,并依据该句法树取得相应意见单元的句法路径,依据该文章语句的语句结构及该句法路径产生多个特征的特征值,将所述特征值输入一意见单元识别模型,从而得到相应意见单元的一识别结果,其中该识别结果表示该意见单元是否为一正确组合。7.如权利要求6所述的文章的意见单元识别装置,其中该意见单元识别模型依据多个训练语句产生,其中各该等所述训练语句被剖析以取得该训练语句中的至少一评价对象及至少一意见词,并将该评价对象及该意见词组合成一意见单元,将该训练语句转换为一句法树,并依据该句法树取得相应意见单元的句法路径,依据该训练语句的语句结构及该句法路径产生所述特征的特征值,接收相应意见单元的该识别结果,且将相应训练语句的所述特征值及该识别结果输入一类神经网络,以训练该类神经网络从而产生该意见单元识别模型。8.一种文章的意见单元识别方法,适用于一电子装置,用以产生一意见单元识别模型,其中该方法包括下列步骤: 取得多个文章语句; 依据字词的词性特性取得各所述文章语句中的至少一评价对象及至少一意见词,并将该评价对象及该意见词组合成一意见单元; 将各所述文章语句转换为一句法树,并依据该句法树取得相应意见单元的句法路径; 依据各所述文章语句的语句结构及该句法路径产生多个特征的特征值; 接收相应各该意见单元的识别结果,其中该识别结果表示该意见单元是一正确组合或一错误组合; 将所述特征值及该识别结果输入一类神经网络,从而进行相应意见单元识别模型的训练作业。9.一种计算机程序产品,用以被一机器加载且执行一文章的意见单元识别方法,该计算机程序产品包括: 第一程序代码,用以依据字词的词性特性取得该文章语句中的至少一评价对象及至少一意见词,并将该评价对象及该意见词组合成一意见单元; 第二程序代码,用以将该文章语句转换为一句法树,并依据该句法树取得相应意见单元的句法路径; 第三程序代码,用以依据该文章语句的语句结构及该句法路径产生多个特征的特征值;以及 第四程序代码,用以将所述特征值输入一意见单元识别模型,从而得到相应意见单元的一识别结果,其中该识别结果表示该意见单元是否为一正确组合。10.一种计算机程序产品,用以被一机器加载且执行一文章的意见单元识别方法,用以产生一意见单元识别模型,该计算机程序产品包括: 第一程序代码,用以依据字词的词性特性取得多个文章语句中的每一个中的至少一评价对象及至少一意见词,并将该评价对象及该意见词组合成一意见单元; 第二程序代码,用以将各所述文章语句转换为一句法树,并依据该句法树取得相应意见单元的句法路径; 第三程序代码,用以依据各所述文章语句的语句结构及该句法路径产生多个特征的特征值; 第四程序代码,用以接收相应各该意见单元的识别结果,其中该识别结果表示该意见单元是一正确组合或一错误组合;以及 第五程序代码,用以将所述特征值及该识别结果输入一类神经网络,从而进行相应意见单元识别模型的训练作业。
【专利摘要】一种文章的意见单元识别方法及其相关装置。首先,依据字词的词性特性取得一文章语句中的至少一评价对象及至少一意见词,以组成一意见单元。将文章语句转换为一句法树,并依据句法树取得相应的句法路径。依据文章语句的语句结构及句法路径产生多个特征的特征值,且将特征值输入一意见单元识别模型,从而得到相应的一识别结果,以表示意见单元是否为一正确组合。
【IPC分类】G06F17/27
【公开号】CN105095177
【申请号】CN201410185087
【发明人】萧瑞祥, 曹金丰, 姜青山, 陈柏翰
【申请人】萧瑞祥, 曹金丰, 姜青山, 陈柏翰
【公开日】2015年11月25日
【申请日】2014年5月4日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1