分词处理方法及装置、电子设备与流程

文档序号:12550657阅读:118来源:国知局
分词处理方法及装置、电子设备与流程

本发明涉及自然语言处理技术领域,具体而言,涉及一种分词处理方法及装置、电子设备。



背景技术:

在汉语中,词是最小的能够独立活动的、有意义的语言成分。而在汉语中由于词与词之间不存在分隔符,词本身也缺乏明显的形态标记,因此在对中文文本进行分析时,中文分词是一项基本技术,是后续其他各项分析的基础。而由于不同的分词粒度,其表意能力不一样,因此针对不同的中文文本分析,分词粒度对分析的准确性起到了关键作用。

目前,随着电子商务的蓬勃发展,各电商平台的商品评论信息越来越多。在对评论进行分析时,同样需要进行分词,而不同的分词粒度则会影响对例如评论属性词、评论词等的分析能力。

目前的分词处理技术较依赖人工,不够智能和灵活,有些自动处理的准确度较低,难以实现预期的分词粒度。



技术实现要素:

有鉴于此,本发明提供一种分词处理方法及装置、电子设备,适用于评论信息分析,能够达到更大的分词粒度,有效提升对反映评论内容的词(例如基本属性词、评论词等)的分析能力,具备智能性和灵活性。

本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。

根据本发明的一方面,提供一种分词处理方法,包括:

在已进行分词处理后的文本中,确定反映评论内容的词;

在确定所述反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系的情况下,将所述反映评论内容的词与所述邻近所述反 映评论内容的词的词合并反映评论内容反映评论内容反映评论内容反映评论内容。

另外,本发明还提供一种分词处理装置,其包括:

词确定模块,用于在已进行分词处理后的文本中确定反映评论内容的词;

合并模块,用于在所述反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系的情况下,将所述反映评论内容的词与所述邻近所述反映评论内容的词的词合并反映评论内容反映评论内容反映评论内容反映评论内容。

此外,本发明还提供一种电子设备,包括:

处理器;以及

存储器,其上存储有可在所述处理器上运行的计算机程序;

所述处理器执行所述计算机程序以实现如上文所述的方法的步骤。

本发明还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述方法的步骤。

根据本发明实施方式的分词处理方法及装置以及电子设备,可自动确定反映评论内容的词,并在此基础上通过预定关系的校验,来自动判断是否将该词与邻近的词合并,使得进行合并处理之后的文本能够达到更大的分词粒度,具备智能性和灵活性,能够达到较高的准确度。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。

附图说明

通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。

图1是根据一示例性实施方式示出的一种分词处理方法的流程图。

图2是根据一示例性实施方式示出的一种分词处理方法的流程图。

图3是根据一示例性实施方式示出的一种分词处理方法的流程图。

图4是根据一示例性实施方式示出的一种分词处理方法的原理示意图。

图5A是根据一示例性实施方式示出的一种分词处理方法的流程图。

图5B是根据一示例性实施方式示出的一种分词处理方法的流程图。

图6A是根据一示例性实施方式示出的一种分词处理方法的流程图。

图6B是根据一示例性实施方式示出的一种分词处理方法的流程图。

图6C是根据一示例性实施方式示出的一种分词处理方法的原理示意图。

图7A是根据一示例性实施方式示出的一种分词处理方法的流程图。

图7B是根据一示例性实施方式示出的一种分词处理方法的流程图。

图7C及图7D是根据一示例性实施方式示出的一种分词处理方法的原理示意图。

图8A是根据一示例性实施方式示出的一种分词处理方法的流程图。

图8B是根据一示例性实施方式示出的一种分词处理方法的流程图。

图9是根据一示例性实施方式示出的一种分词处理装置的框图。

图10是根据一示例性实施方式示出的一种分词处理装置的框图。

图11是根据一示例性实施方式示出的一种分词处理装置的框图。

图12A是根据一示例性实施方式示出的一种分词处理装置的框图。

图12B是根据一示例性实施方式示出的一种分词处理装置的框图。

图13是根据一示例性实施方式示出的一种电子设备的框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本发明的各方面变得模糊。

图1是根据本发明实施方式示出的一种分词处理方法的流程图。在本发明实施方式中,分词处理方法可包括:

步骤S1:在已进行分词处理后的文本中,确定反映评论内容的词。

在本发明实施方式中,先提取出能反映评论内容的词。反映评论内容的词一般指评论的句子中表达最核心内容的词。以外卖平台的用户评论内容为例,某用户的评论为“外卖的配送速度值得信赖”,其中反映评论内容的词可以是“速度”、“信赖”,因为“速度”是评论的主体,“信赖”是用户的核心观点。而“外卖”、“配送”都是修饰“速度”的,“值得”只是作为能愿动词与“依赖”构成词组的,都不能反映评论内容的核心内容。对于一家外卖平台,其用户评论会呈现一定的统计规律性,例如“速度”、“环境”、“态度”、“服务”等评论主体出现的频率较高,因此反映评论内容的词可以是一个预定的集,用于在某个已进行分词处理后的文本中确定反映评论内容的词。当然,确定反映评论内容的词的方法并不局限于此。

步骤S3:在确定反映评论内容的词与邻近该反映评论内容的词的词之间满足预定关系的情况下,将反映评论内容的词与邻近该反映评论内容的词的词合并。

在本发明实施方式中,提取出能反映评论内容的词之后,如果检测该词与邻近的词的关系满足预定关系,例如满足语法关系、词性搭配关系等,则可以进行合并处理,即相较于合并前形成更大分词粒度的文本。如此,可提升机机器或系统的智能化处理水平及处理的灵活度,且提升合并的准确度。

“分词粒度”是一个计算语言学术语,即一个中文词包含汉字的个数,例如“速度”的分词粒度为2,“配送速度”的分词粒度为4。可以理解,以某词为基础,随着合并及分词粒度的增大,其表达的含义也更加确切,有助于对评论内容进行进一步分析及处理。

图2是根据本发明实施方式示出的另一种分词处理方法的流程图。该方法与图1所示的方法相比还包括判断步骤S2。具体如下:

在步骤S1中,确定反映评论内容的词。

在步骤S2中,确定反映评论内容的词与邻近所述反映评论内容的词的词之间是否满足预定关系。

如果在步骤S2中确定反映评论内容的词与邻近反映评论内容的词的词之间满足预定关系,则执行步骤S3。如果在步骤S2中确定反映评论内容的词与邻近反映评论内容的词的词之间不满足预定关系,则说明反映评论内容的词语邻近反映评论内容的词的词不适合合并,因而可以不进行合并操作。

在步骤S3中,将反映评论内容的词与邻近反映评论内容的词的词合并。

请参阅图3及图4,在某些实施方式中,在步骤S1之前可以先对文本进行分词处理,分词处理的步骤可包括:

步骤S5,对文本进行切词。通过切词可以将文本分割为相较于切词前粒度更小的多个小粒度词。

步骤S6,对切词后的文本中的词进行词性标注以及依存句法标注。例如,可以对进行切词处理后得到的多个小粒度词进行词性标注以及依存句法标注。

请参阅图4,首先可以对文本进行分割,即形成最基本单元的小粒度词,然后对其进行词性标注及依存句法标注。词性标注及依存句法标注 是后续处理的基础。例如步骤S2中的校验,可包括校验是否满足预定句法依存关系和/或是否满足预定词性模式,该步骤就是以词性标注及依存句法标注为基础和前提的。例如,对于文本中的一个评论“配送速度令人赞叹”,“配送”与“速度”构成修饰关系(ATT),“配送”为动词(v),“速度”为名词(n),这些都进行标注。除了修饰关系外,还有可以由兼语(DBL)关系、动宾关系(VOB)等,词性标注也可包括除名词、动词外的其他词性,在此不一一列举。关于词性标注及依存句法标注,本领域技术人员可以依据相关的自然语言处理技术实现,本申请对此没有特殊限制。

在某些实施方式中,步骤S2中邻近反映评论内容的词的词可包括与反映评论内容的词相邻的词。

“相邻”可以是“邻近”的一种基本情况,也是一种常见的情况。以用户评论“外卖的配送速度值得信赖”为例,与“速度”相邻的词可包括“配送”、“值得”,即前相邻与后相邻两种情况。其中,可以预设“相邻”是前相邻还是后相邻,例如预设为前相邻,即将“速度”作为后缀,与“配送”相搭配。以下以描述“相邻”的情况为主,然而本发明的“邻近”并不局限于“相邻”这一种情况。在有的情况下,反映评论内容的词与其邻近的词之间可能存在一些虚词,例如,句子“外卖的配送的速度值得信赖”中,“配送”和“速度”之间存在“的”,“的”是一种助词,属于虚词的一种,在这种情况下,可以先检测及剔除类似“的”、“之”、“啊”、“呢”等虚词,再进行后续步骤。

参阅图5A,在某些实施方式中,步骤S2中满足预定关系可包括符合预定句法依存关系。具体而言,步骤S2可包括:

S201,确定反映评论内容的词与反映评论内容的词相邻的词之间是否满足预定句法依存关系。若满足,则可以判定满足预定关系,继续执行步骤S3。

也就是说,判断反映评论内容的词与其相邻的词是否满足预定句法依存关系,若满足,则可以执行合并处理。

依存句法是由法国语言学家L.Tesniere最先提出。它将句子分析成一棵依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间 在句法上的搭配关系,这种搭配关系是和语义相关联的。

采用对预定句法依存关系的分析,可将具有预定搭配关系的词进行合并,这种识别与合并较为灵活和智能化。例如,确定了反映评论内容的词“速度”,然而可与速度搭配的词很多,像配送速度、送餐速度、制作速度、服务速度等等,用户会根据自己的语言习惯采用不同的与速度搭配的词,因此,与“速度”搭配的词是一个开放的集。然而,与“速度”的搭配具有一定的规律,例如,都满足修饰关系(ATT)。因此,本实施方式的思路是通过把握该规律来识别或筛选得到合适的搭配,只要满足预定的句法依存关系即可,而不管与“速度”搭配的具体是什么词。如此,使本申请的方法具有较好的智能化水平和灵活度,可得到良好的合并结果。

进一步地,请参阅图5B,在某些实施方式中,步骤S2中满足预定关系还可包括符合预定词性模式。即步骤S2还可包括:

S202,确定反映评论内容的词与反映评论内容的词相邻的词之间是否满足预定词性模式。

结合S201,若反映评论内容的词与与反映评论内容的词相邻的词之间同时满足预定句法依存关系及预定词性模式,即判定为满足预定关系。

若步骤S201的判断结果为否,则可以确定反映评论内容的词与反映评论内容的词相邻的词之间不满足预定关系,因此可以不进行合并处理。

进一步而言,若步骤S202的判断结果为否,则可以确定反映评论内容的词与反映评论内容的词相邻的词之间不满足预定关系,因此可以不进行合并处理。

在利用句法依存关系进行识别、筛选的基础上,可同时用词性模式进一步进行识别和筛选,即,必须同时满足预定句法依存关系和预定词性模式才能通过校验。如此,预定词性模式相当于一个进一步的校验手段,能进一步提升识别及筛选的准确度。

在图5B中,进行了步骤S201的判断之后继续进行步骤S202的判断,是一种双重判断方式,能够提高粒度定制的准确度。在一个实施例中,也可以只进行步骤S202的判断,而不进行步骤S201的判断。也就是说,本申请中是否符合预定关系的判断可以包括是否符合预定句法依存关系 的判断和/或是否符合预定词性模式的判断。

关于句法依存关系的校验及词性模式的校验,以下会有更详细的示例性说明。

在某些实施方式中,步骤S1中确定反映评论内容的词可包括确定反映评论内容的基本属性词。基本属性词,可以指评论的对象,例如,对于文本“外卖的配送速度值得信赖”而言,“速度”就是基本属性词,文本“大堂环境非常干净”而言,“环境”就是基本属性词。以下将针对基本属性词进行关于句法依存关系验证的详细说明。

请参阅图6A,在该实施例中,满足预定关系可包括符合预定句法依存关系;基本属性词对应的预定句法依存关系可包括:基本属性词与位于基本属性词之前且相邻的词具有修饰关系。

即步骤S201可实现为:

步骤S201a,确定基本属性词与位于基本属性词之前且相邻的词是否满足具有修饰关系。若满足,则在步骤S2中判定为满足。

例如,请参阅图6C,文本为“AA外卖的配送速度真是值得肯定”,其中AA可以是某外卖品牌名。首先进行分词处理,并确定反映评论内容的基本属性词“速度”。然后,确定“速度”与前相邻的词是否满足修饰关系(ATT),而不用管这个前相邻的词具体是什么词。例如,“配送速度”、“送餐速度”、“外卖速度”、“骑手速度”等,均满足该修饰关系的条件(图6C中的示例为“配送速度”),即通过校验,可进行合并。合并形成的词组或短语能表达更确切的含义,从而方便后续处理。

请参阅图6B,在该实施例中,基本属性词对应的词性模式可包括:位于基本属性词之前且相邻的词,与基本属性词构成动词加修饰名词模式或名词加修饰名词模式。

即,S202可实现为:

步骤S202a,确定基本属性词与位于基本属性词之前且相邻的词是否具有预定词性模式,其中预定词性模式可包括动词加名词模式或名词加名词模式。若步骤S201a及步骤S202a的判断结果均为满足,则可以确定反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系。

参阅图6C,也就是说,在同时满足修饰关系及预定词性模式的情况下可以确定反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系。可以理解,动词加名词模式指作为后缀的基本属性词为名词,且基本属性词之前的词为动词。例如,“配送”、“送餐”均为动词,“配送速度”、“送餐速度”即满足该动词加名词模式。而名词加名词模式即作为后缀的基本属性词为名词,且基本属性词之前的词为名词。例如,“外卖”、“骑手”为名词,“外卖速度”、“骑手速度”即满足该名词加名词模式。上述两个模式满足其一即可,再同时满足修饰关系的条件,即通过校验,可进行步骤S3的合并。图6C示例为“配送速度”,满足动词加名词模式,因此通过校验。当然,本实施方式中的动词加名词模式或名词加名词模式仅是示例性的,本发明中提到的预定词性模式并不局限于上述两种词性校验模式。

在判断某词的词性时,可采用与预定词库相比对的方法。例如,预设动词词库,该动词词库中录入有评价内容中常见的动词,例如“配送”、“送餐”、“服务”等,将待判断的词与该动词词库的词相比对,若待判断的词属于该动词词库,即可判定该待判断的词为动词。

此外,可预设词性更为具体的词库,例如能愿动词词库,该能愿动词词库中录入有评价内容中常见的能愿动词,例如“令人”、“有待”等,将待判断的词与该能愿动词词库的词相比对,若待判断的词属于该能愿动词词库,即可判定该待判断的词为能愿动词。如此,可对待判断的词的词性进行更为细致的判断。由于评价内容中常见的能愿动词是有限的,因此采用与预定词库相比对是一种方便、适宜的判断词性的方法。

当然,与预定词库相比对以判断词性的方法并不局限于应用于上述例子中的动词、能愿动词,还可应用于名词、兼语名词、使令动词等。

经过修饰关系及词性模式的双重校验,可得到更准确或更符合预期的合并结果。

反映评论内容的词除了基本属性词之外,在某些实施方式中,还可以是反映用户观点的评价词。评价词,即体现用户好恶观点的词,例如,经分词处理的文本“AA外卖的配送速度真是值得肯定”中,可确定“肯定”为评价词。以下将针对评价词进行关于句法依存关系验证的详细说 明。

请参阅图7A,在该实施例中,确定反映评论内容的词包括:确定反映用户观点的评价词。评价词对应的预定句法依存关系可包括:评价词与位于评价词之前且相邻的词具有动宾结构关系或兼语加动宾关系。

即步骤S201可实现为:

步骤S201b,确定基本属性词与位于基本属性词之前且相邻的词是否满足具有动宾结构关系或兼语加动宾关系。若满足,则可以确定反映评论内容的词与邻近所述反映评论内容的词的词之间满足预定关系。

例如,请参阅图7C和图7D,文本为“AA外卖的配送速度真是值得肯定”,首先进行了分词处理,并确定反映评论内容的评价词“肯定”。然后,确定“肯定”与前相邻的词是否满足动宾结构(VOB)关系或兼语(DBL)加动宾(VOB)关系。例如,“值得肯定”满足动宾结构关系,即通过校验。又如,请参阅图7D,“令人赞叹”满足兼语加动宾关系,即通过校验。通过校验后可进行步骤S3的合并。合并形成的词组或短语能表达更确切的含义,从而方便后续处理。

进一步的,步骤S2中满足预定关系还可包括符合预定词性模式。在该实施例中,步骤S202可包括步骤S202b和步骤S202c。

在步骤S202b中,若评价词与位于评价词之前且相邻的词具有动宾结构关系,判断词性模式是否满足位于评价词之前且相邻的词与评价词构成能愿动词加动词模式,若是,判定满足预定关系。

在步骤S202c中,若评价词与位于评价词之前且相邻的词具有兼语加动宾关系,判断词性模式是否满足位于评价词之前且相邻的词与评价词构成使令动词加兼语名词加动词模式,若是,判定满足预定关系。

请一并参阅图7C,也就是说,步骤S201b中的不同句法依存关系对应相应的词性模式。例如,“值得肯定”满足动宾结构关系,同时,“值得”为能愿动词(v),“肯定”为动词(v),因此“值得肯定”也构成能愿动词加动词模式,如此,两个条件都能满足,因此,判定“值得肯定”满足预定关系,即通过校验。又如,请参阅图7D,“令人赞叹”满足兼语加动宾关系,同时,“令”为使令动词(v),“人”为兼语名词(n),“赞叹”为动词(v),因此,“令人赞叹”也满足使令动词加兼语名词加 动词模式,两个条件均满足,因此,判定“令人赞叹”满足预定关系,即通过校验。当然,本实施方式中的能愿动词加动词模式或使令动词加兼语名词加动词模式仅是示例性的,本发明中提到的针对评价词的预定词性模式并不局限于上述两种词性校验模式。

其中,区分动词与能愿动词的方法可参照上述与预定词库相比对的方法。例如预设能愿动词词库,录入常见的能愿动词,用于判断待判断的词是否是能愿动词。在此不再赘述。

此外,本发明的反映评论内容的词并不局限于基本属性词或评价词,基本属性词的预定关系也并不局限于句法依存关系或预定词性模式。

请参阅图8A,步骤S1中反映评论内容的词的确定,可通过以下方式。在某些实施方式中,步骤S1中确定反映评论内容的词可包括:

步骤S103,建立评价词库;

步骤S104,将文本中的词与评价词库中的词相比对以确定文本中的词是否为反映评论内容的词。

对于某一外卖平台,用户关注的内容及用户的评论对象会呈现一定的统计规律,例如,“速度”、“环境”、“服务”等属于常见的及有参考价值的基本属性词,而“信赖”、“赞叹”、“肯定”、“不错”等属于常见及有参考价值的评价词。因此,可建立评价词库预先将这些容易出现且有参考价值的词录入,分析某一具体文本时,将文本中的词与评价词库中的词相比对以确定文本中的词是否为反映评论内容的词。

如此,可再结合句法依存关系或词性分析等,最终确定反映评论内容的词,因为,若仅仅满足属于词库,并不一定满足属于评价句子中的评论对象或评价内容,也有可能是用户随意发表的一些无关内容。因此,可结合词库及对句子的分析,综合做出判断某词是否是反映评论内容的词。

词库的建立可参考以下两种方式,然而本发明并不局限于以下两种方式。

第一种方式是人工建立,即根据人工输入建立评价词库。例如人工对过往的用户评论进行统计分析,选出常见及有参考价值的词纳入评价词库。

另一种方式为系统自动建立及自动完善。请参阅图8B,在某些实施方式中,步骤S103中建立评价词库可包括:

步骤S1031,统计多个文本中各词的出现次数或频率;

步骤S1032,在次数或频率大于预定值时将该词纳入评价词库。

系统可统计过去评论文本中出现的各词的频率,筛选出现次数或频率较高的词作为目标评价属性词或目标评价词并录入对应的词库。例如,系统检测到词性为名词的词中,“速度”出现的频率高于预定频率,即将“速度”录入目标评价属性词的词库。

上述两种方式也可结合运用,例如先人工建立,再自动完善。又如建立后既可人工完善也可自动完善,例如,以系统自动识别录入为主,但人工可进行修改,例如删除系统误识别的,和/或增加系统未识别到反映评论内容的词。

应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施方式。

本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。

此外,需要注意的是,上述附图仅是根据本发明示例性实施方式的方法所可包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。

请参阅图9,本发明提供一种分词处理装置100,其可包括:

词确定模块110,用于在已进行分词处理后的文本中确定反映评论内容的词。

合并模块120,用于在确定反映评论内容的词与邻近反映评论内容的词的词之间满足预定关系的情况下,将反映评论内容的词与邻近所述 反映评论内容的词的词合并。

请参见图10,该装置还可以删除模块130。该删除模块130可以再反映评论内容的词与邻近所述反映评论内容的词的词之间存在虚词的情况下删除虚词。

请参阅图11,在某些实施方式中,分词处理装置100还可包括:

分割模块150,用于对文本进行切词。

标注模块160,用于对切词后的文本中的词进行词性标注以及依存句法标注。

其中,分割模块150可用于实现步骤S5,标注模块160可用于实现步骤S6。

在某些实施方式中,邻近反映评论内容的词的词可包括与反映评论内容的词相邻的词。

进一步地,在某些实施方式中,满足预定关系包括符合预定句法依存关系和/或预定词性模式。

在一个实施例中,确定反映评论内容的词可包括:确定反映评论内容的基本属性词,基本属性词对应的所述预定句法依存关系包括:基本属性词与位于基本属性词之前且相邻的词具有修饰关系。基本属性词对应的预定词性模式可包括:所述位于所述基本属性词之前且相邻的词与所述基本属性词构成动词加名词模式或名词加名词模式。

在一个实施例中,所述确定反映评论内容的词可包括:确定反映用户观点的评价词。评价词对应的所述预定句法依存关系可包括:评价词与位于评价词之前且相邻的词具有动宾结构关系或兼语加动宾关系。评价词对应的词性模式可包括:位于评价词之前且相邻的词与评价词构成能愿动词加动词模式;或者位于所述评价词之前且相邻的词与评价词构成使令动词加兼语名词加动词模式。

请参阅图12A,在某些实施方式中,词确定模块110可包括:

词库建立单元111,用于建立评价词库;

比对单元113,用于将文本中的词与评价词库中的词相比对以确定文本中的词是否为反映评论内容的词。

进一步地,在某些实施方式中,词库建立单元111用于根据人工输 入建立评价词库。

请参阅图12B,在另一些实施方式中,词库建立单元111可包括:

统计子单元1111,用于统计多个文本中各词的出现次数或频率;及

入库子单元1113,用于在次数或频率大于预定值时将该词纳入评价词库。

请参阅图13,本申请提供一种电子设备1300,该电子设备可以包括存储器1301和处理器1302。存储器1301上存储有可在处理器1302上运行的计算机程序。处理器1302执行计算机程序可以实现本文描述的方法。

存储器1301可以是各种由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

该电子设备1300可以是具备计算和处理能力的各种设备,除了存储器1301和处理器1302之外,还可以包括各种输入设备(例如用户界面、键盘等)、各种输出设备(例如扬声器等)、以及显示设备,本文在此不再赘述。

本申请还提供一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器1302执行时实现本文描述的方法。

需要注意的是,上述附图中所示的框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等) 执行根据本发明实施方式的方法。

以上具体地示出和描述了本发明的示例性实施方式。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1