一种文章评估方法及系统与流程

文档序号:15981730发布日期:2018-11-17 00:24阅读:253来源:国知局

本发明涉及文章处理技术领域,尤其涉及一种文章评估方法及系统。

背景技术

机器人是靠自身动力和控制能力来实现各种功能的一种机器,它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。智能机器人则是一个在感知-思维-效应方面全面模拟人的机器系统。一个智能机器人应该具备三方面的能力:感知环境的能力、执行某种任务而对环境施加影响的能力和感知与行动联系起来的能力。并且成熟的机器人应该有能力学习人类的意识,当前的机器人能够识别听清楚语言,甚至自己能够说话,这和真正理解语言的意思还有些差距,对于机器人的理解力方面,目前利用行业上比较成熟的语音识别和语音合成技术,包括自然语言理解技术,多语言翻译技术,统一问题分类技术,多维特征的情绪分析识别技术,云计算技术等,构建了机器人智能问答系统的服务。

随着信息距离理论与神经网络的发展,进一步推进了自然语言理解的发展,但是传统的文字处理技术只局限于认知类的简单工作,而阅读文章,对文章进行分类,以及根据文章的结构和逻辑、措辞给出文章的质量评估等方面,现有的学习系统还无法做到。



技术实现要素:

针对上述问题,本发明提出了一种文章评估方法,应用于一文章处理系统中;其中,所述文章处理系统包括一近义词库和一文章训练模型库,所述近义词库中的近义词之间具有采用一语义距离模型计算得到的语义距离值,所述文章训练模型库中存储有文章训练模型;

所述文章评估方法包括:

步骤s1,采集一待处理文章;

步骤s2,提取所述待处理文章中无法识别的词语作为关键词;

步骤s3,在所述近义词库中分别查找与每个无法识别的所述关键词的所述语义距离值最小的所述近义词,并采用所述语义距离值最小的所述近义词替换对应的所述关键词,生成一可处理文章;

步骤s4,将所述可处理文章放入所述文章训练模型库中的所述文章训练模型中进行处理,并根据处理结果确定所述可处理文章的评估结果。

上述的文章评估方法,其中,所述文章处理系统还包括一词典库;

所述步骤s2中:将所述待处理文章中未包括在所述词典库中的词语定义为无法识别的所述关键词。

上述的文章评估方法,其中,所述文章处理系统还包括一上下位名词库;

在执行所述步骤s1之后,还包括下述步骤:

步骤a1,于所述待处理文章中提取可识别的名词;

步骤a2,根据能够识别的名词所在的句子的句法结构,判断所述句法结构下的名词是否下属于同一个上位名词;

步骤a3,根据所述步骤a2中的判断结果得到一个初步评价结果,再转向所述步骤s4;

所述步骤s4中,将所述初步评价结果和所述处理结果整合形成所述可处理文章的所述评估结果。

上述的文章评估方法,其中,所述步骤s2中,采用一条件信息距离模型划分所述待处理文章中的词语;

所述条件信息距离模型采用下述公式进行条件信息计算:

式中,x为一第一词语,y为一第二词语,c为一条件词语,函数f(x,y,c)表示词语组合(x,y,c)在一预设数据集中的命中数函数,函数f(x,c)表示词语组合(x,c)在所述预设数据集中的命中数函数,函数f(y,c)表示词语组合(y,c)在所述预设数据集中的命中数函数,函数f(c)表示词语c在所述预设模数据集中的命中数函数。

上述的文章评估方法,其中,所述所述文章训练模型有多个;所述步骤s4具体为:

步骤s41,对所述可处理文章进行分类;

步骤s42,根据所述可处理文章的分类将所述可处理文章与所述文章训练模型库中对应的所述文章训练模型相匹配,并根据匹配的结果确定所述可处理文章的评估结果。

上述的文章评估方法,其中,每个所述文章训练模型分别具有一记忆网络,每个所述记忆网络分别包括多个参数,所述记忆网络的参数是所述记忆网络的隐藏层间的神经元之间的联接参数。

上述的文章评估方法,其中,所述步骤s4还包括:

步骤s43,对所述评估结果的准确性进行反馈;

步骤s44,根据反馈的结果对所述联接参数进行优化,形成优化后的所述文章训练模型。

上述的文章评估方法,其中,所述步骤s4还包括:

步骤s45,将所述可处理文章与优化后的所述文章训练模型相匹配,并根据匹配的结果确定所述可处理文章的优化后的评估结果。

上述的文章评估方法,其中,还包括:

步骤s5,将所述可处理文章的所述评估结果输出以进行显示。

一种文章评估系统,其中,包括一近义词库和一文章训练模型库,所述近义词库中的近义词之间具有采用一语义距离模型计算得到的语义距离值,所述文章训练模型库中存储有文章训练模型;还包括:

采集模块,用于采集待处理文章;

预处理模块,与所述采集模块连接,用于提取所述待处理文章中无法识别的词语作为关键词,并在所述近义词库中分别查找与每个无法识别的所述关键词的所述语义距离值最小的所述近义词,并采用所述语义距离值最小的所述近义词替换对应的所述关键词,以生成一可处理文章;

处理模块,与所述预处理模块连接,用于将所述可处理文章放入所述文章训练模型库中的所述文章训练模型中进行处理,并根据处理结果确定所述可处理文章的评估结果。

有益效果:本发明提出的一种文章评估方法,能够对复杂的文章进行评估,是可靠性高的文章处理和评估方法。

附图说明

图1为本发明一实施例中文章评估方法的步骤流程图;

图2为本发明一实施例中文章评估系统的结构示意图。

具体实施方式

下面结合附图和实施例对本发明进行进一步说明。

实施例一

在一个较佳的实施例中,如图1所示,提出了一种文章评估方法,可以应用于一文章处理系统中;其中,文章处理系统可以包括一近义词库和一文章训练模型库,近义词库中的近义词之间具有采用一语义距离模型计算得到的语义距离值,文章训练模型库中存储有多个文章训练模型;

文章评估方法可以包括:

步骤s1,采集一待处理文章;

步骤s2,提取待处理文章中无法识别的词语作为关键词;

步骤s3,在近义词库中分别查找与每个无法识别的关键词的语义距离值最小的近义词,并采用语义距离值最小的近义词替换对应的关键词,生成一可处理文章;

步骤s4,将可处理文章放入文章训练模型库中的文章训练模型中进行处理,并根据处理结果确定可处理文章的评估结果。

上述技术方案中,近义词库、文章训练模型库及语义距离模型可以是存储在一存储模块中的;关键词的词性不作限定,可以是形容词或名词等;一般来说,词性相同的词语之间能够计算语义距离值,从而避免词性不同的词语被相互替换;当语义距离值最小的近义词存在多个时,可以采用一预设策略选择该语义距离值最小的多个近义词中用于替换的近义词,例如可以是采用随机选择的策略;步骤s4中,将可处理文章与文章训练模型库中对应的文章训练模型相匹配属于现有的技术,具体内容在下面的实施例中进行展开。

在一个较佳的实施例中,文章处理系统还包括一词典库;

步骤s2中:将待处理文章中未包括在词典库中的词语定义为无法识别的关键词,但这只是一种优选的情况,不应视为是对本发明的限制。

在一个较佳的实施例中,在执行步骤s1之后,还包括下述步骤:

步骤a1,于待处理文章中提取可识别的名词;

步骤a2,根据能够识别的名词所在的句子的句法结构,判断句法结构下的名词是否下属于同一个上位名词;

步骤a3,根据步骤a2中的判断结果得到一个初步评价结果,再转向步骤s4;

步骤s4中,将初步评价结果和处理结果整合形成可处理文章的评估结果。

上述技术方案中,确定语义关系可以作为计算语义距离的前提,也可以作为名词准确性的评判标准之一;举例来说,hyponym(a,b)表示概念b和a是上下位的关系,synonym(a,b)表示概念a和b的同义关系。例如一句话“院子西边有一个种满蔬菜的小菜园,有西红柿、茄子、辣椒等”可以根据规则提取出如下的上下位关系:

hyponym(西红柿,蔬菜)

hyponym(茄子,蔬菜)

hyponym(辣椒,蔬菜)

以及如下的同义关系:

synonym(西红柿,茄子)

synonym(西红柿,辣椒)

synonym(茄子,辣椒)

在一个较佳的实施例中,步骤s2中,采用一条件信息距离模型划分待处理文章中的词语;

条件信息距离模型可以采用下述公式进行条件信息计算:

式中,x为一第一词语,y为一第二词语,c为一条件词语,函数f(x,y,c)表示词语组合(x,y,c)在一预设数据集中的命中数函数,函数f(x,c)表示词语组合(x,c)在所述预设数据集中的命中数函数,函数f(y,c)表示词语组合(y,c)在所述预设数据集中的命中数函数,函数f(c)表示词语c在所述预设模数据集中的命中数函数。

例如,可以将颜色词(红色,绿色等)与数字词(一个,两个等)区分开来;以及稍复杂的,将不同的食物根据种类进行自动聚类等。条件信息距离以不同的单词作为条件时,单词之间通过条件信息距离所体现的远近关系也不同,例如“长城”,“烤鸭”在“北京”条件下的远近关系和在“名胜古迹”条件下的远近关系是不一样的。

在一个较佳的实施例中,文章训练模型可以有多个;步骤s4具体为:

步骤s41,对可处理文章进行分类;

步骤s42,根据可处理文章的分类将可处理文章与文章训练模型库中对应的文章训练模型相匹配,并根据匹配的结果确定可处理文章的评估结果。

上述实施例中,优选地,每个文章训练模型分别具有一记忆网络,每个记忆网络分别包括多个参数,所述记忆网络的参数是所述记忆网络的隐藏层间的神经元之间的联接参数。例如第l层隐藏层的第i个神经元到到第l+1层隐藏层的第j个神经元的联接参数为每个参数分别具有相关的值。

上述实施例中,优选地,步骤s4还包括:

步骤s43,对评估结果的准确性进行反馈;

步骤s44,根据反馈的结果对联接参数进行优化,形成优化后的文章训练模型。

上述实施例中,优选地,步骤s4还包括:

步骤s45,将可处理文章与优化后的文章训练模型相匹配,并根据匹配的结果确定可处理文章的优化后的评估结果。

在一个较佳的实施例中,还可以包括:

步骤s5,将可处理文章的评估结果输出以进行显示。

实施例二

还提出了一种文章评估系统,如图2所示,其中,可以包括一近义词库和一文章训练模型库,近义词库中的近义词之间具有采用一语义距离模型计算得到的语义距离值,文章训练模型库中存储有文章训练模型;还包括:

采集模块1,用于采集待处理文章;

预处理模块2,与采集模块连接,用于提取待处理文章中无法识别的词语作为关键词,并在近义词库中分别查找与每个无法识别的关键词的语义距离值最小的近义词,并采用语义距离值最小的近义词替换对应的关键词,以生成一可处理文章;

处理模块3,与预处理模块2连接,用于将可处理文章放入文章训练模型库中的文章训练模型中进行处理,并根据处理结果确定可处理文章的评估结果。

上述技术方案中,还可以包括一存储模块4,该存储模块4可以分别与预处理模块2和处理模块3连接,用于存储近义词库、文章训练模型库以及语义距离模型。

通过说明和附图,给出了具体实施方式的特定结构的典型实施例,基于本发明精神,还可作其他的转换。尽管上述发明提出了现有的较佳实施例,然而,这些内容并不作为局限。

对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1