自然语言处理方法、装置、计算机设备和存储介质与流程

文档序号:16881390发布日期:2019-02-15 22:11阅读:179来源:国知局
自然语言处理方法、装置、计算机设备和存储介质与流程

本申请涉及计算机技术领域,特别是涉及一种自然语言处理方法、装置、计算机设备和存储介质。



背景技术:

随着计算机技术的发展,出现了计算机自然语言生成,计算机自然语言生成属于人工智能模式识别领域的工作,目前的很多工作是基于关键词匹配的模式,基于庞大的现实世界语料环境库,从中匹配已有的语言句子。

然而,目前的匹配方式是基于关键词的匹配,由于基于关键词匹配依赖于关键词的提取精确程度,因此当提取精确程度低时,则会造成匹配错误率较高的情况。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高匹配率的自然语言处理方法、装置、计算机设备和存储介质。

一种自然语言处理方法,所述方法包括:

接收输入的自然语言,通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树;

提取所述自然语言依存树中的骨干结构;

判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则识别所述特殊疑问词的类型;

将所提取的骨干结构与第一标准句子进行匹配,所述第一标准句子存储在所述知识库中,并与所述特殊疑问词的类型对应;

当匹配成功时,则提取所述第一标准句子中与所述特殊疑问词对应的部分,并将所提取的部分替换所述自然语言中的特殊疑问词后,输出替换后的自然语言。

在其中一个实施例中,所述方法还包括:

当所提取的骨干结构中不存在特殊疑问词时,则判断所述骨干结构中是否存在一般疑问词;

当所述骨干结构中存在一般疑问词时,则将所述一般疑问词转换为肯定词,并将转换后的骨干结构与所述知识库中的第二标准句子进行匹配;

当匹配成功时,则将所述自然语言中的一般疑问词转换为肯定词后,输出转换后的自然语言;

当匹配失败时,则将所述自然语言中的一般疑问词转换为否定词后,输出转换后的自然语言。

在其中一个实施例中,所述方法还包括:

当所述骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将所述骨干结构存储至所述知识库中。

在其中一个实施例中,所述将转换后的骨干结构与知识库中的第二标准句子进行匹配的步骤,包括:

将转换后的骨干结构与知识库中的第二标准句子进行模糊匹配;

当转换后的骨干结构与知识库中的第二标准句子模糊匹配失败时,接收针对转换后的骨干结构的第一映射指令;

根据所述第一映射指令建立转换后的骨干结构与第一目标句子的匹配关系,并将所述第一目标句子存储至所述知识库中。

在其中一个实施例中,所述将所提取的骨干结构与第一标准句子进行匹配的步骤,包括:

将所提取的骨干结构与第一标准句子进行模糊匹配;

当所提取的骨干结构与所述第一标准句子模糊匹配失败时,接收针对所提取的骨干结构的第二映射指令;

根据所述第二映射指令建立所提取的骨干结构与第二目标句子的匹配关系,并将所述第二目标句子存储至所述知识库中。

在其中一个实施例中,所述骨干结构包括主谓宾结构、谓宾结构以及介宾结构中的至少一种。

一种自然语言处理装置,所述装置包括:

接收模块,用于接收输入的自然语言,通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树;

提取模块,用于提取所述自然语言依存树中的骨干结构;

第一判断模块,用于判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则识别所述特殊疑问词的类型;

第一匹配模块,用于将所提取的骨干结构与第一标准句子进行匹配,所述第一标准句子存储在所述知识库中,并与所述特殊疑问词的类型对应;

输出模块,用于当匹配成功时,则提取所述第一标准句子中与所述特殊疑问词对应的部分,并将所提取的部分替换所述自然语言中的特殊疑问词后,输出替换后的自然语言。

在其中一个实施例中,所述装置还包括:

第二判断模块,用于当所提取的骨干结构中不存在特殊疑问词时,则判断所述骨干结构中是否存在一般疑问词;

第二匹配模块,用于当所述骨干结构中存在一般疑问词时,则将所述一般疑问词转换为肯定词,并将转换后的骨干结构与所述知识库中的第二标准句子进行匹配;

所述输出模块还用于当匹配成功时,则将所述自然语言中的一般疑问词转换为肯定词后,输出转换后的自然语言;当匹配失败时,则将所述自然语言中的一般疑问词转换为否定词后,输出转换后的自然语言。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

上述自然语言处理方法、装置、计算机设备和存储介质,对所接收的的自然语言通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树,并根据该自然语言依存树得到骨干结构,通过提取句子骨干结构,去除掉无用信息;并根据特殊疑问词来判断句型,然后根据句型来查询相应的知识库,并通过知识库中第一标准句子的相应部分替换该特殊疑问词,并未改变句子的结构,使得智能问答中的答案与问题逻辑相关,提高了回答的准确性。

附图说明

图1为一个实施例中自然语言处理方法的应用场景图;

图2为一个实施例中自然语言处理方法的流程示意图;

图3为一个实施例中自然语言解析库的加载示意图;

图4为一实施例中的自然语言依存树的结构示意图;

图5为另一个实施例中自然语言处理方法的流程示意图;

图6为一个实施例中自然语言处理装置的结构框图;

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的自然语言处理方法,可以应用于如图1所示的应用环境中。其中,用户可以通过语音、触摸输入、键盘输入、遥控输入等任一方式与终端进行交互。具体地,用户可以说出一自然语言,终端接收该自然语言,并通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树,提取自然语言依存树中的骨干结构,从而可以减少处理量,且保留了关键内容,判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则获取特殊疑问词的类型;将所提取的骨干结构与知识库中特殊疑问词的类型对应的第一标准句子进行匹配;当匹配成功时,则提取第一标准句子中与特殊疑问词对应的部分,并将所提取的部分替换自然语言中的特殊疑问词后,输出替换后的自然语言,从而终端可以针对用户输入的自然语言作出回应,通过知识库中第一标准句子的相应部分替换该特殊疑问词,并未改变句子的结构,使得智能问答中的答案与问题逻辑相关,提高了回答的准确性。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。

在一个实施例中,如图2所示,提供了一种自然语言处理方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

s202:接收输入的自然语言,通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树。

具体地,接收输入的自然语言可以是通过语音、触摸输入、键盘输入、遥控输入等任一方式进行的;例如当终端安装有语音识别设备时,则可以接收到用户说出的自然语言,并识别该自然语言作为语音输入;也可以是用户通过终端提供的触摸屏、键盘、遥控器等进行输入。

具体地,预设的自然语言解析库可是stanford大学的自然语言解析库。其中参见图3,可以预先将stanford大学的自然语言解析库加载在终端或者是主控设备中,包括首先创建自然语言解析器parser,然后加载中文自然语言训练模型xinhuafactoredsegmenting.ser.gz。可选地,还可以是加载其他语言的自然语言训练模型,例如英文、法文等。在终端或主控设备接收到自然语言后,则将自然语言输入至自然语言解析库从而可以得到自然语言依存树。

其中自然语言依存树是将自然语言进行分割后,对分割后的每一个部分的成分进行标注得到的;例如当用户所说出或所输入的自然语言是“番茄来自哪里”,则通过stanford大学的自然语言解析库解析输入的自然语言得到自然语言依存树结构,具体可以参见图4。

s204:提取自然语言依存树中的骨干结构。

具体地,骨干结构为包含动作词和对象词的结构,可选地,骨干结构可以包括主谓宾结构、谓宾结构以及介宾结构中的至少一种。在得到自然语言依存树后,则通过遍历自然语言依存树按照预设规则获取到输入的自然语言的骨干结构,例如可以设置先提取主谓宾结构,在未提取到主谓宾结构时,则提取谓宾结构,在未提取到谓宾结构时,则提取介宾结构,直至提取成功。仍以上述例子进行说明,其提取到的主谓宾结构为{"ips":[{"s":"[番茄]","v":"[来自]","o":"[哪里]"}],其中“番茄”为主语,“来自”为谓语,“哪里”为宾语,则不需要再继续提取谓宾结构和介宾结构。如果在提取骨干结构的过程中提取失败,即未提取到主谓宾结构、谓宾结构或介宾结构,则可以输出报错,例如可以输出预设的提示,例如“未听清,请重复”等。

s206:判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则识别特殊疑问词的类型。

具体地,特殊疑问词包括多种类型,例如what-事物名称相关的主语和宾语可以替换为“什么”。who-人称相关的主语和宾语可以替换成“谁”。where-地点相关的主语和宾语可以替换成“哪里”,“什么地方”,“什么位置”when-时间相关的主语和宾语可以替换成“何时”,“什么时间”,“什么时候”。从而可以通过遍历所提取的骨干结构中是否存在上述特殊疑问词,当所遍历的骨干结构中存在上述特征疑问词时,则识别该特殊疑问词的类型,例如上述“番茄来自哪里”的实施例中的特殊疑问词“哪里”是属于“where”类的。

s208:将所提取的骨干结构与第一标准句子进行匹配,第一标准句子存储在所述知识库中,并与特殊疑问词的类型对应。

具体地,当骨干结构中存在特殊疑问词时,则可以将所提取的骨干结构与知识库中的特殊疑问词类型对应的第一标准句子进行匹配,其中知识库中可以根据特殊疑问词的类型进行分类存储,从而可以直接获取所提取的骨干结构中的特殊疑问词类型对应的第一标准句子,并进行相应的匹配即可。例如可以通过所提取的骨干结构中的除特殊疑问词以外的词语与第一标准句子进行匹配,如果剩余的词语均与第一标准句子匹配成功,则认为匹配成功,否则,则认为匹配失败。

以上述“番茄来自哪里”为例进行说明,其中特殊疑问词为“哪里”,则通过“番茄”和“来自”与知识库中的“where”类型所对应的第一标准句子进行匹配,如果第一标准句子中存在“番茄来自北美洲”,即“番茄”与“番茄”匹配成功,“来自”与“来自”匹配成功,则认为匹配成功。

s210:当匹配成功时,则提取第一标准句子中与特殊疑问词对应的部分,并将所提取的部分替换自然语言中的特殊疑问词后,输出替换后的自然语言。

具体地,当匹配成功时,则提取第一标准句子中与特殊疑问词对应的部分,如上述例子中的“北美洲”,并通过该部分替换原自然语言中的特殊疑问词,并输出替换后的自然语言,即将原自然语言中的“哪里”替换为“北美洲”,并输出“番茄来自北美洲”,从而完成整个问答过程。

上述自然语言处理方法,对所接收的的自然语言通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树,并根据该自然语言依存树得到骨干结构,通过提取句子骨干结构,去除掉无用信息;并根据特殊疑问词来判断句型,然后根据句型来查询相应的知识库,并通过知识库中第一标准句子的相应部分替换该特殊疑问词,并未改变句子的结构,使得智能问答中的答案与问题逻辑相关,提高了回答的准确性。

在其中一个实施例中,该自然语言处理方法还可以包括:当所提取的骨干结构中不存在特殊疑问词时,则判断骨干结构中是否存在一般疑问词;当骨干结构中存在一般疑问词时,则将一般疑问词转换为肯定词,并将转换后的骨干结构与知识库中的第二标准句子进行匹配;当匹配成功时,则将自然语言中的一般疑问词转换为肯定词后,输出转换后的自然语言;当匹配失败时,则将自然语言中的一般疑问词转换为否定词后,输出转换后的自然语言。在其中一个实施例中,该自然语言存储方法还可以包括:当骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将骨干结构存储至知识库中。

具体地,本实施例中的自然语言骨干结构包括主谓宾结构、介宾结构和谓宾结构,句子类型包括:陈述句或者祈使句:不带特殊疑问词和一般疑问词的句子,该类型的句子认定为知识陈述类,可以将这类句子的骨干提取到知识库中存储。带疑问词的特殊疑问句:这类疑问句有显著的主谓宾结构和疑问词,这个类型的句子认定为查询类。通过提取疑问词查询知识库得到相关的知识点,使用相应自然语言生成方法(替换和否定)生成自然语言句子形式的查询结果返回给用户。一般疑问句:这类疑问句也是有显著的主谓宾结构和一般疑问结构,主要是语法分析中“动词-否定-动词”结构,这类型的句子是一类判定问题,通过自然语言生成系统中的否定运算方法运算以后得到查询语句,搜索知识库,如果知识库中有这样的判定,那么就可以通过自然语言的生成方法中否定运算操作运算以后返回结果给用户。

其中的自然语言生成方法包括替换运算、否定运算和复合运算,其中,替换运算其针对主语和宾语的不同属性,替换成不用疑问词,得到不同语义的疑问句,针对相应的特殊疑问词也可以用相应的结果词进行替换。否定运算主要是针对宾语部分,添加适当的否定词前缀或去除特定的否定词前缀可以得到否定语义的骨干结构,或得到肯定语义的骨干结构,其中否定词前缀可以包括“不”,“不是”,“没”,“没有”等。对于复合运算则是将替换运算和否定预算进行叠加使用,即可以先使用一种得到某个结构,在得到的结构上继续施加第二种运算得到另外一个结构,以此类推。

具体地,参阅图5,图5为另一实施例中的自然语言处理方法的流程图。其中终端首先接收用户输入的自然语言,然后,通过预设的自然语言解析器进行解析得到语法依存树,并从该语法依存树中提取到相应的句子骨干结构,对所提取的句子骨干结构进行判断可以得到三种句子类型,针对不同的句子类型进行相应的处理。当句子骨干中存在特殊疑问词时,则根据特殊疑问词的类型获取对应的知识库,将句子骨干成分中的其他词语与知识库中的第二标准句子进行匹配,并将所匹配成功的第二标准句子对应于特殊疑问词的部分提取出来,将所提取出来的词替换自然语言句子中的特殊疑问词并输出以实现智能问答。在句子骨干结构中没有特殊疑问词的时候,则判断句子中是否存在“动词-否定词-动词”的结构,如果存在,则认定为一般疑问句,首先对句子进行否定运算,形成陈述句,然后根据句子中其他的骨干成分查询知识库,如果与知识库中的内容匹配成功,则输出陈述句,如果未匹配成功,则对该句子再次进行否定运算,输出否定陈述句。在骨干结构中没有特殊疑问词且没有“动词-否定词-动词”的结构时,则认为句子为陈述句,则将所提取的骨干结构存储至知识库,以为其他智能问答奠定基础。

具体地,假设用户输入的自然语言为“番茄来自哪里”,则提取到骨干结构“番茄”、“来自”“哪里”,其中“哪里”是特殊疑问词,且为“where”类型,则在知识库中查询地点相关的第二标准句子,并且限定条件是骨干中的“番茄”,如果得到知识库的响应是“北美洲”,那么利用上述的自然语言生成方法中的替换(replace)运算操作,将原输入句子中的疑问词“哪里”替换成“北美洲”,最后经过序列化处理,合成骨干结构为自然语言句子,得到“番茄来自北美洲”的知识点表述,返回给用户。

假设用户输入的自然语言为“番茄是不是来自北美洲”,则提取到骨干结构“番茄”、“是不是”“来自”“北美洲”,则判断句子骨干中是否存在“动词-否定词-动词”的结构,如果存在,则先对所提取的骨干结构进行否定操作得到肯定句,然后将肯定句中的句子结构依次与知识库中的内容进行匹配,例如首先对主语进行匹配,然后对谓语,最后对宾语,如果匹配成功,则直接输出该肯定句,如果匹配失败,则对该肯定句再次进行否定操作后再输出。如上述例子中,首先对骨干结构进行否定操作,得到“番茄”“是”“来自”“北美洲”的肯定句,然后在知识库中查询是否有这样的句子陈述,如果查询为真,那么,可以直接按照自然语言生成方法序列化该结构为“番茄是来自北美洲”返回给用户;如果为假,那么使用本案例的自然语言生成方法中的否定操作,将查询结构变换成“番茄不是来自北美洲”返回给用户。具体地,当查询为真,则将原自然语言中的“动词-否定词-动词”修改为“动词”,否则修改为“否定词-动词”,并输出进行替换后的词语。

假设用户输入的是“番茄来自北美洲”,则提取到骨干结构“番茄”“来自”“北美洲”,其中未包含特殊疑问词,也未包含一般疑问词,即未包含“动词-否定词-动词”的结构时,则认为该句子未陈述句或祈使句,当该句子为陈述句或祈使句的时候,则直接将该句子保存到知识库中,以对知识库进行扩充,并为了提高趣味性,可以随机对该陈述句中的句子骨干的某一部分用特殊疑问词进行代替输出,或进行复合运算后输出,以实现趣味性。例如可以输出“番茄来自哪里”,从而可以提高趣味性。其中为了避免重复,还可以首先查询知识库中是否存在该骨干结构,如果存在,则不作任何操作,只有在知识库中不存在该骨干结构时,才会将该骨干结构存储进知识库中。

上述实施例中,将句子类型分为特殊疑问句、一般疑问句以及陈述句,在智能问答的时候,首先提取句子骨干成分,去除掉无用信息,其次根据特殊疑问词来判断句型,然后根据句型来查询相应的知识库,并通过替换操作替换特殊疑问词,通过否定操作或替换操作替换骨干结构中的“动词-否定词-动词”结构等,并将陈述句直接存储至知识库中,并未改变句子的结构,使得智能问答中的答案与问题逻辑相关,提高了回答的准确性。

在其中一个实施例中,为了提高匹配的效率,引入了模糊匹配的方式,其中在模糊匹配之前还可以对骨干结构中的成分进行标准化处理,或者在匹配失败后,引入人工干预的步骤,通过该人工干预的步骤,建立匹配失败的骨干结构与标准句子的映射关系,从而后续再接收到该骨干结构时,可以直接从知识库中获取到相应的标准句子,从而不仅通过陈述句实现知识库的扩充,还可以通过人工干预实现知识库的扩充。对于上述实施例中可能存在模糊匹配的步骤包括将转换后的骨干结构与知识库中的标准句子进行匹配的步骤和/或将所提取的骨干结构与知识库中特殊疑问词的类型对应的标准句子进行匹配的步骤。

其中,在一个实施例中,将转换后的骨干结构与知识库中的第二标准句子进行匹配的步骤,可以包括:将转换后的骨干结构与知识库中的第二标准句子进行模糊匹配;当转换后的骨干结构与知识库中的第二标准句子模糊匹配失败时,接收针对转换后的骨干结构的第一映射指令;根据第一映射指令建立转换后的骨干结构与第一目标句子的匹配关系,并将第一目标句子存储至知识库中。

具体地,当骨干结构中存在一般疑问词时,首先对该骨干结构进行否定操作,然后将转换后的骨干结构与知识库中的第二标准句子模糊匹配,包括骨干结构中每一部分的模糊匹配,例如当骨干结构为主谓宾结构时,则主语、宾语和谓语均要进行模糊匹配,例如当所提取到的骨干结构为“番茄是不是来自北美洲”,则首先用“番茄”匹配到的知识库中的内容为“小番茄”和“番茄”,由于“番茄”的匹配率为100%,大于预设值,且大于小番茄的匹配率66.6%,因此选取“番茄”为最终的匹配结果,同样地,北美洲也进行同样的匹配。可选地,在模糊匹配开始前还可以对提取到的骨干结构进行预处理,即标准化处理,例如当提取到的骨干成分为“番茄”时,则首先将“番茄”转换为“西红柿”,然后再按照上述实施例进行匹配。

其中,当匹配失败时,则可以接收针对转换后的骨干结构的第一映射指令;根据第一映射指令建立转换后的骨干结构与第一目标句子的匹配关系,并将第一目标句子存储至知识库中,例如在匹配失败时,则可以输出提示“不知道”等内容,此时用户可以进行人工干预,输入第一目标句子“番茄来自北美洲”,从而终端在接收到该指示后,可以将该第一目标句子存储至知识库中,从而实现知识库的扩充。

在一个实施例中,将所提取的骨干结构与第一标准句子进行匹配的步骤,可以包括:将所提取的骨干结构与第一标准句子进行模糊匹配;当所提取的骨干结构与第一标准句子模糊匹配失败时,接收针对所提取的骨干结构的第二映射指令;根据第二映射指令建立所提取的骨干结构与第二目标句子的匹配关系,并将第二目标句子存储至知识库中。

具体地,当骨干结构中存在特殊疑问词时,将所提取的骨干结构与知识库中的第一标准句子模糊匹配,包括骨干结构中每一部分的模糊匹配,例如当骨干结构为主谓宾结构时,则除了特殊疑问词部分的主语、宾语和谓语均要进行模糊匹配,例如当所提取到的骨干结构为“番茄来自哪里”,则首先用“番茄”匹配到的知识库中的内容为“小番茄”和“番茄”,由于“番茄”的匹配率为100%,大于预设值,且大于小番茄的匹配率66.6%,因此选取“番茄”为最终的匹配结果,同样地,“来自”也进行同样的匹配。可选地,在模糊匹配开始前还可以对提取到的骨干结构进行预处理,即标准化处理,例如当提取到的骨干成分为“番茄”时,则首先将“番茄”转换为“西红柿”,然后再按照上述实施例进行匹配。

其中,当匹配失败时,则可以接收针对转换后的骨干结构的第二映射指令;根据第二映射指令建立转换后的骨干结构与第二目标句子的匹配关系,并将第二目标句子存储至知识库中,例如在匹配失败时,则可以输出提示“不知道”等内容,此时用户可以进行人工干预,输入第二目标句子“番茄来自北美洲”,从而终端在接收到该指示后,可以将该第二目标句子存储至知识库中,从而实现知识库的扩充。

上述实施例中,采用模糊匹配的方式可以提高匹配的效率,且在匹配失败的情况下,引入人工干预,从而实现对知识库的扩充,提高了下一次的匹配效率。

应该理解的是,虽然图2和图5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图6所示,提供了一种自然语言处理装置,包括:接收模块100、提取模块200、第一判断模块300、第一匹配模块400和输出模块500,其中:

接收模块100,用于接收输入的自然语言,通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树。

提取模块200,用于提取自然语言依存树中的骨干结构。

第一判断模块300,用于判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则识别特殊疑问词的类型。

第一匹配模块400,用于将所提取的骨干结构与第一标准句子进行匹配,第一标准句子存储在知识库中,并与特殊疑问词的类型对应。

输出模块500,用于当匹配成功时,则提取第一标准句子中与特殊疑问词对应的部分,并将所提取的部分替换自然语言中的特殊疑问词后,输出替换后的自然语言。

在其中一个实施例中,装置还可以包括:

第二判断模块,用于当所提取的骨干结构中不存在特殊疑问词时,则判断骨干结构中是否存在一般疑问词。

第二匹配模块,用于当骨干结构中存在一般疑问词时,则将一般疑问词转换为肯定词,并将转换后的骨干结构与知识库中的第二标准句子进行匹配。

输出模块500还用于当匹配成功时,则将自然语言中的一般疑问词转换为肯定词后,输出转换后的自然语言;当匹配失败时,则将自然语言中的一般疑问词转换为否定词后,输出转换后的自然语言。

在其中一个实施例中,装置还可以包括:

存储模块,用于当骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将骨干结构存储至知识库中。

在其中一个实施例中,第二匹配模块可以包括:

第一模糊匹配单元,用于将转换后的骨干结构与知识库中的第二标准句子进行模糊匹配。

第一映射指令接收单元,用于当转换后的骨干结构与知识库中的第二标准句子模糊匹配失败时,接收针对转换后的骨干结构的第一映射指令。

第一映射关系存储单元,用于根据第一映射指令建立转换后的骨干结构与第一目标句子的匹配关系,并将第一目标句子存储至知识库中。

在其中一个实施例中,第一匹配模块可以包括:

第二模糊匹配单元,用于将所提取的骨干结构与第一标准句子进行模糊匹配。

第二映射指令接收单元,用于当所提取的骨干结构与第一标准句子模糊匹配失败时,接收针对所提取的骨干结构的第二映射指令。

第二映射关系存储单元,用于根据第二映射指令建立所提取的骨干结构与第二目标句子的匹配关系,并将第二目标句子存储至知识库中。

在其中一个实施例中,骨干结构可以包括主谓宾结构、谓宾结构以及介宾结构中的至少一种。

关于自然语言处理装置的具体限定可以参见上文中对于自然语言处理方法的限定,在此不再赘述。上述自然语言处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种自然语言处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,,处理器执行计算机程序时实现以下步骤:接收输入的自然语言,通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树;提取自然语言依存树中的骨干结构;判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则识别特殊疑问词的类型;将所提取的骨干结构与第一标准句子进行匹配,第一标准句子存储在知识库中,并与特殊疑问词的类型对应;当匹配成功时,则提取第一标准句子中与特殊疑问词对应的部分,并将所提取的部分替换自然语言中的特殊疑问词后,输出替换后的自然语言。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:当所提取的骨干结构中不存在特殊疑问词时,则判断骨干结构中是否存在一般疑问词;当骨干结构中存在一般疑问词时,则将一般疑问词转换为肯定词,并将转换后的骨干结构与知识库中的第二标准句子进行匹配;当匹配成功时,则将自然语言中的一般疑问词转换为肯定词后,输出转换后的自然语言;当匹配失败时,则将自然语言中的一般疑问词转换为否定词后,输出转换后的自然语言。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:当骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将骨干结构存储至知识库中。

在一个实施例中,处理器执行计算机程序时所实现的将转换后的骨干结构与知识库中的第二标准句子进行匹配的步骤,可以包括:将转换后的骨干结构与知识库中的第二标准句子进行模糊匹配;当转换后的骨干结构与知识库中的第二标准句子模糊匹配失败时,接收针对转换后的骨干结构的第一映射指令;根据第一映射指令建立转换后的骨干结构与第一目标句子的匹配关系,并将第一目标句子存储至知识库中。

在一个实施例中,处理器执行计算机程序时所实现的将所提取的骨干结构与第一标准句子进行匹配的步骤,可以包括:将所提取的骨干结构与第一标准句子进行模糊匹配;当所提取的骨干结构与第一标准句子模糊匹配失败时,接收针对所提取的骨干结构的第二映射指令;根据第二映射指令建立所提取的骨干结构与第二目标句子的匹配关系,并将第二目标句子存储至知识库中。

在一个实施例中,处理器执行计算机程序时实现的步骤中的骨干结构包括主谓宾结构、谓宾结构以及介宾结构中的至少一种。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收输入的自然语言,通过预设的自然语言解析库对输入的自然语言进行解析得到自然语言依存树;提取自然语言依存树中的骨干结构;判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则识别特殊疑问词的类型;将所提取的骨干结构与第一标准句子进行匹配,第一标准句子存储在知识库中,并与特殊疑问词的类型对应;当匹配成功时,则提取第一标准句子中与特殊疑问词对应的部分,并将所提取的部分替换自然语言中的特殊疑问词后,输出替换后的自然语言。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当所提取的骨干结构中不存在特殊疑问词时,则判断骨干结构中是否存在一般疑问词;当骨干结构中存在一般疑问词时,则将一般疑问词转换为肯定词,并将转换后的骨干结构与知识库中的第二标准句子进行匹配;当匹配成功时,则将自然语言中的一般疑问词转换为肯定词后,输出转换后的自然语言;当匹配失败时,则将自然语言中的一般疑问词转换为否定词后,输出转换后的自然语言。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将骨干结构存储至知识库中。

在一个实施例中,计算机程序被处理器执行时所实现的将转换后的骨干结构与知识库中的第二标准句子进行匹配的步骤,可以包括:将转换后的骨干结构与知识库中的第二标准句子进行模糊匹配;当转换后的骨干结构与知识库中的第二标准句子模糊匹配失败时,接收针对转换后的骨干结构的第一映射指令;根据第一映射指令建立转换后的骨干结构与第一目标句子的匹配关系,并将第一目标句子存储至知识库中。

在一个实施例中,计算机程序被处理器执行时所实现的将所提取的骨干结构与第一标准句子进行匹配的步骤,可以包括:将所提取的骨干结构与第一二标准句子进行模糊匹配;当所提取的骨干结构与第一标准句子模糊匹配失败时,接收针对所提取的骨干结构的第二映射指令;根据第二映射指令建立所提取的骨干结构与第二目标句子的匹配关系,并将第二目标句子存储至知识库中。

在一个实施例中,计算机程序被处理器执行时实现的步骤中的骨干结构包括主谓宾结构、谓宾结构以及介宾结构中的至少一种。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1