基于依存句法的句子主干抽取方法、设备和可读存储介质与流程

文档序号:23262400发布日期:2020-12-11 18:51阅读:164来源:国知局
基于依存句法的句子主干抽取方法、设备和可读存储介质与流程

本申请涉及金融科技(fintech)的人工智能领域,尤其涉及一种基于依存句法的句子主干抽取方法、设备和可读存储介质。



背景技术:

随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。

随着计算机软件和人工智能的不断发展,人工智能的应用领域也越来越广泛,在基于人工智能的对话系统中,常需要对句子的语义进行正确的识别,目前,通常通过词频算法检索方法对句子进行语义识别,也即,基于句子的词信息,对句子进行语义识别,其中,所述词信息包括词频信息和词顺序信息等,然而,对于一些语义相同但词信息不同的句子,例如,“我喜欢你”、“我很早就喜欢隔壁班的你”、“你被我偷偷的喜欢着”等三个句子所表达的语义均为我喜欢你,但三个句子的词信息均不同,进而目前的语义识别方法难以准确识别这些句子具备相同的语义,进而目前的句子语义识别的准确率仍然较低。



技术实现要素:

本申请的主要目的在于提供一种基于依存句法的句子主干抽取方法、设备和可读存储介质,旨在解决现有技术中句子语义识别准确率低的技术问题。

为实现上述目的,本申请提供一种基于依存句法的句子主干抽取方法,所述基于依存句法的句子主干抽取方法应用于基于依存句法的句子主干抽取设备,所述基于依存句法的句子主干抽取方法包括:

获取待分析语句,并对所述待分析语句进行依存句法分析,获得依存句法分析结果;

基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干,以对所述待分析语句进行语义识别。

本申请还提供一种基于依存句法的句子主干抽取装置,所述基于依存句法的句子主干抽取装置为虚拟装置,且所述基于依存句法的句子主干抽取装置应用于基于依存句法的句子主干抽取设备,所述基于依存句法的句子主干抽取装置包括:

依存句法分析模块,用于获取待分析语句,并对所述待分析语句进行依存句法分析,获得依存句法分析结果;

句子主干抽取模块,用于基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干,以对所述待分析语句进行语义识别。

本申请还提供一种基于依存句法的句子主干抽取设备,所述基于依存句法的句子主干抽取设备为实体设备,所述基于依存句法的句子主干抽取设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于依存句法的句子主干抽取方法的程序,所述基于依存句法的句子主干抽取方法的程序被处理器执行时可实现如上述的基于依存句法的句子主干抽取方法的步骤。

本申请还提供一种可读存储介质,所述可读存储介质上存储有实现基于依存句法的句子主干抽取方法的程序,所述基于依存句法的句子主干抽取方法的程序被处理器执行时实现如上述的基于依存句法的句子主干抽取方法的步骤。

本申请提供了一种基于依存句法的句子主干抽取方法、设备和可读存储介质,相比于现有技术采用的基于句子的词频信息,对句子进行语义识别的方法,本申请在获取待分析语句之后,对所述待分析语句进行依存句法分析,获得所述待分析语句对应的依存句法分析结果,进而基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干,进而实现了基于依存句法分析的方法,抽取待分析语句的目标句子主干的目的,其中,需要说明的是,在所述待分析语句中除所述目标句子主干之外的非句子主干部分对语义识别的贡献度较小,且对语义识别存在干扰,进而实现了基于依存句法分析的方法,在待分析语句中剔除对语义识别的贡献度小的非句子主干部分的目的,使得目标句子主干更加贴近于待分析语句的真实语义,进而基于所述目标句子主干,对所述待分析语句进行语义识别,可提高句子语义识别的准确率,且由于目标句子主干相比于待分析语句更加精简,进而在提高语义识别的准确率的同时,进行语义识别时的输入数据量更小,可减少进行语义识别时的计算量,提高了语义识别时的计算效率,也即,提高了语义识别的效率,克服了现有技术中基于句子的词信息,对句子进行语义识别时,对于一些语义相同但词信息不同的句子,难以准确识别这些句子具备相同的语义,而导致句子语义识别准确率低的技术缺陷,提高了句子语义识别的准确率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请基于依存句法的句子主干抽取方法第一实施例的流程示意图;

图2为本申请基于依存句法的句子主干抽取方法中所述待分析语句对应的依存关系树的示意图;

图3为本申请基于依存句法的句子主干抽取方法第二实施例的流程示意图;

图4为本申请实施例方案涉及的硬件运行环境的设备结构示意图。

本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。

本申请实施例提供一种基于依存句法的句子主干抽取方法,在本申请基于依存句法的句子主干抽取方法的第一实施例中,参照图1,所述基于依存句法的句子主干抽取方法包括:

步骤s10,获取待分析语句,并对所述待分析语句进行依存句法分析,获得依存句法分析结果;

在本实施例中,需要说明的是,所述待分析语句为预处理好的需要进行依存句法分析的句子,其中,预处理的目的为在所述待分析语句中去除干扰进行依存句法分析的背景成分,所述基于依存句法的句子主干抽取方法应用于人机对话系统,所述待分析语句为预处理后的进行人机对话时用户回复的语句,所述基于依存句法的句子主干抽取设备包括预设依存句法模型,其中,所述预设依存句法模型为预先训练好的机器学习模型,用于对语句进行依存句法分析,其中,依存句法分析的过程即为解析语句的句法信息的过程,其中,所述句法信息包括句型信息和词成分信息,例如,假设语句为“我是谁”,则经过依存句法分析后,句型信息表明该语句为主谓宾句,词成分信息表明“我”为主语,“是”为谓语,“谁”为宾语。

获取待分析语句,并对所述待分析语句进行依存句法分析,获得依存句法分析结果,具体地,获得待处理语句,其中,所述待处理语句为人机对话系统中收集的语句,进而对所述待处理语句进行预处理,获得待分析语句,进而将所述待分析语句输入所述预设依存句法模型,分别对所述待分析语句进行依存关系判别和依存关系类型预测,以对所述待分析语句进行依存句法分析,获得依存句法分析结果,其中,需要说明的是,进行依存关系判别的目的为判别词与词之间的依存关系,进行依存关系类型预测的目的是预测依存关系的类型,例如,假设待分析语句为语句“abc”,其中a、b和c均为待分析语句中的词,则进行依存关系判别后,可判定b依存于a,c依存于b,进行依存关系类型预测后,可确定a与b之间的依存关系为主谓关系,b与c之间的依存关系为动宾关系,其中,在一种可实施的方式中,所述对所述待分析语句进行依存关系判别和依存关系类型预测,以对所述待分析语句进行依存句法分析,获得依存句法分析结果的步骤包括:

对所述待分析语句进行依存关系判别,获得所述待分析语句对应的依存关系判别结果,并对所述待分析语句进行依存关系类型预测,获得所述待分析语句对应的依存关系类型预测结果,进而将所述依存关系判别结果和所述依存关系类型结果进行融合,获得所述待分析语句中词与词之间的依存关系类型标签,其中,所述依存关系类型标签为依存关系类型的标识,进而将所述依存关系类型标签作为所述依存句法分析结果,其中,所述依存关系类型预测结果可用矩阵进行表示,所述依存关系类型预测结果对应的矩阵形式为依存关系类型预测概率矩阵,其中,所述依存关系类型预测概率矩阵中的每一比特位上的值均为所述待分析语句中一词与另外一词之间的依存关系类型标签概率预测向量,其中,所述依存关系类型预测向量中的每一比特位上的值均为所述待分析语句中一词与另外一词的依存关系属于该比特位对应的预设依存关系的概率值,其中,所述预设依存关系包括主谓关系、动宾关系等,例如,假设词a与词b之间的所述依存关系类型标签概率预测向量为(0.1,0.9),则0.1表示词a与词b之间为主谓关系的概率为10%,0.9表示词a与词b之间的动宾关系的概率为90%。

其中,所述获取待分析语句的步骤包括:

步骤s11,获取待处理语句,并识别所述待处理语句中的背景成分;

在本实施例中,获取待处理语句,并识别所述待处理语句中的背景成分,具体地,获取待处理语句,并确定所述待处理语句中各待处理词的词位置,其中,所述词位置包括前缀位置、句中位置和后缀位置,进而基于每一所述待处理词的词位置,为各所述待分析词匹配对应的预设位置背景词集合,进而基于各所述待分析词对应的预设位置背景词集合,在各所述待分析词中确定各背景词,并将各所述背景词作为所述背景成分,其中,所述预设位置背景词集合包括前缀位置背景词集合、句中位置背景词集合和后缀位置背景词集合,其中,所述前缀位置背景词集合包括“还有就是说”、“还有就是”、“打个比方说”、“打个比方”、“我想知道”、“我知道”、“我不知道”、“我想了解一下”、“我想了解下”、“我想问问”、“我想问”、“我请问下”等前缀位置背景词,所述句中位置背景词集合包括“一般情况下”、“等一下”、“那个”、“麻烦下”等句中位置背景词,所述后缀位置背景词集合包括“什么的”、“你知道吗”、“是这个意思吗”、“是吗”、“是不是”等后缀位置背景词。

另外地,需要说明的是,在一种可实施的方式中,所述基于各所述待分析词对应的预设位置背景词集合,在各所述待分析词中确定各背景词的步骤包括:对每一所述待分析词均执行以下步骤:

将所述待分析词与所述待分析对应的预设位置背景词集合中的各预设背景词进行比对,以判断所述待分析词对应的预设位置背景词集合中是否存在与所述待分析词一致的预设背景词,若存在,则将所述待分析词作为背景词,若不存在,则所述待分析词不为背景词。

步骤s12,在所述待处理语句中去除所述背景成分,获得所述待分析语句。

在本实施例中,在所述待处理语句中去除所述背景成分,获得所述待分析语句,具体地,剔除所述待处理语句中的背景成分,以剔除所述待处理语句中对句子主干抽取过程存在干扰的背景成分,进而将所述待处理语句中除所述背景成分之外的部分作为所述待分析语句,以提高句子主干抽取的准确性。

步骤s20,基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干,以对所述待分析语句进行语义识别。

在本实施例中,需要说明的是,所述依存句法分析结果包括依存关系标签预测结果,其中,所述依存关系类型预测结果为所述待分析语句中词与词之间的依存关系类型,其中,所述依存关系类型包括主谓关系类型、动宾关系类型和动补结构类型等。

基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干,以对所述待分析语句进行语义识别,具体地,基于所述依存关系类型预测结果,确定所述待分析语句中各待分析词的词成分,进而基于待分析语句中各所述待分析词的词性和各所述待分析词的词成分,确定所述待分析语句的句型信息,其中,所述词性为待分析词的本身的性质,例如所述词性包括动词、名称和量词等,所述词成分为待分析词在所述待分析语句中表现的性质,例如所述词成分包括主语、谓语和宾语等,进而基于所述句型信息,在所述待分析语句中选取目标核心词,进而基于所述依存关系类型预测结果,在所述待分析语句中选取所述目标核心词关联的各目标句子主干词,进而将所述目标核心词和各所述目标句子主干词组成所述目标句子主干,进而将所述目标句子主干作为预设句子语义识别模型的模型输入,以对所述待分析语句进行语义识别。

其中,所述依存句法分析结果包括依存关系类型预测结果,

所述基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干的步骤包括:

步骤s21,基于所述依存关系类型预测结果,确定所述待分析语句对应的句型信息;

在本实施例中,基于所述依存关系类型预测结果,确定所述待分析语句对应的句型信息,具体地,基于所述待分析语句中各待分析词之间的依存关系类型,确定各所述待分析词的词成分,进而获取各所述待分析词的词性,进而基于各所述待分析词的词性和词成分,对所述待分析语句进行句型判别,确定所述待分析语句的句型信息,其中,所述句型信息为所述待分析语句的句型的标识信息,所述待分析语句的句型包括动词性谓语句、名词性谓语句、形容词性谓语句、介词性谓语句、连动句、双宾语语句、比字句、被字句、把字句和兼语句等,其中,所述动词性谓语句为动词做谓语的语句,所述名词性谓语句为名词做谓语的语句,所述形容词性谓语句为形容词做谓语语句,所述介词性谓语句为介词做谓语的语句,所述连动句为两个连续的互不支配的动词同为谓语的语句,所述双宾语语句为谓语对应的依存关系类型同时包括间宾关系类型和动宾关系类型的语句,所述比字句为谓语的状语中有“比”开始的状语的语句,所述被字句为谓语的状语中有“被”开始的状语的语句,所述把字句为谓语的状语中有“把”开始的状语的语句,所述兼语句为宾语对应的依存关系类型为兼语类型的语句。

步骤s22,基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干。

在本实施例中,基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干,具体地,基于所述句型信息,在所述待分析语句的待分析词中选取目标核心词,其中,所述目标核心词为做核心谓语的待分析词,例如,假设所述句型信息表示待分析语句为动词性谓语句,则所述待分析语句的谓语上的动词即为所述目标核心词,进而基于预设词成分优选级和所述待分析语句中词与词之间的依存关系类型,选取所述目标核心词对应的各目标句子主干词,进而将所述目标核心词和各所述目标句子主干词共同对应的依存句法向量作为所述目标句子主干,其中,所述预设词成分优先句子为抽取句子主干时优先抽取的词成分,且需要说明的是,为了保证目标句子主干的语义清晰且精简程度高,需要预先设置好抽取的词成分的数量,例如,假设预先设置好抽取的词成分包括主语、谓语和宾语,且谓语为动词,则基于所述依存关系类型中的主谓关系类型,确定所述目标核心词对应的主语作为所述目标句子主干词,并基于所述依存关系类型中的动宾关系类型,确定所述目标核心词对应的主语作为所述目标句子主干词,进而所述目标句子主干则由主语、谓语和宾语组成。

在另一种实施例方式中,所述基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干的步骤包括:

基于所述句型信息、所述待分析语句中词与词之间的依存关系类型以及所述待分析语句中各待分析词的词性,生成所述待分析语句对应的依存关系树,进而基于预设词成分优先级和所述依存关系树,抽取所述目标句子主干,其中,所述预设词成分优先级为在句子主干抽取过程的提取词成分的优先级,在一种可实施的方式中,所述待分析语句为“十分失望的他后来又考了几次财政厅的公务员”,则如图2所示为所述待分析语句对应的依存关系树的示意图,其中,root表示所述待分析语句,m、a、u、r、nt、d、v、q和n均为词性的标签,adv、rad、att、hed、sbv、cmp和vob为依存关系类型的标签。

其中,所述基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干的步骤包括:

步骤s221,基于所述句型信息,确定所述待分析语句对应的目标核心词;

在本实施例中,基于所述句型信息,确定所述待分析语句对应的目标核心词,具体地,基于所述句型信息,确定所述待分析语句对应的核心谓语,其中,所述核心谓语为决定所述待分析语句的句型信息的谓语,进而将所述核心谓语对应的待分析词作为所述目标核心词。

步骤s222,基于预设词成分优先级和所述依存关系类型预测结果,确定所述目标核心词对应的各目标句子主干词;

在本实施例中,需要说明的是,所述预设词成分优先级为在句子主干抽取过程的提取词成分的优先级,所述预设词成分优先级包括预设第一优先级、预设第二优先级和预设第三优先级,其中,在一种可实施的方式中,所述预设第一优先级对应的词成分包括主语、谓语、宾语、状语和补语,所述预设第二优先级对应的词成分包括定语,所述预设第三优先级对应的词成分包括除所述预设第一优先级和所述预设第二优先级共同对应的词成分之外的其他词成分。

基于预设词成分优先级和所述依存关系类型预测结果,确定所述目标核心词对应的各目标句子主干词,具体地,基于所述待分析语句中词与词之间的依存关系类型,确定所述目标核心词对应的各待选取词的词成分,进而基于所述预设词成分优先级的层数,在各待选取词的词成分中选取优先级词成分,进而将各所述优先级词成分对应的待分析词作为所述目标句子主干词,其中,需要说明的是,所述预设词成分优先级的第一层为预设第一优先级,所述预设成分优先级的第二层为预设第二优先级,所述预设词成分的第三层为预设第三优先级。

步骤s223,基于所述句型信息、所述目标核心词和各所述目标句子主干词,生成所述目标句子主干。

在本实施例中,基于所述句型信息、所述目标核心词和各所述目标句子主干词,生成所述目标句子主干,具体地,获取所述目标核心词的词成分和词性,以及各所述目标句子主干词的词成分和词性,进而基于所述句型信息、所述目标核心词、所述目标核心词的词性和词成分、各所述目标句子主干词和各所述目标句子主干词对应的词性和对应的词成分,生成所述目标句子主干,其中,在一种可实施的方式中,假设所述待分析语句为“十分失望的他后来又考了几次财政厅的公务员”,则所述目标句子主干为{句型:主谓宾句,主语:[他,att:[十分失望的]],谓语:[考,rad:[了]],前置宾语:[],宾语:[公务员,att:财政厅的]:coo:[],cmp:[几次],adv:[后来,又]},其中,att为定中关系类型的标签,rad为右附加关系类型的标签,coo为并列关系类型的标签,cmp为动补结构类型的标签,adv为状中结构类型的标签。

另外地,需要说明的是,由于句子主干抽取是基于依存句法分析获得的待解析语句对应的句型信息、对应的词成分和对应的词与词之间的依存关系类型进行的,进而本实施例可解释句子主干抽取结果的原因,对于句子主干抽取结果的可解释性强,进而句子主干抽取结果的置信度极高。

本实施例提供了一种基于依存句法的句子主干抽取方法、设备和可读存储介质,相比于现有技术采用的基于句子的词频信息,对句子进行语义识别的方法,本实施例在获取待分析语句之后,对所述待分析语句进行依存句法分析,获得所述待分析语句对应的依存句法分析结果,进而基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干,进而实现了基于依存句法分析的方法,抽取待分析语句的目标句子主干的目的,其中,需要说明的是,在所述待分析语句中除所述目标句子主干之外的非句子主干部分对语义识别的贡献度较小,且对语义识别存在干扰,进而实现了基于依存句法分析的方法,在待分析语句中剔除对语义识别的贡献度小的非句子主干部分的目的,使得剔除语义干扰词的目标句子主干更加贴近于待分析语句的真实语义,进而基于所述目标句子主干,对所述待分析语句进行语义识别,可提高句子语义识别的准确率,且由于目标句子主干相比于待分析语句更加精简,进而在提高语义识别的准确率的同时,进行语义识别时的输入数据量更小,可减少进行语义识别时的计算量,提高了语义识别时的计算效率,也即,提高了语义识别的效率,克服了现有技术中基于句子的词信息,对句子进行语义识别时,对于一些语义相同但词信息不同的句子,难以准确识别这些句子具备相同的语义,而导致句子语义识别准确率低的技术缺陷,提高了句子语义识别的准确率。

进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,所述依存句法分析结果包括依存关系类型预测结果,

所述对所述待分析语句进行依存句法分析,获得依存句法分析结果的步骤包括:

步骤a10,对所述待分析语句进行向量化,获得向量化语句;

在本实施例中,对所述待分析语句进行向量化,获得向量化语句,具体地,生成所述待分析语句中每一待分析词对应的待分析词向量、待分析词性向量和待分析词位置向量,其中,所述待分析词向量为表示待分析词的编码向量,用于唯一表示所述待分析词,所述待分析词性向量为表示所述待分析词的词性的编码向量,所述待分析词位置向量为表示所述待分析词在所述待分析语句中的位置的编码向量,进而基于每一所述待分析词对应的待分析词向量、对应的待分析词性向量和对应的待分析词位置向量,生成每一所述待分析词对应的向量化词,进而将各所述向量化词构成的矩阵作为所述向量化语句。

其中,所述待分析语句至少包括一待分析词,所述向量化语句至少包括一向量化词,

所述对所述待分析语句进行向量化,获得向量化语句的步骤包括:

步骤a11,获取所述待分析词对应的待分析词向量、对应的待分析词性向量和对应的待分析词位置向量;

在本实施例中,获取所述待分析词对应的待分析词向量、对应的待分析词性向量和对应的待分析词位置向量,具体地,基于预设词向量生成模型,将所述待分析词映射至预设向量空间,获得所述待分析词对应的待分析词向量,并为所述待分析词匹配对应的待分析词性向量,进一步地,基于所述待分析词在所述待分析语句中的位置,生成所述待分析词对应的待分析词位置向量。

步骤a12,基于所述待分析词向量、所述待分析词性向量和所述待分析词位置向量,生成所述向量化词。

在本实施例中,基于所述待分析词向量、所述待分析词性向量和所述待分析词位置向量,生成所述向量化词,具体地,将所述待分析词、所述待分析词性向量和所述待分析词位置向量输入预设向量化词计算公式,获得所述向量化词,其中,所述预设向量化词计算公式如下所示:

其中,xi为所述向量化词,ew为所述待分析词向量,et为所述待分析词性向量,ep为所述待分析词位置向量,为向量之间的concate操作。

步骤a20,基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果;

在本实施例中,需要说明的是,所述预设依存句法模型包括预设依存关系判别模型,其中,所述预设依存关系判别模型为用于判别待分析语句中词与词之间是否存在依存关系的机器学习模型。

基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果,具体地,将所述向量化语句输入所述预设依存关系判别模型,对所述向量化语句进行依存关系判别,以判别待分析语句中词与词之间是否存在依存关系,获得依存关系判别结果。

其中,所述预设依存关系判别模型包括第一特征提取模型、第一全连接网络、第二全连接网络和第一双仿射变换网络,

所述基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果的步骤包括:

步骤a21,基于所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取结果;

在本实施例中,需要说明的是,所述第一特征提取模型为对所述向量化语句进行特征提取的神经网络,所述第一特征提取模型包括transformer模型、rnn网络和cnn网络等。

基于所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取结果,具体地,将所述向量化语句输入所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取矩阵,并将所述第一特征提取矩阵作为所述第一特征提取结果。

步骤a22,基于所述第一全连接网络和所述第二全连接网络,分别对所述第一特征提取结果进行全连接,获得第一句子向量和第二句子向量;

在本实施例中,基于所述第一全连接网络和所述第二全连接网络,分别对所述第一特征提取结果进行全连接,获得第一句子向量和第二句子向量,具体地,将所述第一特征提取矩阵输入第一全连接网络,对所述第一特征提取矩阵进行全连接,获得第一句子向量,并将所述第一特征提取矩阵输入第二全连接网络,对所述第一特征提取矩阵进行全连接,获得第二句子向量,其中,需要说明的是,所述第一句子向量至少包括一词头向量,用于表示依存关系中作为被依存的词的表示向量,所述第二句子向量至少包括一词尾向量,用于表示依存关系中作为依存的词的表示向量,例如,假设词a依存于词b,则词b对应的词表示向量为词头向量,词a对应的词表示向量为词尾向量。

步骤a23,基于所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,获得依存关系得分矩阵;

在本实施例中,基于所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,获得依存关系得分矩阵,具体地,将所述第一句子向量和所述第二句子向量输入所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,以计算第一句子向量中每一词头向量和第二句子向量中每一词尾向量存在依存关系的概率得分,获得所述依存关系得分矩阵,其中,所述依存关系得分矩阵为由每一词头向量和每一词尾向量之间存在依存关系的概率得分组成的得分矩阵。

步骤a24,基于所述依存关系得分矩阵,确定所述依存关系判别结果。

在本实施例中,基于所述依存关系得分矩阵,确定所述依存关系判别结果,具体地基于预设最大生成树算法,在所述依存关系得分矩阵中选取满足预设得分选取条件的最大概率得分和,并将所述最大概率得分和对应的各目标概率得分对应的依存关系对应的向量化词组成的依存关系向量作为所述依存关系判别结果,其中,所述预设得分选取条件包括各目标概率得分对应的待分析词与所述待分析语句中的待分析词一一对应等,例如,假设各所述目标概率得分为a和b,其中,目标概率得分a表示词b依附于词a的概率得分,目标概率得分b表示词c依附于词b的概率得分,且词a对应向量化词为向量x,词b对应向量化词为向量y,词c对应向量化词为向量z,进而所述依存关系向量为向量(x,1,0,0,1,y,1,0,0,1,z),其中(1,0,0,1)表示词与词之间存在依存关系。

步骤a30,基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果;

在本实施例中,所述预设依存句法模型包括预设依存关系类型预测模型,其中,所述预设依存关系类型预测模型为用于预测待分析语句中词与词之间的依存关系类型的机器学习模型。

基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果,具体地,基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵,其中,需要说明的是,所述依存关系类型概率得分矩阵中每一比特位上存在一依存关系类型概率得分向量,其中,所述依存关系类型概率得分向量每一比特位上的数值为预设依存关系类型的概率得分,例如,假设所述依存关系类型概率得分向量为(a,b,c),且所述依存关系类型概率得分向量的第一位对应主谓关系,第二位对应动宾关系,第三位对应并列关系,则a为所述依存关系类型概率得分向量对应的两词之间的依存关系为主谓关系的概率得分,b为所述依存关系类型概率得分向量对应的两词之间的依存关系为动宾关系的概率得分,a为所述依存关系类型概率得分向量对应的两词之间的依存关系为主谓关系的概率得分,进而基于所述依存关系判别结果,在所述依存关系类型概率得分矩阵中选取各目标依存关系类型概率得分向量,进而将各所述目标依存关系类型概率得分向量中的最大数值对应的依存关系类型作为目标依存关系类型,进而获得待分析语句的词与词之间的依存关系类型,也即,获得所述依存关系类型预测结果。

其中,所述依存关系判别结果包括依存关系向量,

所述基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果的步骤包括:

步骤a31,基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵;

在本实施例中,需要说明的是,所述预设依存关系类型预测模型包括第二特征提取模型、第三全连接网络、第四全连接网络和第二双仿射变换网络。

基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵,具体地,将所述向量化语句输入第二特征提取模型,对所述向量化语句进行特征提取,获得第二特征提取矩阵,并将所述第二特征提取矩阵分别输入第三全连接网络和第四全连接网络,获得所述第二特征提取矩阵对应的第三句子向量和对应的第四句子向量,将所述第三句子向量和所述第四句子向量输入第二双仿射变换网络,对所述第三句子向量和所述第四句子向量进行双仿射变换,获得所述依存关系类型概率得分矩阵。

步骤a32,将所述依存关系类型概率得分矩阵和所述依存关系向量进行融合,获得所述依存关系类型预测结果。

在本实施例中,将所述依存关系类型概率得分矩阵和所述依存关系向量进行融合,获得所述依存关系类型预测结果,具体地,基于预设融合规则,将所述依存关系类型概率得分矩阵中的每一依存关系类型概率得分向量与所述依存关系向量进行融合,获得各所述依存关系类型概率得分向量对应的依存关系类型概率向量,其中,所述预设融合规则包括加权平均、拼接、求和等,所述依存关系类型概率向量每一比特位上的数值为预设依存关系类型的概率,所述预设依存关系类型包括主谓关系类型、动宾关系类型和并列关系类型等,进而分别在各所述依存关系类型概率向量中选取最大概率数值作为目标依存关系类型概率,进而在各所述目标依存关系类型概率中确定符合预设概率选取条件的各最大依存关系类型概率对应的依存关系类型,并将各最大依存关系类型概率对应的依存关系类型作为依存关系类型预测结果,其中,预设概率选取条件包括选取的各最大依存关系类型概率对应的待分析词与所述待分析语句中的各待分析词一一对应,例如,假设待分析语句为abc,则预设概率选取条件为选取的各最大依存关系类型概率的数量为2,且各最大依存关系类型概率对应的各待分析词可组成待分析语句abc。

另外地,需要说明的是,在一种实施方式中,所述预设依存句法模型可基于如下步骤训练获得:

步骤b10,获取训练数据和待训练依存句法模型,其中,所述训练数据包括训练语句和所述训练语句对应的预设依存类型标签;

在本实施例中,需要说明的是,所述预设依存类型标签为预先标注好的训练语句中词与词之间的依存关系类型的标识,所述待训练依存句法模型为未训练好的依存句法模型。

获取训练数据和待训练依存句法模型,其中,所述训练数据包括训练语句和所述训练语句对应的预设依存类型标签,具体地,获取标注依存句法分析数据集和待训练依存句法模型,并收集依存句法分析数据集,并对所述依存句法分析数据集进行人工标注,获得人工标注依存句法分析数据集,进而将所述标注依存句法分析数据集和所述人工标注依存句法分析数据集进行合并,获得训练数据集,以扩充所述待训练依存句法模型对应的训练样本的数量。

步骤b20,将所述训练数据输入所述待训练依存句法模型,以对所述训练语句进行依存句法分析,获得类型训练预测标签;

在本实施例中,需要说明的是,所述训练数据至少包括一训练语句。

将所述训练数据输入所述待训练依存句法模型,以对所述训练语句进行依存句法分析,获得类型训练预测标签,具体地,基于所述待训练依存句法模型中的向量化网络,对所述训练语句进行向量化,获得向量化训练语句,进而基于所述待训练依存句法模型中的预设依存关系判别模型,对所述向量化训练语句进行依存关系判别,获得训练依存关系向量,并基于所述待训练依存句法模型中的预设依存关系类型预测模型,对所述向量化训练语句进行依存关系类型预测,获得训练依存关系类型概率得分矩阵,进而将所述训练依存关系向量和所述训练依存关系类型概率得分矩阵,确定类型训练预测标签,其中,所述类型训练预测标签为训练语句对应的依存关系类型的标识。

步骤b30,基于所述类型训练预测标签和所述预设依存类型标签,计算依存句法模型误差;

在本实施例中,基于所述类型训练预测标签和所述预设依存类型标签,计算依存句法模型误差,具体地,计算所述类型训练预测标签和所述预设依存类型标签之间的距离,获得依存句法模型误差。

步骤b40,基于所述依存句法模型误差,对所述待训练依存句法模型进行更新,直至所述待训练依存句法模型满足预设更新结束条件,将所述待训练依存句法模型作为所述预设依存句法模型。

在本实施例中,基于所述依存句法模型误差,对所述待训练依存句法模型进行更新,直至所述待训练依存句法模型满足预设更新结束条件,将所述待训练依存句法模型作为所述预设依存句法模型,具体地,基于所述依存句法模型误差,计算梯度信息,并通过反向传播的方式,根据所述梯度信息,更新所述待训练依存句法模型的模型参数,获得更新后的待训练依存句法模型,进而判断更新后的待训练依存句法模型是否满足预设更新结束条件,若满足,则将更新后的待训练依存句法模型作为所述预设依存句法模型,若不满足,则重新获取训练语句,以对更新后的待训练依存句法模型的模型参数重新进行训练更新,直至更新后的待训练依存句法模型满足预设更新结束条件,其中,所述预设更新结束条件包括达到最大迭代次数和损失函数收敛等。

进一步地,基于训练好的预设依存句法模型,即可训练所述预设复述句识别模型,具体地,获取复述句训练数据和待训练复述句识别模型,其中,所述复述句训练语句包括第一待识别训练语句、第二待识别训练语句和语句标签,其中,所述语句标签为所述第一待识别训练语句和所述第二待识别训练语句是否为复述句的标识,所述复述句训练数据可用向量进行表示,例如,假设所述复述句训练数据为向量(x1,x2,y),则x1为第一复述句训练语句,x2为所述第二复述句训练语句,y为所述语句标签,进而生成所述第一待识别训练语句和所述第二待识别训练语句共同对应的训练句子向量表示,并基于所述预设依存句法模型,分别对所述第一待识别训练语句和所述第二待识别训练语句进行依存句法分析,获得所述第一待识别训练语句对应的第一训练依存向量和所述第二待识别训练语句对应的第二训练依存向量,进而将所述训练句子向量表示、所述第一训练依存向量和所述第二训练依存向量聚合后输入所述待训练复述句识别模型,获得输出复述句识别标签,进而基于所述输出复述句识别标签和所述语句标签,计算复述句识别模型误差,并基于所述复述句识别模型误差,对所述待训练复述句识别模型进行更新,直至所述待训练复述句识别模型满足预设训练结束条件,将所述待训练复述句识别模型作为所述预设复述句识别模型,其中,所述预设训练结束条件包括损失函数收敛和模型达到最大迭代次数等。

本实施提供了一种基于机器学习的依存句法分析方法,首先对所述待分析语句进行向量化,获得向量化语句,进而基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果,进而实现了判定待分析语句的词与词之间是否存在依存关系的目的,进而基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果,进而实现了预测待分析语句中词与词之间的依存关系类型的目的,且由于所述依存关系类型是基于预测关系判别结果进行预测的,避免了词与词之间存在依存关系的概率极低时,预测词与词之间存在各种类型的预设依存关系的概率却较高的情况发生,提高了依存关系类型预测的准确性,进而提高了依存句法分析的准确性,进而基于所述依存关系类型预测结果,即可抽取所述待分析语句对应的目标句子主干,以对所述待分析语句进行语义识别,其中,需要说明的是,在所述待分析语句中除所述目标句子主干之外的非句子主干部分对语义识别的贡献度较小,且对语义识别存在干扰,进而实现了基于依存句法分析的方法,在待分析语句中剔除对语义识别的贡献度小的非句子主干部分的目的,使得目标句子主干更加贴近于待分析语句的真实语义,进而可提高句子语义识别的准确率,为克服现有技术中基于句子的词信息,对句子进行语义识别时,对于一些语义相同但词信息不同的句子,难以准确识别这些句子具备相同的语义,而导致句子语义识别准确率低的技术缺陷奠定了基础。

参照图4,图4是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

如图4所示,该基于依存句法的句子主干抽取设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地,该基于依存句法的句子主干抽取设备还可以包括矩形用户接口、网络接口、摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。

本领域技术人员可以理解,图4中示出的基于依存句法的句子主干抽取设备结构并不构成对基于依存句法的句子主干抽取设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于依存句法的句子主干抽取程序。操作系统是管理和控制基于依存句法的句子主干抽取设备硬件和软件资源的程序,支持基于依存句法的句子主干抽取程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于依存句法的句子主干抽取系统中其它硬件和软件之间通信。

在图4所示的基于依存句法的句子主干抽取设备中,处理器1001用于执行存储器1005中存储的基于依存句法的句子主干抽取程序,实现上述任一项所述的基于依存句法的句子主干抽取方法的步骤。

本申请基于依存句法的句子主干抽取设备具体实施方式与上述基于依存句法的句子主干抽取方法各实施例基本相同,在此不再赘述。

本申请实施例还提供一种基于依存句法的句子主干抽取装置,所述基于依存句法的句子主干抽取装置应用于基于依存句法的句子主干抽取设备,所述基于依存句法的句子主干抽取装置包括:

依存句法分析模块,用于获取待分析语句,并对所述待分析语句进行依存句法分析,获得依存句法分析结果;

句子主干抽取模块,用于基于所述依存句法分析结果,抽取所述待分析语句对应的目标句子主干,以对所述待分析语句进行语义识别。

可选地,所述句子主干抽取模块包括:

确定单元,用于基于所述依存关系类型预测结果,确定所述待分析语句对应的句型信息;

抽取单元,用于基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干。

可选地,所述抽取单元包括:

第一确定子单元,用于基于所述句型信息,确定所述待分析语句对应的目标核心词;

第二确定子单元,用于基于预设词成分优先级和所述依存关系类型预测结果,确定所述目标核心词对应的各目标句子主干词;

第一生成子单元,用于基于所述句型信息、所述目标核心词和各所述目标句子主干词,生成所述目标句子主干。

可选地,所述依存句法分析模块包括:

向量化单元,用于对所述待分析语句进行向量化,获得向量化语句;

依存关系判别单元,用于基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果;

依存关系类型预测单元,用于基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果。

可选地,所述依存关系判别单元包括:

特征提取子单元,用于基于所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取结果;

全连接子单元,用于基于所述第一全连接网络和所述第二全连接网络,分别对所述第一特征提取结果进行全连接,获得第一句子向量和第二句子向量;

双仿射变换子单元,用于基于所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,获得依存关系得分矩阵;

第三确定子单元,用于基于所述依存关系得分矩阵,确定所述依存关系判别结果。

可选地,所述依存关系类型预测单元包括:

依存关系类型预测子单元,用于基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵;

融合子单元,用于将所述依存关系类型概率得分矩阵和所述依存关系向量进行融合,获得所述依存关系类型预测结果。

可选地,所述向量化单元包括:

获取子单元,用于获取所述待分析词对应的待分析词向量、对应的待分析词性向量和对应的待分析词位置向量;

第二生成子单元,用于基于所述待分析词向量、所述待分析词性向量和所述待分析词位置向量,生成所述向量化词。

可选地,所述依存句法分析模块还包括:

获取单元,用于获取待处理语句,并识别所述待处理语句中的背景成分;

去除单元,用于在所述待处理语句中去除所述背景成分,获得所述待分析语句。

本申请基于依存句法的句子主干抽取装置的具体实施方式与上述基于依存句法的句子主干抽取方法各实施例基本相同,在此不再赘述。

本申请实施例提供了一种可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于依存句法的句子主干抽取方法的步骤。

本申请可读存储介质具体实施方式与上述基于依存句法的句子主干抽取方法各实施例基本相同,在此不再赘述。

以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1