信息获取方法、装置、电子设备及计算机可读存储介质与流程

文档序号:21363238发布日期:2020-07-04 04:37阅读:101来源:国知局
信息获取方法、装置、电子设备及计算机可读存储介质与流程
本申请涉及信息处理
技术领域
,特别是涉及一种信息获取方法、装置、电子设备及计算机可读存储介质。
背景技术
:问答系统(questionansweringsystem,qa)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。实体识别和意图理解是问答系统中的两个重要环节,现有的问答系统大多将这两个环节当成两个子任务来处理,即先识别用户传入问题中存在的实体,然后理解问句想要表达的意图,根据实体和意图返回对应的答案。实体识别常采用户字典分词(实体词库)或者基于有监督的大规模语料标注的深度学习方法进行序列标注等方法,问题理解则采用问题对相似度匹配等。这种两步式的处理方式会在很大程度上影响线上系统的性能。技术实现要素:本申请提供一种信息获取方法、装置、电子设备及计算机可读存储介质,以解决现有技术中实体识别和意图理解分开执行的方式,很大程度上影响线上系统的性能的问题。为了解决上述问题,本申请公开了一种信息获取方法,包括:获取搜索语句;通过预先训练得到的联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型;根据搜索意图与查询语句模板之间的对应关系,获取所述目标搜索意图对应的目标查询模板;调用所述目标查询模板对所述目标实体词进行语句转换处理,生成所述目标实体词对应的目标查询语句;根据所述目标查询语句和所述目标实体类型在预置数据库中进行信息检索,得到所述搜索语句对应的检索信息。可选地,在所述通过预先训练得到的联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型之前,还包括:获取至少一个查询类型对应的多个训练样本;所述多个训练样本包括不同查询类型的搜索语句,每个所述训练样本包含初始搜索意图和初始实体词;针对各所述查询类型,对所述查询类型对应的多个训练样本进行标注处理,得到标注训练样本;将各所述标注训练样本输入至初始联合模型;所述初始联合模型包括意图理解层和实体识别层;调用所述意图理解层对所述标注训练样本进行意图识别处理,确定所述标注训练样本对应的预测搜索意图;调用所述实体识别层对所述标注训练样本进行实体识别处理,确定所述标注训练样本对应的预测实体词;根据所述预测搜索意图和所述初始搜索意图,计算得到所述意图理解层对应的意图损失值;根据所述初始实体词和所述预测实体词,计算得到所述实体识别层对应的实体损失值;在所述意图损失值和所述实体损失值的和值处于预设范围内的情况下,将所述初始联合模型作为所述查询类型对应的联合模型。可选地,所述通过预先训练得到的联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型,包括:获取所述搜索语句对应的目标查询类型;根据所述目标查询类型,确定所述搜索语句对应的目标联合模型;通过所述目标联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型。可选地,所述通过所述目标联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型,包括:调用所述目标联合模型的目标意图识别层对所述搜索语句进行意图识别处理,确定所述搜索语句对应的目标搜索意图;调用所述目标联合模型的目标实体识别层对所述搜索语句进行实体识别处理,确定所述搜索语句对应的目标实体词,及所述目标实体词对应的目标实体类型。可选地,所述查询类型包括:单一类值查询类型、函数查询类型、范围查询类型、最短路径查询类型、多级查询类型中的至少一种。为了解决上述问题,本申请公开了一种信息获取装置,包括:搜索语句获取模块,用于获取搜索语句;目标实体意图确定模块,用于通过预先训练得到的联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型;目标查询模板获取模块,用于根据搜索意图与查询语句模板之间的对应关系,获取所述目标搜索意图对应的目标查询模板;目标查询语句生成模块,用于调用所述目标查询模板对所述目标实体词进行语句转换处理,生成所述目标实体词对应的目标查询语句;检索信息获取模块,用于根据所述目标查询语句和所述目标实体类型在预置数据库中进行信息检索,得到所述搜索语句对应的检索信息。可选地,还包括:训练样本获取模块,用于获取至少一个查询类型对应的多个训练样本;所述多个训练样本包括不同查询类型的搜索语句,每个所述训练样本包含初始搜索意图和初始实体词;标注训练样本获取模块,用于针对各所述查询类型,对所述查询类型对应的多个训练样本进行标注处理,得到标注训练样本;标注训练样本输入模块,用于将各所述标注训练样本输入至初始联合模型;所述初始联合模型包括意图理解层和实体识别层;预测搜索意图确定模块,用于调用所述意图理解层对所述标注训练样本进行意图识别处理,确定所述标注训练样本对应的预测搜索意图;预测实体词确定模块,用于调用所述实体识别层对所述标注训练样本进行实体识别处理,确定所述标注训练样本对应的预测实体词;意图损失值计算模块,用于根据所述预测搜索意图和所述初始搜索意图,计算得到所述意图理解层对应的意图损失值;实体损失值计算模块,用于根据所述初始实体词和所述预测实体词,计算得到所述实体识别层对应的实体损失值;联合模型获取模块,用于在所述意图损失值和所述实体损失值的和值处于预设范围内的情况下,将所述初始联合模型作为所述查询类型对应的联合模型。可选地,所述目标实体意图确定模块包括:目标查询类型获取单元,用于获取所述搜索语句对应的目标查询类型;目标联合模型确定单元,用于根据所述目标查询类型,确定所述搜索语句对应的目标联合模型;目标实体意图确定单元,用于通过所述目标联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型。可选地,所述目标实体意图确定单元包括:目标搜索意图确定子单元,用于调用所述目标联合模型的目标意图识别层对所述搜索语句进行意图识别处理,确定所述搜索语句对应的目标搜索意图;目标实体类型确定单元,用于调用所述目标联合模型的目标实体识别层对所述搜索语句进行实体识别处理,确定所述搜索语句对应的目标实体词,及所述目标实体词对应的目标实体类型。可选地,所述查询类型包括:单一类值查询类型、函数查询类型、范围查询类型、最短路径查询类型、多级查询类型中的至少一种。为了解决上述问题,本申请公开了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的信息获取方法。为了解决上述问题,本申请公开了一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的信息获取方法。与现有技术相比,本申请包括以下优点:本申请实施例提供的信息获取方案,通过获取搜索语句,通过预先训练得到的联合模型对搜索语句进行处理,确定搜索语句对应的目标搜索意图、目标实体词及目标实体词对应的目标实体类型,根据搜索意图与查询语句模板之间的对应关系,获取目标搜索意图对应的目标查询模板,调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句,根据目标查询语句和目标实体类型在预置数据库中进行信息检索,得到搜索语句对应的检索信息。本申请实施例通过预先训练的联合模型可以同时识别搜索语句的意图、实体和实体类型,实现了实体识别和意图理解的联合识别,能够提高线上系统的性能,节省了线上系统的开销,提高了问答系统的性能。附图说明图1示出了本申请实施例提供的一种信息获取方法的步骤流程图;图2示出了本申请实施例提供的另一种信息获取方法的步骤流程图;图2a示出了本申请实施例提供的一种联合模型的示意图;图2b示出了本申请实施例提供的一种生成查询语句的示意图;图2c示出了本申请实施例提供的一种知识图谱的示意图;图3示出了本申请实施例提供的一种信息获取装置的结构示意图;图4示出了本申请实施例提供的另一种信息获取装置的结构示意图。具体实施方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。实施例一参照图1,示出了本申请实施例提供的一种信息获取方法的步骤流程图,该信息获取方法具体可以包括如下步骤:步骤101:获取搜索语句。本申请实施例可以应用于根据预先训练的联合模型识别出搜索语句的意图和实体,以根据意图和实体在知识图谱中进行信息检索的场景中。搜索语句是指用于在知识图谱中进行信息检索的语句。在某些示例中,搜索语句可以为用户输入的语句,例如,用户在知识图谱对应的搜索框内输入的查询语句,如,“张大千有什么画作?”、“与蒙娜丽莎相同类别的画有什么?”等等。在某些示例中,搜索语句可以为从互联网获取的语句,例如,可以在互联网搜集用户感兴趣的问题语句,以作为搜索语句等。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在获取搜索语句之后,执行步骤102。步骤102:通过预先训练得到的联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型。联合模型是指用于对搜索语句的意图和实体进行联合识别的模型,对于联合模型的训练过程可以在下述实施例二中进行详细描述,本申请实施例在此不再加以赘述。目标搜索意图是指获取的搜索语句的意图,例如,搜索语句所需获取哪类信息等意图。目标实体词是指搜索语句中所包含的实体词,例如,搜索语句为“张大千有什么画作”中包含的实体词为“张大千”和“画作”等。目标实体类型是指目标实体词对应的类型,实体类型可以包括艺术、医学、化学等类型,具体地,可以根据实际情况而定,本申请实施例对此不加以限制。在获取到搜索语句之后,可以调用预先训练好的联合模型对搜索语句进行处理,从而可以获取到搜索语句对应的目标搜索意图,及搜索语句中所包含的目标实体词及目标实体词对应的目标实体类型。在通过预先训练得到的联合模型对搜索语句进行处理,确定搜索语句对应的目标搜索意图、目标实体词及目标实体词对应的目标实体类型之后,执行步骤103。步骤103:根据搜索意图与查询语句模板之间的对应关系,获取所述目标搜索意图对应的目标查询模板。目标查询模板是指目标搜索意图对应的用于将目标实体词转换为知识图谱对应的标准查询语句的模板。在知识图谱中预先保存有不同的搜索意图对应的查询语句模板,在获取搜索语句对应的目标搜索意图之后,可以根据搜索意图与查询语句模板之间的对应关系,获取目标搜索意图所对应的目标查询模板,例如,如下述表1所示:表1:搜索意图查询语句模板aabb通过上述表1可知,搜索意图a与查询语句模板a之间存在对应关系,搜索意图b与查询语句模板b之间存在对应关系,在搜索语句的目标搜索意图为a时,则对应的目标查询模板即为a;而在搜索语句的目标搜索意图为b时,则对应的目标查询模板为b。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在根据搜索意图与查询语句模板之间的对应关系,获取到目标搜索意图对应的目标查询模板之后,执行步骤104。步骤104:调用所述目标查询模板对所述目标实体词进行语句转换处理,生成所述目标实体词对应的目标查询语句。目标查询语句是指目标实体词对应的可以用于在知识图谱中进行相应信息查询的语句,也即知识图谱可以识别的标准查询语句。在获取到目标搜索意图对应的目标查询模板之后,可以调用目标查询模板对目标实体词进行转换处理,以生成目标实体词对应的目标查询语句,例如,搜索语句“达芬奇的国籍是什么”中的实体为“达芬奇”,关系为艺术国籍,则查询语句代入如下“match(n:artist{artistname:%人名})–[r:%关系]–(m:国籍)returnm%(达芬奇,艺术家国籍)”,从而生成了标准的语句。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句之后,执行步骤105。步骤105:根据所述目标查询语句和所述目标实体类型在预置数据库中进行信息检索,得到所述搜索语句对应的检索信息。预置数据库是指用于知识图谱所对应的数据库,即预置数据库可以用于知识图谱中具有关联关系的子图形式的信息。检索信息是指在预置数据库中检索得到的搜索语句对应的信息。在调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句之后,可以根据目标查询语句和目标实体类型在预置数据库中进行信息检索,以获取搜索语句对应的检索信息。具体地,可以在预置数据库根据目标查询语句进行查询,以得到目标实体类型的检索信息。本申请通过采用联合识别的方式,可以避免将语句的意图识别和实体识别分两步处理,能够提高线上系统的性能。本申请实施例提供的信息获取方法,通过获取搜索语句,通过预先训练得到的联合模型对搜索语句进行处理,确定搜索语句对应的目标搜索意图、目标实体词及目标实体词对应的目标实体类型,根据搜索意图与查询语句模板之间的对应关系,获取目标搜索意图对应的目标查询模板,调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句,根据目标查询语句和目标实体类型在预置数据库中进行信息检索,得到搜索语句对应的检索信息。本申请实施例通过预先训练的联合模型可以同时识别搜索语句的意图、实体和实体类型,实现了实体识别和意图理解的联合识别,能够提高线上系统的性能,节省了线上系统的开销,提高了问答系统的性能。实施例二参照图2,示出了本申请实施例提供的另一种信息获取方法的步骤流程图,该信息获取方法具体可以包括如下步骤:步骤201:获取至少一个查询类型对应的多个训练样本。本申请实施例可以应用于根据预先训练的联合模型识别出搜索语句的意图和实体,以根据意图和实体在知识图谱中进行信息检索的场景中。参照图2a,示出了本申请实施例提供的一种联合模型的示意图,如图2a所示,对于输入的搜索语句“我想看达芬奇的蒙娜丽莎”可以输入至bert模型,通过调用crf层对搜索语句进行意图识别和实体识别,以确定这个搜索语句的意图和包含的实体词,如识别的实体词为“达芬奇”、“蒙娜丽莎”,识别的意图为“点播意图”。对于联合模型的训练过程可以进行如下描述。训练样本是指用于对联合模型进行训练的样本,多个训练样本中包含了不同查询类型的搜索语句,每个训练样本均包含了初始搜索意图和初始实体词,即预先标注的每个训练样本的搜索意图和实体词。在本实施例中,查询类型可以包括单一类值查询类型、函数查询类型、范围查询类型、最短路径查询类型、多级查询类型等类型中的至少一种,具体地,这些类型可以进行如下描述:1、单一类值查询类型单一类值查询类型即设置查询某一类值,当总分类模块对输入的语句认定为仅仅是某列的查询,可以如下例子调用相关的bert_1模型:question(即搜索语句):whoaretheartistsof法国?,则对应的查询语句为:cypher(即查询语句):match(n:country{countryname:”法国”})<-[r:艺术家国籍]-(m:artist)returnm.artistname。其中的artist和counrty是通过bert_1意图识别模型进行分类得出,通过数据字典进行抽取。2、函数查询类型函数查询类型是指设置查询函数操作,当总分类模块对输入的语句认定为包含查询函数操作?如下例子调用相关的bert_2模型。question:达芬奇年代最久远的画是什么?cypher:match(n:artist{artistname:”达芬奇”})<-[r1:画作画家]-(m:art)-[r2:艺术品创作时间]->(p:year)。3、范围查询类型范围查询类型是指设置查询范围,调用相关的bert_4模型:question:1820-1840年出生的画家有哪些?cypher:match(n:artist)-[r:艺术家出生年]->(m:year)wherem.yearname>1820andm.yearname<1840returnn.artistname。其中的比较关系、1820-1840是通过bert_4意图识别模型进行分类得出,通过数据字典进行抽取。4、最短路径查询类型最短路径查询类型是指设置查询的最短路径,调用相关的bert_5模型:question:达芬奇和张大千有什么关系?cypher:matchp=shortestpath((n:artist{artistname:”达芬奇”})-[r*..]-(m:artist{artistname:”张大千”}))return。5、多级查询类型多级查询类型是指设置多级的查询操作,此时可以调用相关的bert_6模型包含三层网络:question:蒙娜丽莎相同流派的画作的画家中有哪些是法国人?cypher:match(n:art{artname:”蒙娜丽莎”})-[r1:艺术品流派]->(m:genre)<-(k:art)-[r2:艺术品艺术家]->(p:artist)-[r3:艺术家国籍]->(q:country{countryname:”法国”})wherek.artname<>“蒙娜丽莎”returnq。其中的genre和country是通过bert_6意图识别模型进行分类得出,'蒙娜丽莎'和'法国'通过数据字典进行抽取,‘artname<>“蒙娜丽莎”’通过crf模型提取。当然,在本实施例中,查询类型还可以包括具体值查询类型,此时,当总分类模块对输入的语句认定为查询具体值。如下例子调用相关的bert_3模型:question:1819年法国有哪些画家出生?cypher:match(n:country{countryname:”法国”})<-[r1:艺术家国籍]-(m:artist)-[r2:艺术家出生年]->(p:year{yearname:1819})returnm.artistname。其中的country、year是通过bert_3意图识别模型进行分类得出,通过数据字典进行抽取。本实施例中,通过预先训练多种查询类型对应的模型,在后续识别过程中,可以根据搜索语句对应的查询类型选择合适的模板,以进行意图和实体的识别。在获取到多个训练样本之后,执行步骤202。步骤202:针对各所述查询类型,对所述查询类型对应的多个训练样本进行标注处理,得到标注训练样本。标注训练样本是指对训练样本进行标注之后得到的样本。在本实施例中,可以针对每种查询类型分别相应的联合模型,如上述步骤中提及的bert_1、bert_2、bert_3、bert_4、bert_5、bert_6。在针对某个查询类型,获取该查询类型的多个训练样本之后,可以对这些训练样本进行标注处理,例如,采用b-entity_type、i-entity_type及o等进行标注,如图2a所示。其中,b-per表示画家实体的开头,i-per表示画家实体的中间部分,b-art表示时间实体的开头,i-art表示时间实体的中间部分,代表作表示整个句子的意图,即这句话问的是法国画家布丹的代表作品有哪些,意图和实体标记序列中间以\t分开,输入至bert模型,进行模型训练。可以理解地,上述提及的b-entity_type、i-entity_type及o均是人为定义的,没有特殊含义。在针对各查询类型,对查询类型对应的多个训练样本进行标注处理,得到标注训练样本之后,执行步骤203。步骤203:将各所述标注训练样本输入至初始联合模型;所述初始联合模型包括意图理解层和实体识别层。初始联合模型是指还未进行训练的联合模型,当然,初始联合模型可以为多个,具体地,可以与查询类型的种类数目相同。在初始联合模型中包含有意图理解层和实体识别层,其中,意图理解层可以用于对标注训练样本进行意图理解,以确定标注训练样本的意图,实体识别层可以用于对标注训练样本进行实体识别,以确定标注训练样本中包含的实体词。具体地,可以结合下述步骤进行描述。在针对各查询类型,对查询类型对应的多个训练样本进行标注处理,得到标注训练样本之后,可以将该查询类型的多个标注训练样本依次输入至初始联合模型,进而,执行步骤204和步骤205。步骤204:调用所述意图理解层对所述标注训练样本进行意图识别处理,确定所述标注训练样本对应的预测搜索意图。预测搜索意图是指在初始联合模型的训练过程中,由意图理解层预测的标注训练样本的搜索意图。在将标注训练样本输入至初始联合模型之后,则可以调用意图理解层对标注训练样本进行意图识别处理,以确定出标注训练样本对应的预测搜索意图,在问句的意图理解上,本实施例将句子对的相似度匹配问题转化为一个多分类问题,艺术领域的所有意图都会被当成一个分类标签,如,在另一示例中,原始数据为:我想看达芬奇的蒙娜丽莎\t点播,对应的标注数据可以为:ooob-peri-peri-perob-arti-arti-arti-art\t点播。其中,代表作即为一个标签。在实体识别任务上,可以取模型最后一层每个单词的隐藏层表示,将其送入一个crf层做序列标注。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在调用意图理解层对标注训练样本进行意图识别处理,确定标注训练样本对应的预测搜索意图之后,执行步骤206。步骤205:调用所述实体识别层对所述标注训练样本进行实体识别处理,确定所述标注训练样本对应的预测实体词。预测实体词是指在初始联合模型的训练过程中,由实体识别层预测的标注训练样本包含的实体词。在将标注训练样本输入至初始联合模型之后,可以调用实体识别层对标注训练样本进行实体识别处理,以识别出标注训练样本中包含的实体词,例如,搜索语句:“我想看达芬奇的蒙娜丽莎”中识别出的实体词为:“达芬奇”、“蒙娜丽莎”。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在调用实体识别层对标注训练样本进行实体识别处理,确定标注训练样本对应的预测实体词之后,执行步骤207。步骤206:根据所述预测搜索意图和所述初始搜索意图,计算得到所述意图理解层对应的意图损失值。意图损失值是指结合每个标注训练样本的预测搜索意图和初始搜索意图计算得到的损失值。在获取到预测搜索意图之后,可以结合预测搜索意图和初始搜索意图计算意图理解层的意图损失值,记为:loss_intention(用于下述步骤的求和)。在根据预测搜索意图和初始搜索意图计算得到意图理解层的意图损失值之后,执行步骤208。步骤207:根据所述初始实体词和所述预测实体词,计算得到所述实体识别层对应的实体损失值。实体损失值是指结合每个标注训练样本的预测实体词和初始实体词计算得到的损失值。在获取到预测实体词之后,可以结合预测实体词和初实体词计算实体识别层的实体损失值,记为:loss_ner(用于下述步骤的求和)。在根据初始实体词和预测实体词,计算得到实体识别层对应的实体损失值之后,执行步骤208。步骤208:在所述意图损失值和所述实体损失值的和值处于预设范围内的情况下,将所述初始联合模型作为所述查询类型对应的联合模型。在计算得到意图损失值和实体损失值之后,可以将二者进行加权求和,即loss=loss_intention+loss_ner,以作为联合模型的loss进行训练。预设范围是指预先设定的用于判定初始联合模型的训练完成度的损失值范围,对于预设范围的具体数值范围可以根据业务需求而定,本申请实施例对此不加以限制。在意图损失值和实体损失值的和值处于预设范围内时,表示初始模型的训练过程已经符合要求,则结束训练,将最终训练得到的初始联合模型作为该查询类型最终的联合模型。步骤209:获取搜索语句。搜索语句是指用于在知识图谱中进行信息检索的语句。在某些示例中,搜索语句可以为用户输入的语句,例如,用户在知识图谱对应的搜索框内输入的查询语句,如,“张大千有什么画作?”、“与蒙娜丽莎相同类别的画有什么?”等等。在某些示例中,搜索语句可以为从互联网获取的语句,例如,可以在互联网搜集用户感兴趣的问题语句,以作为搜索语句等。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在获取搜索语句之后,执行步骤210。步骤210:获取所述搜索语句对应的目标查询类型。目标查询类型是指获取的搜索语句对应的查询类型。在获取到搜索语句之后,可以对搜索语句进行解析,以确定搜索语句对应的目标查询类型,如确定搜索语句是单一类值查询类型,还是函数查询类型等。在获取到搜索语句对应的目标查询类型之后,执行步骤211。步骤211:根据所述目标查询类型,确定所述搜索语句对应的目标联合模型。目标联合模型是指搜索语句的目标查询类型对应的,用于对搜索语句进行意图识别和实体识别的模型,例如,结合上述六种查询类型而言,在目标查询类型为多级查询类型时,则目标联合模型为bert_6;而在目标查询类型为最短路径查询类型时,则目标联合模型为bert_5。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在根据目标查询类型确定出搜索语句对应的目标联合模型之后,执行步骤212。步骤212:通过所述目标联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型。目标搜索意图是指获取的搜索语句的意图,例如,搜索语句所需获取哪类信息等意图。目标实体词是指搜索语句中所包含的实体词,例如,搜索语句为“张大千有什么画作”中包含的实体词为“张大千”和“画作”等。目标实体类型是指目标实体词对应的类型,实体类型可以包括艺术、医学、化学等类型,具体地,可以根据实际情况而定,本申请实施例对此不加以限制。在根据目标查询类型确定出搜索语句对应的目标联合模型之后,可以通过目标联合模型对搜索语句进行处理,以获取到搜索语句对应的目标搜索意图,及搜索语句中所包含的目标实体词及目标实体词对应的目标实体类型。在获取到搜索语句对应的目标搜索意图,及搜索语句中所包含的目标实体词及目标实体词对应的目标实体类型之后,执行步骤213。步骤213:根据搜索意图与查询语句模板之间的对应关系,获取所述目标搜索意图对应的目标查询模板。目标查询模板是指目标搜索意图对应的用于将目标实体词转换为知识图谱对应的标准查询语句的模板。在知识图谱中预先保存有不同的搜索意图对应的查询语句模板,在获取搜索语句对应的目标搜索意图之后,可以根据搜索意图与查询语句模板之间的对应关系,获取目标搜索意图所对应的目标查询模板,例如,如下述表1所示:表1:搜索意图查询语句模板aabb通过上述表1可知,搜索意图a与查询语句模板a之间存在对应关系,搜索意图b与查询语句模板b之间存在对应关系,在搜索语句的目标搜索意图为a时,则对应的目标查询模板即为a;而在搜索语句的目标搜索意图为b时,则对应的目标查询模板为b。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在根据搜索意图与查询语句模板之间的对应关系,获取到目标搜索意图对应的目标查询模板之后,执行步骤214。步骤214:调用所述目标查询模板对所述目标实体词进行语句转换处理,生成所述目标实体词对应的目标查询语句。目标查询语句是指目标实体词对应的可以用于在知识图谱中进行相应信息查询的语句,也即知识图谱可以识别的标准查询语句。在获取到目标搜索意图对应的目标查询模板之后,可以调用目标查询模板对目标实体词进行转换处理,以生成目标实体词对应的目标查询语句,例如,搜索语句“达芬奇的国籍是什么”中的实体为“达芬奇”,关系为艺术国籍,则查询语句代入如下“match(n:artist{artistname:%人名})–[r:%关系]–(m:国籍)returnm%(达芬奇,艺术家国籍)”,从而生成了标准的语句。可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本申请实施例的唯一限制。在另一示例中,可以如图2b所示的查询语句,即cypher语句,在生成cypher语句之后,则可以在终端界面显示,以实现cypher语句的可视化展示。在调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句之后,执行步骤215。步骤215:根据所述目标查询语句和所述目标实体类型在预置数据库中进行信息检索,得到所述搜索语句对应的检索信息。预置数据库是指用于知识图谱所对应的数据库,即预置数据库可以用于知识图谱中具有关联关系的子图形式的信息。在预置数据库中信息的存储方式可以如图2c所示,在预置数据库中,信息都是关联存储的,即以一个实体词为核心,将与其关联的信息以图2c所示的箭头关联起来,形成子图形式的信息存储。检索信息是指在预置数据库中检索得到的搜索语句对应的信息。在调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句之后,可以根据目标查询语句和目标实体类型在预置数据库中进行信息检索,以获取搜索语句对应的检索信息。具体地,可以在预置数据库根据目标查询语句进行查询,以得到目标实体类型的检索信息。本申请通过采用联合识别的方式,可以避免将语句的意图识别和实体识别分两步处理,能够提高线上系统的性能。本申请实施例提供的信息获取方法,通过获取搜索语句,通过预先训练得到的联合模型对搜索语句进行处理,确定搜索语句对应的目标搜索意图、目标实体词及目标实体词对应的目标实体类型,根据搜索意图与查询语句模板之间的对应关系,获取目标搜索意图对应的目标查询模板,调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句,根据目标查询语句和目标实体类型在预置数据库中进行信息检索,得到搜索语句对应的检索信息。本申请实施例通过预先训练的联合模型可以同时识别搜索语句的意图、实体和实体类型,实现了实体识别和意图理解的联合识别,能够提高线上系统的性能,节省了线上系统的开销,提高了问答系统的性能。实施例三参照图3,示出了本申请实施例提供的一种信息获取装置的结构示意图,该信息获取装置具体可以包括如下模块:搜索语句获取模块310,用于获取搜索语句;目标实体意图确定模块320,用于通过预先训练得到的联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型;目标查询模板获取模块330,用于根据搜索意图与查询语句模板之间的对应关系,获取所述目标搜索意图对应的目标查询模板;目标查询语句生成模块340,用于调用所述目标查询模板对所述目标实体词进行语句转换处理,生成所述目标实体词对应的目标查询语句;检索信息获取模块350,用于根据所述目标查询语句和所述目标实体类型在预置数据库中进行信息检索,得到所述搜索语句对应的检索信息。本申请实施例提供的信息获取装置,通过获取搜索语句,通过预先训练得到的联合模型对搜索语句进行处理,确定搜索语句对应的目标搜索意图、目标实体词及目标实体词对应的目标实体类型,根据搜索意图与查询语句模板之间的对应关系,获取目标搜索意图对应的目标查询模板,调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句,根据目标查询语句和目标实体类型在预置数据库中进行信息检索,得到搜索语句对应的检索信息。本申请实施例通过预先训练的联合模型可以同时识别搜索语句的意图、实体和实体类型,实现了实体识别和意图理解的联合识别,能够提高线上系统的性能,节省了线上系统的开销,提高了问答系统的性能。实施例四参照图4,示出了本申请实施例提供的另一种信息获取装置的结构示意图,该信息获取装置具体可以包括如下模块:训练样本获取模块410,用于获取至少一个查询类型对应的多个训练样本;所述多个训练样本包括不同查询类型的搜索语句,每个所述训练样本包含初始搜索意图和初始实体词;标注训练样本获取模块420,用于针对各所述查询类型,对所述查询类型对应的多个训练样本进行标注处理,得到标注训练样本;标注训练样本输入模块430,用于将各所述标注训练样本输入至初始联合模型;所述初始联合模型包括意图理解层和实体识别层;预测搜索意图确定模块440,用于调用所述意图理解层对所述标注训练样本进行意图识别处理,确定所述标注训练样本对应的预测搜索意图;预测实体词确定模块450,用于调用所述实体识别层对所述标注训练样本进行实体识别处理,确定所述标注训练样本对应的预测实体词;意图损失值计算模块460,用于根据所述预测搜索意图和所述初始搜索意图,计算得到所述意图理解层对应的意图损失值;实体损失值计算模块470,用于根据所述初始实体词和所述预测实体词,计算得到所述实体识别层对应的实体损失值;联合模型获取模块480,用于在所述意图损失值和所述实体损失值的和值处于预设范围内的情况下,将所述初始联合模型作为所述查询类型对应的联合模型;搜索语句获取模块490,用于获取搜索语句;目标实体意图确定模块4100,用于通过预先训练得到的联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型;目标查询模板获取模块4110,用于根据搜索意图与查询语句模板之间的对应关系,获取所述目标搜索意图对应的目标查询模板;目标查询语句生成模块4120,用于调用所述目标查询模板对所述目标实体词进行语句转换处理,生成所述目标实体词对应的目标查询语句;检索信息获取模块4130,用于根据所述目标查询语句和所述目标实体类型在预置数据库中进行信息检索,得到所述搜索语句对应的检索信息。可选地,所述目标实体意图确定模块4100包括:目标查询类型获取单元4101,用于获取所述搜索语句对应的目标查询类型;目标联合模型确定单元4102,用于根据所述目标查询类型,确定所述搜索语句对应的目标联合模型;目标实体意图确定单元4103,用于通过所述目标联合模型对所述搜索语句进行处理,确定所述搜索语句对应的目标搜索意图、目标实体词及所述目标实体词对应的目标实体类型。可选地,所述目标实体意图确定单元包括:目标搜索意图确定子单元,用于调用所述目标联合模型的目标意图识别层对所述搜索语句进行意图识别处理,确定所述搜索语句对应的目标搜索意图;目标实体类型确定单元,用于调用所述目标联合模型的目标实体识别层对所述搜索语句进行实体识别处理,确定所述搜索语句对应的目标实体词,及所述目标实体词对应的目标实体类型。可选地,所述查询类型包括:单一类值查询类型、函数查询类型、范围查询类型、最短路径查询类型、多级查询类型中的至少一种。本申请实施例提供的信息获取装置,通过获取搜索语句,通过预先训练得到的联合模型对搜索语句进行处理,确定搜索语句对应的目标搜索意图、目标实体词及目标实体词对应的目标实体类型,根据搜索意图与查询语句模板之间的对应关系,获取目标搜索意图对应的目标查询模板,调用目标查询模板对目标实体词进行语句转换处理,生成目标实体词对应的目标查询语句,根据目标查询语句和目标实体类型在预置数据库中进行信息检索,得到搜索语句对应的检索信息。本申请实施例通过预先训练的联合模型可以同时识别搜索语句的意图、实体和实体类型,实现了实体识别和意图理解的联合识别,能够提高线上系统的性能,节省了线上系统的开销,提高了问答系统的性能。对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。另外地,本申请实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的信息获取方法。本申请实施例还提供了一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的信息获取方法。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。以上对本申请所提供的一种信息获取方法、一种信息获取装置、一种电子设备及一种计算机可读存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1