表格问答数据处理及模型训练方法、电子设备及存储介质

文档序号:31871658发布日期:2022-10-21 19:36阅读:29来源:国知局
1.本技术实施例涉及人工智能
技术领域
:,尤其涉及一种表格问答数据处理方法、一种表格问答数据模型训练方法,以及对应的电子设备及计算机存储介质。
背景技术
::2.由于数据结构清晰、易于维护,表格/sql(structuredquerylanguage,结构化查询语言)数据库成为各行各业应用最普遍的结构化数据,也是智能对话系统和搜索引擎等的重要答案来源。传统表格查询需要专业技术人员撰写查询语句(如sql语句)来完成,因门槛高,阻碍了表格查询的大规模应用。而表格问答技术(也称为tableqa)通过将自然语言直接转换为sql语句,允许用户使用自然语言与表格或数据库直接交互,越来越被广泛使用。3.一个表格问答系统主要由三部分组成,包括自然语言理解部分、对话管理部分和自然语言生成部分。其中,自然语言理解部分主要执行语义解析算法,将自然语言问题转为对应可执行的sql语句;对话管理部分执行多轮的状态跟踪和策略优化;自然语言生成部分则根据解析出的sql语句和sql的执行结果生成对应的回复。4.对于自然语言理解部分,目前业界较为通用的方案是先训练一个预训练模型,然后在该预训练模型的基础上,引入下游模型进行text-to-sql任务微调。并且,在该任务微调过程中,通过一些人为定义的规则形成用于表征数据库模式数据中的模式项与自然语言查询语句中的分词的对应关系的模式链接图,以对模型训练进行引导,使得微调后的模型能够生成较为准确的sql语句。但是,这种方式却无法捕捉到非规则的、语义关联较强的模式链接信息。例如,其无法找到自然语言问题中的“北京”与模式数据中的“首都”之间的关联关系。从而,导致最终获得的模型在将自然语言转换为sql语句时,效果不佳。技术实现要素:5.有鉴于此,本技术实施例提供一种表格问答数据处理及其模型训练的方案,以至少部分解决上述问题。6.根据本技术实施例的第一方面,提供了一种表格问答数据处理方法,包括:获取自然语言查询语句对应的第一表征向量;基于问题-模式图获得所述第一表征向量对应的模式项向量,其中,所述问题-模式图用于表征自然语言查询语句中的分词与数据库模式项之间的关联关系,所述问题-模式图至少根据语义关联问题-模式子图预先生成,所述语义关联问题-模式子图为根据对自然语言查询语句样本和对应的数据库模式项数据样本进行掩码处理后获得的、两者之间的语义关联关系生成;基于所述第一表征向量和所述模式项向量获得第二表征向量,并基于所述第二表征向量转换生成对应的数据库查询语句。7.根据本技术实施例的第二方面,提供了一种表格问答数据模型训练方法,包括:基于自然语言查询语句样本和所述自然语言查询语句样本对应的数据库模式项数据样本,生成拼接向量;将所述拼接向量输入所述表格问答数据模型的预训练模型部分,通过所述预训练模型部分对所述拼接向量中的、所述自然语言查询语句样本对应的分词向量进行掩码,获得掩码向量;基于所述掩码向量进行掩码恢复处理,并根据掩码恢复处理后获得的掩码恢复向量与所述拼接向量之间的差异,确定所述模式项数据样本与所述分词向量对应的分词间的语义关联关系;通过所述表格问答数据模型的问题-模式图层,至少根据所述语义关联关系生成语义关联问题-模式子图;至少根据所述语义关联问题-模式子图和所述拼接向量,对所述表格问题数据模型进行训练。8.根据本技术实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述方法对应的操作。9.根据本技术实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的方法。10.根据本技术实施例的第五方面,提供了一种计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如第一方面或第二方面所述方法对应的操作。11.根据本技术实施例提供的方案,在确定自然语言查询语句对应的数据库模式项的模式项向量时,使用了基于语义关联问题-模式子图预先生成的问题-模式图,因语义关联问题-模式子图能够挖掘自然语言查询语句与数据库模式项之间的深层语义关联关系,因此,基于其生成的问题-模式图也可有效表征自然语言查询语句与数据库模式项之间的深层语义关联。由此,即使自然语言查询语句中的用词不够规则,也可准确确定出其对应的数据库模式项。与传统方式中通过人为定义的规则,依靠分词与模式项进行文字匹配生成的问题-模式图相比,本技术实施例中的问题-模式图能够对各种规则或非规则用词的自然语言查询语句进行处理,无需依赖人为定义的规则,既有效降低了模型实现成本,又可有效捕捉到非规则的、语义关联较强的模式链接信息,提高了表格问答数据处理模型将自然语言转换为数据库查询语句的准确度和效率。附图说明12.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。13.图1为适用本技术实施例方案的示例性系统的示意图;14.图2a为根据本技术实施例一的一种表格问答数据模型训练方法的步骤流程图;15.图2b为图2a所示实施例中的一种表格问答数据模型结构示意图;16.图2c为图2a所示实施例中的一种语义关联关系的确定过程的示意图;17.图3为根据本技术实施例二的一种表格问答数据处理方法的步骤流程图;18.图4为根据本技术实施例三的一种电子设备的结构示意图。具体实施方式19.为了使本领域的人员更好地理解本技术实施例中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术实施例一部分实施例,而不是全部的实施例。基于本技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本技术实施例保护的范围。20.下面结合本技术实施例附图进一步说明本技术实施例具体实现。21.图1示出了一种适用本技术实施例方案的示例性系统。如图1所示,该系统100可以包括云服务端102、通信网络104和/或一个或多个用户设备106,图1中示例为多个用户设备。22.云服务端102可以是用于存储信息、数据、程序和/或任何其他合适类型的内容的任何适当的设备,包括但不限于分布式存储系统设备、服务器集群、计算云服务端集群等。在一些实施例中,云服务端102可以执行任何适当的功能。例如,在一些实施例中,云服务端102中设置有表格问答系统,可以接收由用户设备106传输的自然语言查询语句,并通过该表格问答系统对该自然语言查询语句进行处理,以生成回复语句。作为可选的示例,在一些实施例中,云服务端102的表格问答系统可以基于问题-模式图,确定与自然语言查询语句的表征向量对应的数据库模式的模式项向量,进而基于该模式项向量和自然语言查询语句的表征向量生成新的表征向量,并将其转换为数据库查询语句。作为另一示例,在一些实施例中,云服务端102的表格问答系统中的问题-模式图至少根据语义关联问题-模式子图预先生成,该语义关联问题-模式子图为根据对自然语言查询语句样本和对应的数据库模式项数据样本进行掩码处理后获得的、两者之间的语义关联关系生成,基于此,表格问答系统可有效对使用非规则用词的自然语言查询语句进行处理。作为另一示例,在一些实施例中,云服务端102还将表格问答系统的处理结果,如针对自然语言查询语句的回复数据返回给用户设备106。此外,作为另一示例,在一些实施例中,云服务端102还可对表格问答系统中涉及的表格问答数据模型进行训练。23.在一些实施例中,通信网络104可以是一个或多个有线和/或无线网络的任何适当的组合。例如,通信网络104能够包括以下各项中的任何一种或多种:互联网、内联网、广域网(wan)、局域网(lan)、无线网络、数字订户线路(dsl)网络、帧中继网络、异步转移模式(atm)网络、虚拟专用网(vpn)和/或任何其它合适的通信网络。用户设备106能够通过一个或多个通信链路(例如,通信链路112)连接到通信网络104,该通信网络104能够经由一个或多个通信链路(例如,通信链路114)被链接到云服务端102。通信链路可以是适合于在用户设备106和云服务端102之间传送数据的任何通信链路,诸如网络链路、拨号链路、无线链路、硬连线链路、任何其它合适的通信链路或此类链路的任何合适的组合。24.用户设备106可以包括能够与用户进行交互,并呈现信息的任何一个或多个用户设备。在一些实施例中,用户设备106可以接收用户输入的文本形式或语音形式的自然语言查询语句并将其发送至云服务端102进行处理。在一些实施例中,用户设备106还可以接收云服务端102返回的结果,如回复数据,并向用户展示或播放。在一些实施例中,用户设备106可以包括任何合适类型的设备。例如,在一些实施例中,用户设备106可以包括移动设备、平板计算机、膝上型计算机、台式计算机、可穿戴计算机、游戏控制台、媒体播放器、车辆娱乐系统和/或任何其他合适类型的用户设备。25.基于上述系统,本技术实施例提供了一种表格问答数据处理方案,为便于说明,以下首先对表格问答数据模型的训练过程进行说明,再对基于训练完成的该表格问答数据模型实现的表格问答数据处理过程进行说明。26.实施例一27.以下,结合图2a-图2c,对本实施例的表格问答数据模型训练方法进行说明。28.其中,图2a示出了一种表格问答数据模型训练方法的步骤流程图,该步骤流程图所示的表格问答数据模型训练方法包括以下步骤:29.步骤s202:基于自然语言查询语句样本和所述自然语言查询语句样本对应的数据库模式项数据样本,生成拼接向量。30.其中,自然语言查询语句样本可以为在用户数据被授权许可使用的情况下,获得的历史用户查询请求对应的数据;或者,也可以为基于部分历史用户查询请求对应的数据,按照一定的扩充规则生成的扩充数据与所述部分历史用户查询请求对应的数据的集合。31.因基于表格问答系统进行查询的自然语言查询语句样本需访问至少一个数据库中的至少一个数据表,因此,其至少会与一个数据库和一个数据表的模式项相对应,该模式项即可作为该自然语言查询语句样本的数据库模式项数据样本。其中,模式项数据简称模式项,也可称为数据库的schema数据,是一组相互关联的数据库对象,用于表征数据库中的数据元素信息,如数据库中的表、表列、列的数据类型、值、索引、外键等信息。32.例如,自然语言查询语句样本为“显示成绩单的日期,至少显示几个结果,并列出具体的学号”,则其对应的数据库的模式项数据即数据库模式项数据样本可能包括“姓名/成绩单日期/学号/分数”。33.由上可见,自然语言查询语句样本和数据库模式项数据样本之间存在着关联关系,该关联关系也称为模式链接,是表格问答数据模型训练中的重要部分之一。基于此,可将自然语言查询语句样本和其对应的数据库模式项数据样本拼接生成拼接向量。在具体拼接时,可以在自然语言查询语句样本与数据库模式项数据样本之间、以及,数据库模式项数据样本中的各个数据库模式项之间,使用预设的分隔符如[/s]进行分隔,以更有序地组织数据。[0034]示例性地,如图2b的下方所示,自然语言查询语句样本示意为“whatarethenamesofthesingers...notfrench”,其对应的数据库模式项数据样本包括“singer”、“song”“citizenship”等,相应的数据之间使用[/s]分隔,并且以[s]表示向量开始,则,生成的拼接向量为“[s]whatarethenamesofthesingers...notfrench[/s]singer[/s]song…[/s]citizenship”对应的向量。该生成的拼接向量后续将被输入表格问答数据模型中的预训练模型部分进行处理。[0035]步骤s204:将拼接向量输入表格问答数据模型的预训练模型部分,通过预训练模型部分对拼接向量中的、自然语言查询语句样本对应的分词向量进行掩码,获得掩码向量;基于掩码向量进行掩码恢复处理,并根据掩码恢复处理后获得的掩码恢复向量与拼接向量之间的差异,确定模式项数据样本与分词向量对应的分词间的语义关联关系。[0036]为便于说明,以图2b所示的一种表格问答数据模型为示例进行说明。由图2b中可见,该表格问答数据模型包括预训练模型部分(plm部分)、问题-模式图层、编码器和解码器。[0037]本技术实施例中,预训练模型部分可采用相关技术中的预训练模型结构实现,本技术实施例对预训练模型的具体结构不作限制。该预训练模型部分除实现传统的将输入向量处理成为其对应的每一个标记token的表示向量也即分词向量(训练阶段,输入向量包括自然语言查询语句样本对应的向量和数据库模式项数据样本对应的向量,输出的向量包括对应的分词向量和模式项向量;推理阶段,输入向量包括自然语言查询语句,则输出的向量主要包括对应的分词向量)外,在训练阶段还会输出数据库模式项数据样本中的各个模式项的模式项向量与自然语言查询语句样本中的各个分词向量之间的语义关联关系,以此表征模式项向量对应的模式项和分词向量对应的分词之间的语义关联关系。[0038]在通过预训练模型部分获得模式项与分词间的语义关联关系时,本技术实施例采用了掩码方式,对输入预训练模型的拼接向量中的、自然语言查询语句样本对应的分词向量进行掩码,获得掩码向量;基于掩码向量进行掩码恢复处理,并根据掩码恢复处理后获得的掩码恢复向量与拼接向量之间的差异,确定模式项数据样本与分词向量对应的分词间的语义关联关系。[0039]其中,在一种可行方式中,通过预训练模型部分对拼接向量中的、自然语言查询语句对应的分词向量进行掩码,获得掩码向量可以实现为:对拼接向量中的、自然语言查询语句样本的每个分词对应的分词向量分别进行掩码,获得与分词数量相同数量的多个掩码向量。[0040]示例性地,假设自然语言查询语句样本中包括五个分词(也即五个分词token),该五个分词对应的五个分词向量分别为a,b,c,d,e。其中,分词token可以是字、词,也可以是短语。该自然语言查询语句样本对应的数据库模式项数据样本包括三个模式项(也即模式项token),其对应的模式项向量分别为x、y、z。两者拼接后的拼接向量示意为abcdexyz,则基于x、y、z,对自然语言查询语句样本中的五个分词向量分别进行掩码处理后,得到五个新的向量序列(即掩码向量),简单示意为:[0041][0042]基于此,可以针对每个掩码向量,进行掩码恢复处理,获得与当前掩码向量对应的掩码恢复向量;根据该掩码恢复向量中的、与当前模式项数据样本对应的模式项恢复向量与拼接向量中的当前模式项数据样本对应的模式项向量之间的差异,确定当前模式项数据样本与当前掩码向量中被掩码的分词之间的语义关联关系。在一种可行方式中,该差异可实现为相似度。若某个被掩码的分词与某个模式项之间具有较强的语义关联关系,则若该分词对应的分词分量被掩码形成掩码向量,进而被恢复后,因其对该模式项的较大影响,恢复后的掩码恢复向量中,模式项对应的模式项向量与掩码前原始的模式项向量应当具有较大差异,或者说相似度会较低。反之,若某个被掩码的分词与某个模式项之间的语义关联关系较弱,则掩码恢复向量中模式项对应的模式项向量与掩码前原始的模式项向量应当具有较小差异,或者说相似度会较高。[0043]例如,对上述五个掩码向量a、b、c、d、e分别进行掩码恢复处理,获得对应的掩码恢复向量,分别对应示意为a’、b’、c’、d’、e’。[0044]继而,针对x,分别比较其在a和a’中对应部分的相似度、其在b和b’中对应部分的相似度、其在c和c’中对应部分的相似度、其在d和d’中对应部分的相似度、其在e和e’中对应部分的相似度。假设,上述相似度结果分别为0.9,0.5,0.7,0.2,0.7,则可确定x与d具有较强的语义关联关系,可以将d确定为与x语义关联的分词。[0045]类似地,针对y,分别比较其在a和a’中对应部分的相似度、其在b和b’中对应部分的相似度、其在c和c’中对应部分的相似度、其在d和d’中对应部分的相似度、其在e和e’中对应部分的相似度。假设,上述相似度结果分别为0.3,0.5,0.7,0.9,0.9,则可确定y与a具有较强的语义关联关系,可以将a确定为与y语义关联的分词。[0046]针对z,分别比较其在a和a’中对应部分的相似度、其在b和b’中对应部分的相似度、其在c和c’中对应部分的相似度、其在d和d’中对应部分的相似度、其在e和e’中对应部分的相似度。假设,上述相似度结果分别为0.9,0.5,0.8,0.8,0.2,则可确定z与e具有较强的语义关联关系,可以将e确定为与z语义关联的分词。[0047]在此基础上,可以通过表格问答数据模型的问题-模式图层,根据自然语言查询语句样本中各分词及各分词之间的结构关系、各模式项数据样本及各模式项数据样本之间的结构关系,以及确定的语义关联关系,生成语义关联问题-模式子图。[0048]通过上述方式获得的语义关联问题-模式子图能够捕捉到分词与模式项之间具有较强关联关系的语义关联信息,例如,分词“北京”和模式项“首都”,这种通过常规方式无法建立关联关系的信息。[0049]上述过程的一个处理示例如图2c所示,在图2c中,q1-q4为自然语言查询语句样本中的分词向量,s1-s3为模式项向量。对于s2来说,如果想知道自然语言查询语句样本中的哪个分词token对其影响最大,可以先获得s2的原始表征向量h2,然后对分词token中的某个token,示例为q2进行掩码处理,形成掩码向量[q1、mask、q3、q4、s1、s2、s3]。之后,再对[q1、mask、q3、q4、s1、s2、s3]进行掩码恢复,然后比较掩码恢复后获得的新的s2的表征h2'和h2之间的距离,如果该距离大于某个阈值(可由本领域技术人员根据实际需求设定,如0.7),即代表q2和s2这两个token之间强语义相关,具有语义关联关系。[0050]步骤s206:通过表格问答数据模型的问题-模式图层,至少根据语义关联关系生成语义关联问题-模式子图。[0051]在确定了所述语义关联关系后,即可基于此构建语义关联问题-模式子图。后续,即可将该语义关联问题-模式子图作为问题-模式图层所构建的图。例如,根据自然语言查询语句样本中各个分词之间的结构关系、数据库模式项数据样本中各个模式项之间的结构关系,以及所述语义关联关系,构建语义关联问题-模式子图。[0052]其中,各个分词token之间的结构关系用于指示各个分词向量对应的分词在自然语言查询语句样本内部的结构的关联关系,在具体获得时,可以将自然语言查询语句样本对应的向量部分通过句法解析器/语法解析器得到一个具有句法结构/语法结构的输出,然后利用该输出的结构(分词token间关联关系)作为自然语言查询语句中各个分词token之间的边(其中,一个分词token对应于一个分词)。各个模式项token之间的结构关系用于指示各个模式项在数据库模式项数据样本内部的结构的关联关系,在具体获得时,可以基于数据库模式项数据自身的关系信息获得,如数据库中的外键关系等。各个分词token和各个模式项token之间的语义关联关系用于指示多个分词token与多个模式项数据之间的模式链接。为便于与后续关联匹配关系进行区分,该模式链接在本技术实施例中也称为第一模式链接。在构建语义关联问题-模式图时,以各个token为图的节点,各个分词token之间的结构关系为各个分词token之间的边,各个模式项token之间的结构关系为各个模式项token之间的边,各个分词token和各个模式项token之间的语义关联关系为分词token节点和模式项token节点之间的边。[0053]但可选地,问题-模式图层在表格问答数据模型训练阶段,除可以基于预训练模型部分输出的各个分词token和各个模式项token间的语义关联度,构建语义关联问题-模式子图外,还可以构建关联匹配问题-模式子图,并基于该关联匹配问题-模式子图和语义关联问题-模式子图构建该问题-模式图层的总的问题-模式图,以使构建出的问题-模式图能够更为全面和准确地反映向量间的关系。也即,可以通过表格问答数据模型的问题-模式图层,至少根据语义关联关系生成语义关联问题-模式子图,并且,至少根据自然语言查询语句样本中的分词和模式项数据样本的相似度匹配生成关联匹配问题-模式子图;根据语义关联问题-模式子图和关联匹配问题-模式子图生成问题-模式图。[0054]其中,关联匹配问题-模式子图可以通过比对自然语言查询语句样本中的各个分词和各个模式项数据样本来获得它们之间的相似度,并基于此进行构建。例如,将自然语言查询语句样本“显示成绩单的日期,至少显示几个结果,并列出具体的学号”中的分词“成绩单”、“日期”、“学号”与数据库模式项数据样本“姓名”、“成绩单”、“日期”、“学号”、“分数”进行比对,可以发现两者中的“成绩单”、“日期”、“学号”均能够比对上,也即,自然语言查询语句样本中的“成绩单”、“日期”、“学号”与数据库模式项数据样本中的三个模式项“成绩单”、“日期”、“学号”存在关联匹配。基于自然语言查询语句样本中的各个分词token和各个模式项token,以及它们之间的关联匹配关系,即可构建出关联匹配问题-模式子图。其中,各个token为图的节点,各个分词token之间的结构关系为各个分词token之间的边,各个模式项token之间的结构关系为各个模式项token之间的边,各个分词token和各个模式项token之间的关联匹配关系为分词token节点和模式项token节点之间的边。[0055]其中,各个分词token和各个模式项token之间的关联匹配关系用于指示多个分词token与多个模式项数据之间的模式链接,该模式链接在本技术实施例中也称为第二模式链接。在具体获得该模式链接时,可以通过完全/部分匹配的规则产生(比如表名的完全匹配、表名的部分匹配、列名的全部匹配,列名的部分匹配等)。示例性地,在自然语言查询语句样本“显示成绩单的日期,至少显示几个结果,并列出具体的学号/姓名/成绩单日期/学号/分数”中,会将自然语言查询语句样本中的[成绩单的日期]对应的分词token与数据库模式项样本中的[成绩单日期]这一模式项对应的模式项token进行关联,产生图中的边。[0056]在基于语义关联问题-模式子图和关联匹配问题模式子图的融合时,可以根据两个子图中节点的对应关系,将其中一个子图的信息融合进行另一子图,包括:将语义关联问题-模式子图中有而关联匹配问题-模式子图中没有的节点加入关联匹配问题-模式子图,将语义关联问题-模式子图中有而关联匹配问题-模式子图中没有的边加入关联匹配问题-模式子图中相应的节点之间。反之,亦可。[0057]如图2b中所示,其左下角示出了语义关联问题-模式子图,左上角示出了关联匹配问题模式子图,将两者进行融合生成中间的问题-模式图,由图中可见,语义关联问题-模式子图中“french”和“citizenship”之间的边被融合进行了关联匹配问题模式子图中,形成了最终的问题-模式图。[0058]步骤s208:至少根据语义关联问题-模式子图和拼接向量,对表格问题数据模型进行训练。[0059]在构建了问题-模式图之后,可以基于预训练模型部分对拼接向量处理后输出的对应的输出向量及该问题-模式图,将其作为编码器的输入,通过编码器进行图学习,获得对应的编码向量。如图2b中所示,问题-模式图中相应的信息将被输入编码器中,使得编码器能够进行更好地学习,从而更有助于提升表格问答数据模型的准确率和鲁棒性。[0060]在一个示例中,可以采用基于注意力机制的编码器,例如,使用transformer结构的编码器,其可包括多层(如六层),每一层的操作如下:[0061][0062][0063][0064][0065][0066]其中,代表每一层基于attention(注意力计算)的输出,h代表attention(注意力计算)的头数,xi,xj分别代表自然语言查询语句样本和数据库模式项数据样本通过预训练模型部分输出的输出向量;表示可学习的神经网络参数;h是一个超参数,表示attention头的数量;dz表示向量的维度(比如64、128等),rij表示在图中的i和j的边类向量,对于图构造中的每一种关系用一个独特的向量表示(有多少种关系就有多少个向量),比如i和j可能是表名完全匹配的关系,则rij就是r_{表名完全匹配}向量;代表归一化后的结果,代表不同的attention(注意力计算)头拼接后的结果,concat代表拼接函数,layernorm代表层归一化函数,fc代表全连接函数,relu代表激活函数,代表第i层的中间过程表示,yi表示第i层的输出向量。[0067]经过学习的编码器将输出携带有更准确和丰富的token间关系的编码向量,进而,该编码向量将被输入至表格问答数据模型的解码器(如图2b中所示),获得预测数据库查询语句。示例性地,如图2b中所示的“selectsinger.namefromsingerwheresinger.citizenship!=‘french’”。[0068]将该预测数据库查询语句与自然语言查询语句样本对应的数据库查询语句标签(label)进行比较,根据两者的差异对表格问答数据模型进行训练。[0069]通过本实施例,使得表格问答数据模型的预训练模型部分能够有效挖掘出模式项数据样本与自然语言查询语句样本中的分词间的语义关联关系,尤其是在自然语言查询语句样本中存在非规则用词情况下的语义关联关系,从而使得问题-模式图层构建出的问题-模式图能够更为全面和准确地表征各个token间的关系,进而提升了表格问答数据模型的训练效果,使得训练出的表格问答数据模型更具鲁棒性,并且具有更高的准确率。[0070]实施例二[0071]本实施例基于实施例一中训练完成的表格问答数据模型,着重从该模型应用的角度对本技术实施例的表格问答数据处理方法进行说明。[0072]参照图3,示出了根据本技术实施例二的一种表格问答数据处理方法的步骤流程图。该流程图示出的表格问答数据处理方法包括以下步骤:[0073]步骤s302:获取自然语言查询语句对应的第一表征向量。[0074]其中,自然语言查询语句可以为任意适当的、需基于表格问答数据模型进行处理的语句,通常为请求语句。示例性地,如,“whatarethenamesofsingers…notfrench”。当然,该语句仅为示例,在具体实用中,其可为任意语言的查询语句。[0075]在基于实施例一中训练完成的表格问答数据处理模型实现本步骤时,可以通过预训练模型部分(即plm部分)将自然语言查询语句处理为对应的第一表征向量,该第一表征向量中包括自然语言查询语句的各个分词的分词向量。[0076]步骤s304:基于问题-模式图获得第一表征向量对应的模式项向量。[0077]其中,该问题-模式图参照实施例一中所描述的方式构建,可用于表征自然语言查询语句中的分词与数据库模式项之间的关联关系。并且,如前所述,该问题-模式图至少根据语义关联问题-模式子图预先生成,该语义关联问题-模式子图为根据对自然语言查询语句样本和对应的数据库模式项数据样本进行掩码处理后获得的、两者之间的语义关联关系生成。[0078]但同样如前所述,该问题-模式图也可以根据语义关联问题-模式子图和关联匹配问题-模式子图的融合结果生成。其中,关联匹配问题-模式子图为根据自然语言查询语句样本中的分词和对应的数据库模式数据样本中的模式项的相似度匹配结果生成。语义关联问题-模式子图和关联匹配问题-模式子图根据图中节点的节点信息进行融合,以生成问题-模式图。[0079]将分词向量输入问题-模式图层中后,可将分词向量与图中的节点进行匹配,基于匹配结果获得模式项向量。在具体实现时,可以根据第一表征向量获得自然语言查询语句中的各分词对应的分词向量和各分词向量间的结构关系;根据各分词向量及各分词向量间的结构关系,查找问题-模式图,确定各分词向量在问题-模式图中对应的分词节点,和,各分词向量间的结构关系在问题模式图中对应的分词节点之间的边;在问题-模式图中,确定与分词节点和边关联的模式项节点和模式项节点之间的边;根据确定的模式项节点和模式项节点之间的边,获得第一表征向量对应的模式向量。[0080]示例性地,如图2b中的问题-模式图所示,当自然语言查询语句“whatarethenamesofsingers…notfrench”中的分词“names”、“singers”、“french”,以及三者之间的结构关系,被输入问题模式图层后,其将匹配到图中的“names”、“singers”、“french”三个节点。进而,确定其中的“singers”和“french”关联有模式项向量,分别为“singer”和“citizenship”。则,基于此,可确定第一表征向量对应的模式项向量包括:与“singers”对应的“singer”和与“french”对应的“citizenship”,且,“singer”和“citizenship”之间具有结构关系,这些信息都将携带在模式向量中输出。[0081]步骤s306:基于第一表征向量和模式项向量获得第二表征向量,并基于第二表征向量转换生成对应的数据库查询语句。[0082]在获得了模式向量后,该模式向量将和第一表征向量进行拼接,然后输入至编码器,通过编码器的编码处理后输出为第二表征向量。进而,该第二表征向量被输入至解码器,通过解码器的解码处理,转换为数据库查询语句,如“selectsinger.namefromsingerwheresinger.citizenship!=‘french’”。[0083]可见,通过本实施例,在确定自然语言查询语句对应的数据库模式项的模式项向量时,使用了基于语义关联问题-模式子图预先生成的问题-模式图,因语义关联问题-模式子图能够挖掘自然语言查询语句与数据库模式项之间的深层语义关联关系,因此,基于其生成的问题-模式图也可有效表征自然语言查询语句与数据库模式项之间的深层语义关联。由此,即使自然语言查询语句中的用词不够规则,也可准确确定出其对应的数据库模式项。与传统方式中通过人为定义的规则,依靠分词与模式项进行文字匹配生成的问题-模式图相比,本技术实施例中的问题-模式图能够对各种规则或非规则用词的自然语言查询语句进行处理,无需依赖人为定义的规则,既有效降低了模型实现成本,又可有效捕捉到非规则的、语义关联较强的模式链接信息,提高了表格问答数据处理模型将自然语言转换为数据库查询语句的准确度和效率。[0084]此外,需要说明的是,本实施例中各个步骤的描述较为简单,其具体实现可参照实施例一中相关部分的描述。[0085]实施例三[0086]参照图4,示出了根据本技术实施例五的一种电子设备的结构示意图,本技术具体实施例并不对电子设备的具体实现做限定。[0087]如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(communicationsinterface)404、存储器(memory)406、以及通信总线408。[0088]其中:[0089]处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。[0090]通信接口404,用于与其它电子设备或服务器进行通信。[0091]处理器402,用于执行程序410,具体可以执行上述方法实施例中的相关步骤。[0092]具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。[0093]处理器402可能是cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本技术实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。[0094]存储器406,用于存放程序410。存储器406可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。[0095]程序410具体可以用于使得处理器402执行前述多个方法实施例中任一实施例所描述的方法对应的操作。[0096]程序410中各步骤的具体实现可以参见上述方法实施例中的相应步骤和单元中对应的描述,并具有相应的有益效果,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。[0097]本技术实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令指示计算设备执行上述多个方法实施例中的任一方法对应的操作。[0098]需要指出,根据实施的需要,可将本技术实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本技术实施例的目的。[0099]上述根据本技术实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如cdrom、ram、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如asic或fpga)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,ram、rom、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的方法。此外,当通用计算机访问用于实现在此示出的方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的方法的专用计算机。[0100]本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术实施例的范围。[0101]以上实施方式仅用于说明本技术实施例,而并非对本技术实施例的限制,有关
技术领域
:的普通技术人员,在不脱离本技术实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本技术实施例的范畴,本技术实施例的专利保护范围应由权利要求限定。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1