时间解析方法、装置、电子设备及存储介质与流程

文档序号:23132444发布日期:2020-12-01 13:06阅读:105来源:国知局
时间解析方法、装置、电子设备及存储介质与流程

本申请涉及人工智能技术领域,例如涉及一种时间解析方法、装置、电子设备及存储介质。



背景技术:

目前,在很多人工智能问答领域的业务场景,对用户所提问的问句中的时间因素的准确识别尤为重要。相关技术主要采用机器学习、深度学习等方式进行时间因素的识别。

在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:

相关技术存在时间因素信息的识别错误率较高、识别结果不准确等缺陷。



技术实现要素:

为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。该概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。

本公开实施例提供了一种时间解析方法、装置、电子产品及存储介质,以解决相关技术存在时间因素信息的识别错误率较高、识别结果不准确的技术问题。

本公开实施例提供了一种时间解析方法,包括:

获取待解析的至少一个目标问答语句;

利用预先构建好的规则数据库和预先训练好的crf模型,对所述目标问答语句进行解析,得到目标问答语句的目标解析结果,其中,解析结果包括目标问答语句中的目标时间因素。

在一些实施例中,利用预先构建好的规则数据库和预先训练好的crf模型,对目标问答语句进行解析,得到目标问答语句的目标解析结果,包括:

在利用预先建立好的规则数据库识别出目标问答语句中的目标时间因素的情况下,根据目标时间因素确定目标解析结果;

在利用预先建立好的规则数据库未识别出目标问答语句中的目标时间因素的情况下,将目标问答语句输入到预先训练好的crf模型,以使预先训练好的crf模型输出时间因素的更新数据的识别结果。

在一些实施例中,还包括:

在根据识别结果确定识别到时间因素的更新数据的情况下,利用更新数据对规则数据库进行更新。

在一些实施例中,还包括:

按照标准时间格式,对目标时间因素的时间格式进行转换,得到标准时间格式的目标时间因素;

对标准时间格式的目标时间因素的进行分析处理,得到标准时间格式的目标时间因素对应的目标时间类型。

在一些实施例中,规则数据库通过以下方式进行构建:

获取包含至少一个历史时间因素的多个历史问答语句;

根据历史问答语句和历史时间因素的映射关系,构建规则数据库。

在一些实施例中,预先训练好的crf模型通过以下方式进行训练:

获取包含历史时间因素的历史问答语句和历史解析结果;

对历史问答语句进行标注,得到标注后的问答语句;

将标注后的问答语句作为训练语料输入到初始crf模型,以使初始crf模型输出解析结果;

在解析结果与历史解析结果的相似度大于设定的相似度阈值的情况下,初始crf模型训练成功,得到预先训练好的crf模型;

在解析结果与历史解析结果的相似度小于或等于设定的相似度阈值的情况下,通过调整初始crf模型中的参数,继续对初始crf模型进行训练,直至初始crf模型训练成功。

本公开实施例还提供了一种时间解析装置,包括:

获取单元,被配置为获取待解析的至少一个目标问答语句;

解析单元,被配置为利用预先构建好的规则数据库和预先训练好的crf模型,对目标问答语句进行解析,得到目标问答语句的目标解析结果,其中,解析结果包括目标问答语句中的目标时间因素。

在一些实施例中,解析单元包括:

时间因素识别单元,被配置为在利用预先建立好的规则数据库识别出目标问答语句中的目标时间因素的情况下,根据目标时间因素确定目标解析结果;

更新数据识别单元,被配置为在利用预先建立好的规则数据库未识别出目标问答语句中的目标时间因素的情况下,将目标问答语句输入到预先训练好的crf模型,以使预先训练好的crf模型输出时间因素的更新数据的识别结果。

本公开实施例还提供了一种电子设备,包括处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行上述的方法。

本公开实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的时间解析方法的步骤。

本公开实施例提供的一种时间解析方法、装置、电子设备及存储介质,可以实现以下技术效果:

通过利用规则数据库和预先训练好的crf模型相结合对目标问答语句进行解析的方法,提高了解析结果的准确率。

以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。

附图说明

至少一个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:

图1是本公开实施例提供的一种时间解析方法的流程示意图;

图2是本公开实施例提供的另一种时间解析方法的流程示意图;

图3是本公开实施例提供的另一种时间解析方法的流程示意图;

图4是本公开实施例提供的另一种时间解析方法的流程示意图;

图5是本公开实施例提供的另一种时间解析方法的流程示意图;

图6是本公开实施例提供的一种时间解析装置的结构示意图;

图7是本公开实施例提供的电子设备的结构示意图。

具体实施方式

为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,至少一个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。

参见图1,在一些实施例中,本公开实施例提供了一种时间解析方法,可以包括:

s101、获取待解析的至少一个目标问答语句;

目标问答语可以是用户通过语音等方式输入的与时间相关的提问问句,例如,可以输入到智能设备,通过智能设备对用户的问句进行语音识别。

s102、利用预先构建好的规则数据库和预先训练好的crf(conditionalrandomfield,条件随机场)模型,对所述目标问答语句进行解析,得到目标问答语句的目标解析结果,其中,解析结果包括目标问答语句中的目标时间因素。

目标时间因素可以是目标问答语句中跟时间相关的因素,例如,可以包括:今天、今日、去年、这个月等。

参见图2,在一些实施例中,步骤s102、利用预先构建好的规则数据库和预先训练好的crf模型,对目标问答语句进行解析,得到目标问答语句的目标解析结果,包括:

s201、在利用预先建立好的规则数据库识别出目标问答语句中的目标时间因素的情况下,根据目标时间因素确定目标解析结果;

s202、在利用预先建立好的规则数据库未识别出目标问答语句中的目标时间因素的情况下,将目标问答语句输入到预先训练好的crf模型,以使预先训练好的crf模型输出时间因素的更新数据的识别结果。

当利用规则数据库识别出目标时间因素时,则该目标时间因素可以作为目标问答语句的目标解析结果;当利用规则数据库未识别出目标时间因素时,通过预先训练好的crf模型来识别目标问答语句中的新的时间因素。

可选地,在根据上述识别结果确定识别到时间因素的更新数据的情况下,利用更新数据对规则数据库进行更新。

这样,如果预先训练好的crf模型识别到了新的时间因素,则将新的时间因素加入到规则数据库,对规则数据库中的数据进行更新,以丰富规则数据库中现有的时间因素,解析方式更加灵活,便于规则数据库维护,可以提高后续的解析结果准确率。

参见图3,在一些实施例中,本公开实施例还提供了另一种时间解析方法,包括:

s301、按照标准时间格式,对目标时间因素的时间格式进行转换,得到标准时间格式的目标时间因素。

通过规则数据库一方面通过时间提取正则表达式将目标问答语句中的目标时间因素提取出来,另一方面,还可以将该目标时间因素由非标准化的时间格式转换为标准化的时间格式。例如,将“今天”这个时间转换为“xxxx年/xx月/xx日”这种标准化的时间格式。又如,“前天”采用“systime,day,-,1,ymd”的标准化的时间格式,其中,参数1”systime”表示当前的系统时间,可以在当前系统时间上进行加减操作;参数2“day”表示时间计算的粒度,比如“前天”这个时间表述,“day”表示的就是在今天的基础上减去一天,在”天“上操作;参数3“—”表示当前时间的计算方式,包括加和减操作;参数4“1”为参数3加减的值;参数5为标准时间返回的粒度,y为年,m为月,d为日。

通过对目标时间因素的时间格式的转换,可以更灵活的对目标问答问句中的时间进行标准化,实现了灵活的可配置化。其中各个参数是为了能够灵活的解析新的时间类型,从而实现了时间解析的可配置化。

s302、对标准时间格式的目标时间因素的进行分析处理,得到标准时间格式的目标时间因素对应的目标时间类型。

通过将用户输入的目标问答语句中的口语化的时间格式转为标准化的时间格式之后,还可以分析出目标问答语句中所表述的时间类型,可以将时间类型分为四种,分别为具体的某个时间点,比如2019年9月;两个时间点之间的比较,比如“2019年9月比2019年10月”,某个时间段,比如“2019年9月至2019年10月”;两个时间段之间的比较,比如“这周比上周”;根据这四种时间类型,梳理出时间类型字典,如表2;一方面将转换后的标准时间格式经过特殊字符@代替,形成一定的模式,比如“2019年9月比2019年10月“,经过替换后,形成”@比@“这种模式,另一方面可以将标准时间格式的目标时间因素所对应的时间类型,“@比@”就表示“两个时间点进行比较”的类型。

参见图4,在一些实施例中,规则数据库通过以下方式进行构建:

s401、获取包含至少一个历史时间因素的多个历史问答语句。

例如,历史问答语句可以包括“前天s86井的产油量是多少”、“ad7缝洞单元2007年的产水量?”等。历史问答语句中的“前天”、“2007”即为历史时间因素。

s402、根据历史问答语句和历史时间因素的映射关系,构建规则数据库。

参见图5,在一些实施例中,预先训练好的crf模型通过以下方式进行训练:

s501、获取包含历史时间因素的历史问答语句和历史解析结果。

s502、对历史问答语句进行标注,得到标注后的问答语句。

通过对历史问答语句进行标注,使得标注后的问答语句为crf算法能够识别的格式,例如,可以采用以下标注方式:tk002井nn|这btime|一mtime|年etime|产液量nn|是多少nn|?nn。

s503、将标注后的问答语句作为训练语料输入到初始crf模型,以使初始crf模型输出解析结果。

s504、判断解析结果与历史解析结果的相似度是否大于设定的相似度阈值;在解析结果与历史解析结果的相似度大于设定的相似度阈值的情况下,执行步骤s505;在解析结果与历史解析结果的相似度小于或等于设定的相似度阈值的情况下,执行步骤s506。

例如,相似度阈值可以为85%,若相似度为65%,则说明相似度小于相似度阈值,初始crf模型训练失败;若相似度为90%,则说明相似度大于相似度阈值,初始crf模型训练成功。可以根据实际需求设置相似度阈值。

s505、初始crf模型训练成功,得到预先训练好的crf模型。

s506、通过调整初始crf模型中的参数,继续对初始crf模型进行训练,直至初始crf模型训练成功。

参见图6,本公开实施例还提供了一种时间解析装置,包括:

获取单元601,被配置为获取待解析的至少一个目标问答语句;

解析单元602,被配置为利用预先构建好的规则数据库和预先训练好的crf模型,对目标问答语句进行解析,得到目标问答语句的目标解析结果,其中,解析结果包括目标问答语句中的目标时间因素。

在一些实施例中,解析单元602包括:

时间因素识别单元,被配置为在利用预先建立好的规则数据库识别出目标问答语句中的目标时间因素的情况下,根据目标时间因素确定目标解析结果;

更新数据识别单元,被配置为在利用预先建立好的规则数据库未识别出目标问答语句中的目标时间因素的情况下,将目标问答语句输入到预先训练好的crf模型,以使预先训练好的crf模型输出时间因素的更新数据的识别结果。

本公开实施例提供了一种电子设备,其结构如图7所示,包括:

处理器(processor)700和存储器(memory)701,还可以包括通信接口(communicationinterface)702和总线703。其中,处理器700、通信接口702、存储器701可以通过总线703完成相互间的通信。通信接口702可以用于信息传输。处理器700可以调用存储器701中的逻辑指令,以执行上述实施例的时间解析方法。

此外,上述的存储器701中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。

存储器701作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器700通过运行存储在存储器701中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的时间解析方法。

存储器701可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器701可以包括高速随机存取存储器,还可以包括非易失性存储器。

本公开实施例提供了一种产品(例如:计算机、手机等),包含上述的时间解析装置。

本公开实施例提供的一种时间解析方法、装置、电子设备及存储介质,通过利用规则数据库和预先训练好的crf模型相结合对目标问答语句进行解析的方法,提高了解析结果的准确率。

本公开实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,该计算机可执行指令设置为执行上述时间解析方法。

本公开实施例提供了一种计算机程序产品,包括存储在计算机可读存储介质上的计算机程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使上述计算机执行上述时间解析方法。

上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。

本公开实施例提供的计算机可读存储介质和计算机程序产品,通过利用规则数据库和预先训练好的crf模型相结合对目标问答语句进行解析的方法,提高了解析结果的准确率。

本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括至少一个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例的方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。

本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。本领域技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含至少一个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1