数据方法、电子装置及计算机可读存储介质与流程

文档序号:17080337发布日期:2019-03-09 00:11阅读:162来源:国知局
数据方法、电子装置及计算机可读存储介质与流程

本发明涉及数据查询技术领域,具体涉及一种数据查询方法、电子装置及计算机可读存储介质。



背景技术:

目前,在用户进行数据查询(例如:查询人口分布、查询男女比例、查询工资分布等)等的时候,在查询界面上一般都会设置多个选择项,用户按照自己的查询意图,在选择项中进行选择(例如,选择目标地区、选择目标人群等等)。对于服务器而言,将用户选择的查询项形成用户的查询内容,基于查询内容得到查询结果。

然而,因为是通过选择查询项的方式进行搜索,这就将导致,用户只能按照选择项中所提供的选择项进行选择,在选择项太少的时候,用户的选择范围会受到限制,在选择项过多的时候,用户在选择选择项的时候,选择的操作比较复杂。

针对现有的数据查询中所存在的操作复杂的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明的目的在于提供一种数据查询方法、电子装置及计算机可读存储介质,进而解决现有的数据查询过程中所存在的操作过于复杂的技术问题。

本发明是通过下述技术方案来解决上述技术问题:

根据本发明的一个方面,提供了一种数据查询方法,包括如下步骤:

获取用户输入的自然语言数据;

从所述自然语言数据中提取出意图参数,其中,所述意图参数包括:人群范围数据和/或提问维度数据;

根据所述意图参数作为用户输入的自然语言数据对应的查询条件;

根据所述查询条件匹配得到查询结果。

在一个实施方式中,获取用户输入的自然语言数据,包括:

获取用户在查询框中输入的文字内容;

将所述文字内容作为所述用户输入的自然语言数据:

或者,

获取用户通过语音输入设备输入的语音数据;

通过语言识别模式识别出所述语音数据的文字内容;

将所述文字内容作为所述用户输入的自然语言数据。

在一个实施方式中,从所述自然语言数据中提取出意图参数,包括:

对所述自然语言数据进行切词处理,得到多个分词;

将所述多个分词逐个与预先建立的意图参数表格中各个词语进行匹配,其中,所述意图参数表格中存储有多个人群范围数据词语和提问维度数据词语;

将匹配成功的分词作为意图参数。

在一个实施方式中,在从所述自然语言数据中提取出意图参数之后,所述方法还包括:

采用标记的方式,显示提取出的意图参数中的人群范围数据和提问维度数据;

接收用户对显示的人群范围数据和提问维度数据的确认操作;

响应于用户的确认操作,确定提取的意图参数为用户输入的意图参数。

在一个实施方式中,在根据所述查询条件匹配得到查询结果之后,所述方法还包括:

获取用户选择的查询结果显示方式;

根据所述显示方式,采用可视化的方式,显示所述查询结果。

在一个实施方式中,所述显示方式包括以下至少之一:饼图、柱状图、曲线图。

根据本发明的另一个方面,提供了一种电子装置,包括存储器和处理器,所述存储器用于存储可被所述处理器执行的数据查询系统,所述数据查询系统包括:

获取模块,用于获取用户输入的自然语言数据;

提取模块,用于从所述自然语言数据中提取出意图参数,其中,所述意图参数包括:人群范围数据和提问维度数据;

生成模块,用于将所述意图参数作为用户输入的自然语言数据对应的查询条件;

匹配模块,用于根据所述查询条件匹配得到查询结果。

在一个实施方式中,所述提取模块包括:

分词单元,用于对所述自然语言数据进行切词处理,得到多个分词;

匹配单元,用于将所述多个分词逐个与预先建立的意图参数表格中各个词语进行匹配,其中,所述意图参数表格中存储有多个人群范围数据词语和提问维度数据词语;

生成单元,用于将匹配成功的分词作为意图参数。

在一个实施方式中,在从所述自然语言数据中提取出意图参数之后,上述数据查询系统具体可以采用标记的方式,显示提取出的意图参数中的人群范围数据和提问维度数据;接收用户对显示的人群范围数据和提问维度数据的确认操作;响应于用户的确认操作,确定提取的意图参数为用户输入的意图参数。

在一个实施方式中,在根据所述查询条件匹配得到查询结果之后,数据查询系统可以获取用户选择的查询结果显示方式;根据所述显示方式,采用可视化的方式,显示所述查询结果。

在一个实施方式中,上述显示方式可以包括但不限于以下至少之一:饼图、柱状图、曲线图。

根据本发明的一个方面,提供了一种计算机设备,包括:存储器和处理器,其中,所述处理器用于执行上述方法的步骤。

根据本发明的一个方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述方法的步骤。

本发明的积极进步效果在于:直接获取用户输入的自然语言数据,然后从自然语言数据中提取出意图参数,并根据意图参数生成用户输入的自然语言数据对应的查询条件,从而匹配得到查询结果。即,用户在有查询需求的时候,不需要从选择项中选择,只需要输入自然语言即可,从而解决了现有的查询过程过于繁琐的问题,达到了简单高效实现意图查询的技术效果。

附图说明

图1是根据本发明实施例的数据查询方法的方法流程图;

图2是根据本发明实施例的数据查询的场景示例图;

图3是根据本发明实施例的数据查询的结果展示选择示例图;

图4是根据本发明实施例的数据查询系统的结构框图;

图5是根据本发明实施例的数据查询系统的另一结构框图;

图6是根据本发明实施例的电子装置的一种可选的硬件架构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

考虑到现有的查询方式一般都是预先设置多个选择项,然后用户在查询项中进行选择,以最终形成查询内容,得到查询结果,这就导致用户只能在选择项中进行选择,无法简单高效完成查询。

基于此,在本例中,考虑到如果用户可以基于自然语言表达查询内容,对于服务器而言直接根据用户的自然语言生成查询结果,那么将使得用户的查询操作变得简单高效。

为此,在本例中提供了一种意图识别和查询方法、电子设备,下面对该意图识别和查询方法和电子设备进行具体说明如下:

实施例一

下面结合附图对本发明提供的意图识别和查询方法进行说明。

图1为本发明数据查询方法的一种可选的流程示意图,如图1所示,该方法可以包括以下步骤s01-s04:

步骤s01:获取用户输入的自然语言数据;

步骤s02:从所述自然语言数据中提取出意图参数,其中,所述意图参数包括:人群范围数据和/或提问维度数据;

步骤s03:将所述意图参数作为用户输入的自然语言数据对应的查询条件;

步骤s04:根据所述查询条件匹配得到查询结果。

在上例中,直接获取用户输入的自然语言数据,然后从自然语言数据中提取出意图参数,并根据意图参数生成用户输入的自然语言数据对应的查询条件,从而匹配得到查询结果。即,用户在有查询需求的时候,不需要从选择项中选择,只需要输入自然语言即可,从而解决了现有的查询过程过于繁琐的问题,达到了简单高效实现意图查询的技术效果。

为了使得用户的查询操作变得更为简单,可以提供多种用户输入自然语言的方式,例如,可以在搜索框中输入文字,或者是采用语音输入的方式,等等。具体的,获取用户输入的自然语言数据,可以包括但不限于以下方式之一:

方式1)获取用户在查询框中输入的文字内容,将所述文字内容作为所述用户输入的自然语言数据:

方式2)获取用户通过语音输入设备输入的语音数据,通过语言识别模式识别出所述语音数据的文字内容,将所述文字内容作为所述用户输入的自然语言数据。

通过提供了语音输入和文字输入两种方式,使得用户属于查询内容的方式更为多样化,可以有效提升查询效率,降低用户查询操作的复杂度。

为了从自然语言数据中提取出意图参数,可以将自然语言数据转换为文本数据,然后在文本数据中确定出哪些是意图参数。具体的,可以预先设置一个表格,在该表格中存储有哪些词是意图参数,分别是哪种意图参数,然后将文本数据中的词与该表格进行比对,从而确定出意图参数。具体的,从所述自然语言数据中提取出意图参数,可以包括:对所述自然语言数据进行切词处理,得到多个分词;将所述多个分词逐个与预先建立的意图参数表格中各个词语进行匹配,其中,所述意图参数表格中存储有多个人群范围数据词语和提问维度数据词语;将匹配成功的分词作为意图参数。即,可以在表格中建立好哪些词是表示人群范围数据,哪些词表示提问维度数据,在得到自然语言数据的切字结果之后,就可以进行匹配,将匹配得到的结果作为意图参数。

因基于自然语言的查询方式,会存在一定查询出错的可能,为了降低识别的错误率,可以增加一个确认机制。具体的,可以在从自然语言数据中提取出意图参数之后,所述方法还包括:采用标记的方式,显示提取出的意图参数中的人群范围和提问维度;获取用户对显示的人群范围和提问维度的确认数据;在接收到用户的确认数据之后,确定提取的意图参数为用户输入的意图参数。即,在系统确认完意图参数之后,可以采用高亮或者特殊颜色标记的方式显示识别出的意图参数,然后供用户确认,在确认完毕后,确定识别出的意图参数是正确的。即,可以采用标记的方式,显示提取出的意图参数中的人群范围数据和提问维度数据;接收用户对显示的人群范围数据和提问维度数据的确认操作;响应于用户的确认操作,确定提取的意图参数为用户输入的意图参数

对于查询结果而言,在实际实现的时候,得到查询结果之后,可以采用可视化的方式进行显示,以使得用户可以看到查询结果。对于查询结果的显示方式,可以是多样化,对于具体的显示方式可以是用户自己定义或者选择的,也可以是系统默认的,或者是最优匹配得到的。

即,在根据所述查询条件匹配得到查询结果之后,可以获取用户选择的查询结果显示方式;根据所述显示方式,采用可视化的方式,显示所述查询结果。

上述的显示方式可以包括但不限于以下至少之一:饼图、柱状图、曲线图。

下面结合一个具体实例进行说明:

在本例中通过对自然语言数据的识别,识别得到意图参数,并设置了填充数据查询需求的搜索框架,进行标准的输入:(f,d),其中,参数f表示人群范围(filter),参数d表示提问维度(dimension),从而可以进行特定的数据查询输出。

其中,人群范围可取交集(f∩f),例如,可以设置为人群范围限定最多不超过3个,例如:上海地区(f)的男性(f)用户学历是如何分布的;也可以选择同一范围的两个不同值(f:f)进行比较,例如:上海地区(参数f)和江苏地区(参数f)的性别分布有什么区别?

其中,参数d代表可被提问的维度,例如:所在城市(如何分布?),年龄(平均值是多少?)等等。具体可以根据实际情况和需求设置参数f和参数d的项。

在实现的时候,可以设置表格来表征汇总表字段,将参数字段记录在表格中,例如,可以采用下表进行记录:

基于上述的意图参数(f和d),例如采用如下的方式进行提问,系统可以从提问内容中识别出f和d。

例如:

1)分布

【例】上海(f)男性(f)的学历(d)如何分布?

【例】本科生(f)的逾期(d)情况怎么样的?

2)地理分布

【例】小贷(f)借款人在全国(d)是如何分布的?

【例】上海(f)的本科生(f)都在全国(d)的哪些城市?

3)时间分布

【例】上海(f)p2p(f)的多头(f)情况过去几年如何变化?

【例】20-30岁(f)申请人数最近是变多了还是变少了?

4)比例

【例】逾期(f)的人中本科生(d)占比例多少?

【例】上海(f)p2p(f)借款人中申请机构数(d)超过3家的占比多少?

5)均值

【例】上海(f)p2p(f)借款人的平均年龄(d)是多少?

【例】本科生(f)申请机构数(d)平均是几家?

6)对比

【例】上海(f)和北京(f)的逾期率(d)有什么差异?

【例】p2p(f)和小贷(f)的申请机构数(d)比怎么样?

7)未指明

【例】上海(f)的多头人群(f)是什么样的?

【例】借p2p(f)逾期(f)的人都是什么样的人?

如图2所示,为上海男性借款人学历是如何分布?的界面示意图,在用户采用自然语言输入之后,可以在显示界面上现在搜索结果。

用户可以通过对显示结果的显示,从如图3所示的示意图中选择一种或多种结果展示方式。

在上述实施例中,直接获取用户输入的自然语言数据,然后从自然语言数据中提取出意图参数,并根据意图参数生成用户输入的自然语言数据对应的查询条件,从而匹配得到查询结果。即,用户在有查询需求的时候,不需要从选择项中选择,只需要输入自然语言即可,从而解决了现有的查询过程过于繁琐的问题,达到了简单高效实现意图查询的技术效果。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。

实施例二

基于上述实施例一中提供的意图识别和查询方法,本实施例中提供一种意图识别和查询系统,具体地,图4和图5示出了该意图识别和查询系统的可选的结构框图,该意图识别和查询系统被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合描述意图识别和查询系统在存储介质中的执行过程,以下描述将具体介绍本实施例各程序模块的功能:

如图4所示,意图识别和查询系统20包括:获取模块401、提取模块402、生成模块403和匹配模块404,其中:

获取模块401,用于获取用户输入的自然语言数据;

提取模块402,用于从所述自然语言数据中提取出意图参数,其中,所述意图参数包括:人群范围数据和/或提问维度数据;

生成模块403,用于将所述意图参数作为用户输入的自然语言数据对应的查询条件;

匹配模块404,用于根据所述查询条件匹配得到查询结果。

在一个实施方式中,获取摸401具体可以获取用户在查询框中输入的文字内容;将所述文字内容作为所述用户输入的自然语言数据:

或者,

获取用户通过语音输入设备输入的语音数据;通过语言识别模式识别出所述语音数据的文字内容;将所述文字内容作为所述用户输入的自然语言数据。

在一个实施方式中,提取模块402,如图5所示,可以包括:

分词单元501,用于对所述自然语言数据进行切词处理,得到多个分词;

匹配单元502,用于将所述多个分词逐个与预先建立的意图参数表格中各个词语进行匹配,其中,所述意图参数表格中存储有多个人群范围数据词语和提问维度数据词语;

生成单元503,用于将匹配成功的分词作为意图参数。

在一个实施方式中,在从所述自然语言数据中提取出意图参数之后,上述数据查询系统具体可以采用标记的方式,显示提取出的意图参数中的人群范围数据和提问维度数据;接收用户对显示的人群范围数据和提问维度数据的确认操作;响应于用户的确认操作,确定提取的意图参数为用户输入的意图参数。

在一个实施方式中,在根据所述查询条件匹配得到查询结果之后,数据查询系统可以获取用户选择的查询结果显示方式;根据所述显示方式,采用可视化的方式,显示所述查询结果。

在一个实施方式中,上述显示方式可以包括但不限于以下至少之一:饼图、柱状图、曲线图。

关于上述实施例中的装置,其中各个单元、模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

在本实施例的各个实施方式中,直接获取用户输入的自然语言数据,然后从自然语言数据中提取出意图参数,并根据意图参数生成用户输入的自然语言数据对应的查询条件,从而匹配得到查询结果。即,用户在有查询需求的时候,不需要从选择项中选择,只需要输入自然语言即可,从而解决了现有的查询过程过于繁琐的问题,达到了简单高效实现意图查询的技术效果。

实施例三

在本发明优选的实施例三中提供一种电子装置。图6是根据本发明电子装置一实施例的硬件架构示意图。本实施例中,电子装置2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。例如,可以是智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图所示,电子装置2至少包括但不限于:可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及数据查询系统20。其中:

存储器21至少包括一种类型的计算机可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是电子装置2的内部存储模块,例如该电子装置2的硬盘或内存。在另一些实施例中,存储器21也可以是电子装置2的外部存储设备,例如该电子装置2上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,存储器21还可以既包括电子装置2的内部存储模块也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于电子装置2的操作系统和各类应用软件,例如数据查询系统20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制电子装置2的总体操作,例如执行与电子装置2进行数据交互或者通信相关的控制和处理等。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行的数据查询系统20等。

网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在电子装置2与其他电子装置之间建立通信连接。例如,网络接口23用于通过网络将电子装置2与外部终端相连,在电子装置2与外部终端之间的建立数据传输通道和通信连接等。网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(globalsystemofmobilecommunication,gsm)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi等无线或有线网络。

需要指出的是,图6仅示出了具有部件21-23的电子装置,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。

在本实施例中,存储于存储器21中的数据查询系统20还可以被分割为一个或者多个程序模块,一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。

实施例四

本实施例还提供一种计算机可读存储介质,计算机可读存储介质内存储有监控拨打任务的系统,监控拨打任务的系统可被至少一个处理器所执行,以使至少一个处理器执行如实施例一的监控拨打任务的方法的步骤。

本实施例中,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,计算机可读存储介质可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,计算机可读存储介质也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,计算机可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例二的客户保障分析系统的程序代码等。此外,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。

显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1