查询选取方法及系统的制作方法

文档序号:6402674阅读:211来源:国知局
专利名称:查询选取方法及系统的制作方法
技术领域
本发明涉及加工技术领域,更具体的说,涉及查询选取方法及系统。
背景技术
在对数据库、数据源中的数据进行查询时,现有技术一般会提供多个查询选项(也可称为查询指标或指标),用户选择指标后,还需要配置指标对应的限制条件,并将所有的限制条件以“且”和“或”的逻辑关系组合后,系统形成查询指令,在数据库中进行查询筛选,并展示给用户。在现有技术中,用户无法通过输入自然语言语句来实现对数据的查询和筛选。

发明内容
有鉴于此,本发明实施例提供了查询选取方法及系统,以解决上述问题。为实现上述目的,本发明实施例提供如下技术方案:一种查询选取方法,至少基于查询选取系统,包括:查询选取系统获取用户输入的自然语言语句;查询选取系统对所述用户输入的自然语言语句进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点、字符串节点中的至少一种;查询选取系统根 据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合;查询选取系统根据所述节点树生成数据查询指令;查询选取系统使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果; 查询选取系统展示所述筛选结果。一种查询选取系统,包括:获取单元,用于获取用户输入的自然语言;预处理单元,用于对所述用户输入的自然语言进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点和字符串节点中的至少一种;节点树构造单元,用于根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合;翻译单元,用于将所述节点树翻译成数据查询指令;查询筛选单元,用于使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;展示单元,用于展示所述筛选结果。经由上述的技术方案可知,在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实现了用户通过输入自然语言语句来对数据进行查询和筛选。此外,用户只需要输入自然语言语句,不再需要选择指标、设置限制条件,因此,还简化了用户操作,节省了用户的操作时间。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明实施例提供的查询选取系统结构示意图;图2为本发明实施例提供的查询选取方法流程图;图3为本发明实施例提供的查询选取方法另一流程图;图4为本发明实施例提供的查询选取方法又一流程图;图5为本发明实施例提供的节点树示意图;图6为本发明实施例提供的节点树另一示意图;图7为本发明实施例提供的查询选取方法又一流程图;图8为本发明实施例提供的查询选取方法又一流程图;图9为本发明实施例提供的查询选取方法又一流程
图10为本发明实施例提供的查询选取方法又一流程图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在对数据库、数据源中的数据进行查询时,现有技术一般会提供多个查询选项(也可称为查询指标或指标),用户选择指标后,还需要配置指标对应的限制条件,并将所有的限制条件以“且”和“或”的逻辑关系组合后,系统形成查询指令,在数据库中进行查询筛选,并展示给用户。举例来讲,用户如想查询数学成绩以及语文成绩均超过80分的学生,至少需要选择“数学成绩”、“语文成绩”这两个指标,设置两个限制条件“ > 80”,设置两个限制条件为“且”的逻辑关系组合后,系统才形成查询指令,在数据库或数据源中进行查询筛选并展示。因此,在现有技术中,用户无法通过输入自然语言语句来实现对数据的查询和筛选。有鉴于此,本发明实施例提供了查询选取方法和查询选取系统,以解决上述问题。参见图1,上述查询选取系统至少可包括获取单元1、预处理单元2、节点树构造单元3、翻译单元4、查询筛选单元5和展示单元6。基于上述查询选取系统,参见图2,本发明实施例所提供的查询选取方法至少包括如下步骤:S1、查询选取系统(获取单元)获取用户输入的自然语言语句;用户可以用手写、按键或语音输入自然语言语句。因此,上述获取单元具体可包括键盘、麦克风(用于语音输入)、手写笔和触摸屏(手写笔和触摸屏用于手写输入)等。S2、查询选取系统(预处理单元)对用户输入的自然语言语句进行预处理,得到标准节点序列(考虑到后续还将出现标准节点序列,步骤S2中得到的标准节点序列可称为第一标准节点序列)。上述节点至少包括指标节点和条件节点,而条件节点又可包括数字节点、日期节点和字符串节点中的至少一种。S3、查询选取系统(节点树构造单元)根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;S4、查询选取系统 (翻译单元)根据节点树生成数据查询指令;S5、查询选取系统(查询筛选单元)使用数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;S6、查询选取系统(展示单元)展示筛选结果。具体的,展示单元可为显示屏。经由上述的技术方案可知,在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实现了用户通过输入自然语言语句来对数据进行查询和筛选的目的。并且,在本发明实施例中,用户只需要输入自然语言语句,而不再需要选择指标、设置限制条件,因此,还简化了用户操作,节省了用户的操作时间。下面将重点介绍步骤S2-S4的细节内容。首先介绍步骤S2。在本发明其他实施例中,参见图3,上述步骤S2可具体包括:S21、将用户输入的自然语言语句进行分词处理,得到多个词或词组;S22、对每一个词或词组构造节点,得到与用户输入的自然语言语句相对应的原始节点序列;原始节点序列中包括至少一个节点。更具体的,可通过配置词典对每个词或词组构造节点,节点类型可包括疑问词节点、指标节点、数字节点、日期节点、逻辑词节点、字符串节点等等,最终得到与用户输入语句相对应的一个语义节点序列。上述数字节点和字符串节点均可作为指标节点的限制条件值。例如,在“三年级五班姓名李明的数学成绩”中,“李明”是一字符串节点,是“姓名”这一指标节点的限制条件值;而在“数学成绩超90分”中,“超90分”这一数字节点是“数学成绩”这一指标节点的条件值。在对数字节点和日期节点的配置中,首先先确定某一词组是数字,然后再确定这些数据是否是日期,如果是,将其构造成日期节点,否则将其构造成数字节点。需要说明的,一个特定的系统(也即在特定应用场景下)可提供查询选项(也即查询指标)是固定的。比如,在学生成绩查询系统中,其可提供的指标包括年级、班级、各科目(数学、语文、地理、历史、生物等)等,是固定的。因此,可利用指标关键词对分词得到的各词或词组进行匹配,从而确定出用户输入的语句中所包含的指标。例如,使用“科目”中数学、语文、地理、历史、生物等指标关键词,对“三年级五班数学成绩超90分,以及语文成绩超过80分的学生”这一语句进行匹配,可匹配出该语句包含“数学”、“语文”两个指标。同理,逻辑词也是固定的,可预先设置逻辑词字典,该字典中包括逻辑关键词“并且”、“和”、“且”、“同时”、“与”、“或”等,使用逻辑关键词对分词后的词或词组进行匹配,可确定其是否是逻辑关系节点。S23、将原始节点序列转换为(下述节点树构造单元可处理的)标准节点序列;由于用户在输入自然语言语句时,带有很大的随意性,因此其对应的节点序列可能是非标准的。仍以上述提及的“三年级五班李明的数学成绩”为例,该句中只出现了“李明”这一词组,但省略了“姓名”,这样,其对应的节点序列只有“李明”这一字符串节点,而缺乏其相应的指标节点姓名”。因此,需要对其补入指标节点(姓名),将其转换成标准节点序列“三年级五班姓名李明的数学成绩”。更具体的,可根据配置规则将用户输入的自然语言语句对应的节点序列转换为节点树构造单元可处理的标准节点序列:首先通过检查关键词汇和匹配特殊句式特征判断原节点序列的句式是否标准,对检查到的非标准句式根据配置文件指定的转换规则转换为标准句式对应的语义节点序列。关键词汇可用正则表达式来表示。举例来讲,用户输入“连续3天下雨”,可使用“连续*天”这一正则表达式对其进行匹配和句式转换,将“连续3天下雨”转换成标准句式“今天下雨,并且昨天下雨,并且前天下雨”。

同时,“下雨”是条件节点中的字符串节点,其与“天气状况”这一指标相对应,因此,还需要将指标节点“天气状况”补入,最终转换成的标准节点序列为“今天天气状况下雨,并且昨天天气状况下雨,并且前天天气状况下雨”。需要说明的是,如果用户以语音方式输入语句时,上述步骤S2还包括对语音输入进行文字识别,得到文字识别结果的步骤。从而将语音转化为文字。在得出标准节点序列后,接下来的步骤S3是根据指标节点与其他节点之间的关系,构造节点树。参见图4,步骤S3可具体包括:S31、根据节点之间的位置关系,确定指标条件组合;举例来讲,“三年级五班数学成绩超90分,以及语文成绩超过80分的学生”中,“数学成绩”为指标节点,“超90分”为数字节点(条件节点),并且,“数学成绩”与“超90分”的位置关系是相邻,因此,可根据二者的位置关系,确定“超90分”是“数学成绩”这一指标节点的限制条件,也即“超90分”是“数学成绩”这一指标节点的条件节点。需要说明的是,“超90分”并不是计算机可理解的准确数值范围。因此,需要解析“超90分”这一数字节点,将其转化为“> 90”的数字节点。而如果数字节点已经包含了准确数值范围,例如,用户输入了“三年级五班数学成绩>90”的语句,则不需要对数字节点进行解析。更具体的,在解析时,可将“超”、“大于”、“高于”转化为“〉”,将“小于”、“少于”、“低于”转化为“〈”,将“不大于”、“小于等于”、“不超过”、“不高于”转化为“《”,将“不小于”、“小于等于”、“不少于”、“不低于”转化为“》”。同理,日期节点如果未包含计算机可理解的准确日期范围,则需要对日期节点进行解析转换。反之,则不需要解析日期节点。例如,“今年”并不是计算机可理解的准确日期范围,如果今年为2013年,需要将其转化为日期节点“2013”。相应的,逻辑词节点也需要进行转换,例如,将逻辑词节点“并且”、“和”、“且”、“同时”、“与”等,转换为“and”或“&”,将逻辑词节点“或”、“或者”转换为“or”。以此类推,可最终得到指标条件组合。S32、根据指标条件组合构造节点树。“2013年三年级五班数学成绩超90分,以及语文成绩超过80分的学生”对应的节点树可参见图5。此外,需要说明的是,节点树中的每一指标节点对应一个条件节点。以“连续3年同比增长率超过50%的股票为例”,其实际是三个指标条件的组合:(1),最近一年(假设是2013年)的同比增长率>50% ;(2),前推一年(2012年)同比增长率>50%;(3),前推两年(2011年)的同比增长率>50%。因此,参见图6,“连续3年同比增长率超过50%的股票为例”所对应的节点树中包括三个“同比增长率”指标节点,每一指标节点对应一个条件节点。相应的,上述步骤S4可具体包括:确定节点树中各指标节点对应的数据源;根据数据源的格式要求,将相应指标节点及条件节点翻译成符合数据源格式要求的查询指令。这是因为,不同指标所对应的数据可能存储于不同的数据源或数据库中,而每个数据源所支持的查询指令格式可能也是不一样的,因此,需要针对不同数据源翻译出不同格式的查询指令。尽管指令格式可能不一致,但各个数据源本身都支持按指标条件查询,利用这一特点,本发明实施例对于每一数据源都针对其特有的查询指令格式配置了按指标条件查询的指令翻译程序,并且,在本发明实施例中,对用户输入的语句语义的理解,与最终数据的获取是分离的。相应的,上述步骤S5中“对查询结果进行筛选”可包括:根据节点树中各指标节点间的关系,对查询成果进行合并操作和/或过滤操作。具体的,在获取到查询结果后,按照指标间的逻辑组合关系进行合并和过滤,保留同时符合所有指标条件组合的查询结果。现举一过滤的例子,以图6节点树为例,前已述及,“连续3年同比增长率超过50%的股票为例”所对应的节点树中包括三个“同比增长率”指标节点,每一指标节点对应一个条件节点。

根据查询指令得到的查询结果有三类:第一种,最近一年(假设是2013年)同比增长率>50%的股票;第二种,2012年同比增长率>50%的股票;
第三种,2011年同比增长率>50%的股票。根据图6的节点树,三个指标节点之间为“且”的逻辑关系,根据该逻辑关系,对上述三种查询结果进行合并和过滤,得到同时满足2013年同比增长率>50%、2012年同比增长率>50%和2011年同比增长率>50%的股票。另外,需要说明的是,仍以“连续3年同比增长率超过50%的股票”为例,其所对应的节点树中包括三个“同比增长率”指标节点,在生成查询指令时,可分别根据三个指标节点生成三个查询指令,在得到查询结果后,再对查询结果进行过滤。也可以生成一个查询指令,查询同时满足三个指标条件值的数据,此时,就不再需要对查询结果进行过滤了。至于合并,主要是针对不同指标对应不同数据源的情况,在从多个数据源获得查询结果后,可对这些查询结果进行合并。在本发明其他实施例中,参见图7,在步骤S6后,还可包括如下步骤:S7、查询选取系统展示指标条件组合。考虑到用户出于种种原因 会更改指标,在本发明其他实施例中,上述方法还可包括如下步骤:查询选取系统获取用户输入的条件更改指令。在获取条件更改指令后,系统将进行条件更改,并重新生成数据查询指令。相应的,上述查询选取系统可包括指令更改单元,用于获取用户输入的条件更改指令进行条件更改,并重新生成数据查询指令。条件更改又可具体包括条件追加、条件修改和条件删除。针对条件追加,用户可采用类似于现有技术中的方式,选择需要追加的指标,并配置指标对应的限制条件。用户也可追加自然语言条件。可设置一个按键或图标,用户点击,则指令更改单元被触发。更具体的,参见图8,如果用户选择了自然语言条件这个方式,则需要(步骤S10)获取用户输入追加的自然语言语句(类似于步骤Si),(步骤Sll)并对追加的自然语言语句进行预处理得到第二标准节点序列(类似于步骤S2),(步骤S12)再将第二标准节点序列和原来的第一标准节点序列合并,形成新第一标准节点序列后,经过步骤S3重新生成查询指令进入步骤S4重新查询和筛选。而如果用户只是想修改某些指标对应的条件,或者想删除某些条件或指标,则(步骤S13)直接修改或删除第一标准节点序列中的相应节点,进入步骤S3。在具体实施时,在执行步骤S7后,查询选取系统可同时提供“条件追加”、“条件修改”、“条件删除”按钮,以方便用户操作。此外,需要说明的是,请参见图9,上述步骤S7,也可发生在步骤S3之前,而用户更改条件的时机,也可选择在执行步骤S3之前。或者,请参见图10,在步骤S2后,还可包括如下步骤:S14、展示第一标准节点序列。以便用户得知系统所“理解”的指标条件组合。例如,用户输入“三年级五班李明的数学成绩”,将其转换成第一标准节点序列为“年级三年级班级五班姓名李明的科目数学成绩”并展示。S15、判断用户是否确认指标条件正确。可提供确认按钮,以供用户进行确认。如果用户确认正确,则执行步骤S3。
如果用户认为指标条件不正确,则输入条件更改指令,进行条件追加、条件修改或条件删除,在此不作赘述。在具体实施时,在执行步骤S14后,查询选取系统可同时提供“确认”、“条件追加”、“条件修改”、“条件删除”按钮,以方便用户操作。下面将以“连续3年净利润增长超过50%的股票”为例,对本发明的实施过程进行描述。步骤(I)用户输入自然语言语句“连续3年净利润增长超过50%的股票”。步骤(2)得到“连续3年I净利润I增长I超过50%|的股票”的原始节点序列,其中用“I”区分节点。在该步骤,可明确查询的是股票。并根据配置文件中提供的“净利润” “增长”特征将非标准句式转换为标准句式“连续3年I净利润(同比增长率)I超过50% I的股票”。步骤(3),对数字节点和时间节点进行解析。在本实施例中,可将“超过50%”转化为“ >50%”,将“连续3年”转化为最近一年开始前推两年的具体时间范围。步骤(4),构造节点树。首先,将“>50%”的数字节点,表示绑定为“净利润(同比增长率)”这一指标的值过滤条件,将“连续3年”的时间节点绑定为“净利润(同比增长率)”的时间参数;再根据“净利润(同比增长率)”这一指标绑定的时间参数为年度的特点,将“连续3年”拆分为“最近一年” 、“前推一年”、“前推两年” 3个年度时间节点,并对其它节点进行复制,最后得到表征3个指标条件组合的节点树(请参见图6)。需要指出的是,传统的选股工具在处理这种选股需求时,通常要求用户分3次选择“净利润(同比增长率)”这一指标,每次需要用户为指标选定是哪一年,同时每次需设置指标值大于50%的限制条件,因此操作繁琐,而本发明实施例只要求用户输入一句自然语言语句,因此,极大得简化了用户操作。步骤(5 ),将以上指标条件组合翻译数据查询指令。首先,确定“净利润(同比增长率)”这一指标对应的数据源,然后根据数据源要求的查询指令格式将以上3个指令条件组合翻译为数据源支持的查询指令。步骤(6),执行查询指令,按净利润(同比增长率)>50%的条件过滤掉所有不符合条件的股票。步骤(7),将查询出的股票及相关的净利润(同比增长率)数据展示在界面上,同时也将得到的指标条件组合显示给用户,方便用户检查验证。步骤(8),用户可以选择更改条件(也即前述的输入条件更改指令),如追加一个条件“浙江省”,这样可以选出“浙江省”的“连续3年净利润增长超过50%的股票”。或者,用户将最近一年的净利润(同比增长率)大于50%修改为小于30%等等,然后重新进行选股。如果用户不再更改条件,则一次正常流程结束。需要说明的是,本发明实施例所提供的技术方案,其可用于搜索领域、通信领域、工业领域等。现简单各举一例说明。在搜索领域方面,用户在网页中输入自然语言语句,网页服务器(也即查询选取系统)可执行步骤S1-S4,将用户输入的自然语言语句转化为数据查询指令,然后,网页服务器在使用数据查询指令进行查询得到查询结果,并进行筛选(步骤S5),并将筛选结果返回至客户端显示,则完成了一次搜索。在通信领域应用方面,例如,用户输入“打电话给李明”,手机(也即查询选取系统)执行步骤S1-S2后,将用户输入的自然语句转化为标准节点序列“打电话给联系人李明”,其中“联系人”为指标节点,“李明”为字符串节点。在步骤S3-S5中,生成数据指令,查询手机的联系人列表,找到“李明”的电话号码并展示。此后,上述方法还可进一步包括根据筛选结果——“李明”的电话号码,发起通信呼叫。在工业控制应用(例如炼钢领域)方面,如用户输入“将温度保持在50度”,则PLC(也即查询选取系统)进行步骤S1-S2步骤后,获知“温度”为指标节点,“50度”为数字节点。则在步骤S3-S6中,PLC将生成数据指令,查询炼钢生产线当前的温度值并显示(炼钢生产线会定时将当前的温度值上传至某一数据库)。此后,上述方法还可进一步包括,将炼钢生产线当前的温度值与“50度”相比较,如果前者低于后者,则进行加温,如果前者高于后者,则进行降温。与之相对应,本发明实施例还要求保护查询选取系统,仍请参见图1,该系统至少可包括:获取单元I,用于获取用户输入的自然语言;预处理单元2,用于对用户输入的自然语言进行预处理,得到第一标准节点序列,节点至少包括指标节点和条件节点,条件节点包括数字节点、日期节点和字符串节点中的至少一种;

节点树构造单元3,用于根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;翻译单元4,用于将节点树翻译成数据查询指令;查询筛选单元5,用于使用数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;展示单元6,用于展示筛选结果。展示单元6还可以用于展示指标条件组合。具体细节请参见本文前述方法部分的介绍,在此不作赘述。在本发明其他实施例中,上述查询选取系统还可包括更改单元,用于获取用户输入的条件更改指令进行条件更改。更具体的,更改单元可包括条件追加单元、条件修改/删除单元。条件追加单元在用户输入追加的自然语言语句时,获取用户输入追加的自然语言语句,并对追加的自然语言语句进行预处理得到第二标准节点序列,再和原有的第一标准节点序列合并后,指示节点树构造单元3重新生成数据查询指令。而条件修改/删除单元,可根据用户的修改或删除操作,修改或删除原有第一标准节点序列中的相应节点,指示节点树构造单元3重新生成数据查询指令。具体细节请参见本文前述方法部分的介绍,在此不作赘述。最后需要说明的是,查询选取系统中的预处理单元、节点树构造单元、翻译单元、查询筛选单元、指令更改单元既可为硬件单元、电路,也可为逻辑单元,在为逻辑单元时,具体由处理器完成各单元的功能。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围 。
权利要求
1.一种查询选取方法,其特征在于,至少基于查询选取系统,包括: 查询选取系统获取用户输入的自然语言语句; 查询选取系统对所述用户输入的自然语言语句进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点、字符串节点中的至少一种; 查询选取系统根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合; 查询选取系统根据所述节点树生成数据查询指令; 查询选取系统使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果; 查询选取系统展示所述筛选结果。
2.如权利要求1所述的方法,其特征在于,还包括: 查询选取系统展示指标条件组合。
3.如权利要求2所述的方法,其特征在于:还包括: 查询选取系统获取用户输入的条件更改指令,并根据所述条件更改指令重新生成数据查询指令。
4.如权利要求3所述的方法,其特征在于,所述条件更改包括条件追加、条件修改和条件删除。
5.如权利要求1所述的方法,其特征在于,所述对查询结果进行筛选包括:根据节点树中各指标节点间的关系,对所述查询成果进行合并操作和/或过滤操作。
6.如权利要求5所述的方法,其特征在于,所述预处理包括: 将所述用户输入的自然语言语句进行分词处理,得到多个词或词组; 对每一个词或词组构造节点,得到原始节点序列; 将原始节点序列转换为标准节点序列。
7.如权利要求6所述的方法,其特征在于,所述根据指标节点与其他节点之间的关系,构造节点树包括: 至少根据节点之间的位置关系,确定指标条件组合; 根据所述指标条件组合构造节点树。
8.如权利要求1所述的方法,其特征在于,所述根据所述节点树生成数据查询指令包括: 确定所述节点树中各指标节点对应的数据源; 根据数据源的格式要求,将相应指标节点及条件节点翻译成符合数据源格式要求的查询指令。
9.一种查询选取系统,其特征在于,包括: 获取单元,用于获取用户输入的自然语言; 预处理单元,用于对所述用户输入的自然语言进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点和字符串节点中的至少一种; 节点树构造单元,用于根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合; 翻译单元,用于将所述节点树翻译成数据查询指令; 查询筛选单元,用于使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果; 展示单元,用于展示所述筛选结果。
全文摘要
本发明实施例提供了一种查询选取方法和查询选取系统,上述方法包括查询选取系统获取用户输入的自然语言语句,对其进行预处理,得到标准节点序列(节点至少包括指标节点和条件节点),并根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;根据节点树生成数据查询指令;查询选取系统使用数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果并展示。在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实现了用户通过输入自然语言语句来对数据进行查询和筛选。
文档编号G06F17/30GK103226606SQ201310155688
公开日2013年7月31日 申请日期2013年4月28日 优先权日2013年4月28日
发明者易峥, 王进, 凌立刚, 王萌 申请人:浙江核新同花顺网络信息股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1