一种面向中文查询句的三级查询目标分析方法

文档序号:6580334阅读:455来源:国知局
专利名称:一种面向中文查询句的三级查询目标分析方法
技术领域
本发明涉及查询目标分析方法,特别是一种面向中文查询句的三级查询目标分析
方法。
背景技术
在使用中文自然语言查询的系统中,其基本的处理流程是由用户采用自然语言 给出包括查询条件和查询目标的中文查询句,系统对该查询句进行句法、词法、语义的分析 和理解,从中识别出相关的查询条件和查询目标,并以此构成对知识库的检索语句,得到正 确答案,生成中文回答句反馈给用户,以结束一次查询的过程。在整个流程中,对于查询句 的分析,或者说对于查询目标的识别是整个系统正确工作的第一步。若对于查询目标分析 错误,将直接导致知识检索和答句生成的错误,也就会直接影响到系统的工作效率和正确 性。 —般来说,常用的查询目标分析方法有模板匹配和相似度计算等方法。模板匹配 方法在应用时,是将由统计得到的大量常用问句以形式化的方式表示,作为模板,要求用户 在进行信息查询时严格按照模板的组织结构来表述查询意图。这种方法的封闭测试正确率 很高,但对于用户的使用限制较多,很难达到自然语言查询所希望的无障碍交流, 一旦用户 查询句的表述形式超出了系统模板的范围,系统则会显得无能为力。因此,在现代的查询工 作中,该方法大多作为一种辅助手段来识别查询目标。相似度计算方法,主要是通过对词法 分析后的查询句中词语共现概率、特征词使用频度等内容的计算和统计,得到查询句中各 部分内容作为查询目标的概率值——即相似度,以此相似度的大小来确定查询目标。这种 方法对于用户的输入限制相对较少,但由于中文的灵活多样性,使得根据统计结果计算出 的相似度命中查询目标的概率降低,自然语言问答时有时会出现答非所问的情况。
由于技术限制,目前中文自然语言查询的系统大多都以受限语言作为处理对象, 采用统计得到的知识库作为查询依据,或者在此基础上加入概率统计。但是由于中文无论 从结构形式上,还是表述方式上,或者词语选择上都十分灵活多变,因此采用上述处理方式 是无法满足实际查询需求的。例如,在进行信息查询时,查询句的结构形式可以是特指问 句、是非问句、正反问句、选择问句,甚至还可以是祈使句,不同的问句形式所包含的查询信 息量以及对于查询目标的表示也都会有明显的差别。再如,在某些查询中,其结果值应该是 知识库中多个域值的某种关系计算结果,而不单是某一个域值;或者对应于知识库中的同 一个域的查询,在查询句的表述中,可以有很多不同类型的词语和概念。这些都会导致中文 自然语言查询系统在应对复杂句查询和知识库无冗余时处于两难的境地。而以上这些问题 的关键点就在于对于任何一个查询句,系统是否能正确快速地识别出其查询目标,只有找 到了查询目标才能够进行查询的后续工作。 综上所述,要提高对中文查询句中查询目标的识别率,单纯地从扩大知识库、规则 库的规模和增加概率计算是远远不够的。要突破这种查询限制,必须要有一种新的方法来 对查询目标的识别问题进行改进。

发明内容
本发明目的在于提供一种面向中文查询句的三级查询目标分析方法,该方法是基于受限语言的中文查询句的查询目标分析方法,能够理解不同结构形式的用户查询句,用户查询句在表述方式上更为自由。 为了实现上述目的,本发明采用如下技术方案一种面向中文查询句的三级查询目标分析方法,其特征在于包括以下步骤 (1)根据系统语言的受限情况,通过大规模语料分析和统计,建立复合概念和推演规则的知识库; (2)在句法和词法分析的基础上,对查询句进行语义理解,识别出其中的查询目
标,并将该查询目标归类为直接查询目标、逻辑推理目标、比较判断目标; (3)若识别出比较判断目标,则根据查询句类型、比较元素关系、比较元素值来源
以及比较结果类型内容的不同,提取到对应的逻辑推理目标或直接查询目标;若无比较判
断目标,则直接进入步骤(4); (4)若识别出逻辑推理目标,则系统需要经过概念分解或规则推演,转化为相对应的直接查询目标;若无逻辑推理目标,则直接进入步骤(5); (5)若识别出直接查询目标,系统可以直接进行查询转换,将其转换为数据提取目标,用于检索专业基本知识库获取答案; (6)根据查询和分析结果,以及查询句中初始查询目标的类型,通过概念合成和推理,产生回答用户目标的值,并以此形成反馈给用户的答句。 所述的步骤(1)中,复合概念和推演规则的知识库指系统所属应用领域的复合概念知识库和逻辑概念推理知识库;所述的复合概念就是指可以分解为多个标准概念,或一个标准概念与常量的算术运算式的概念;将复合概念与标准概念之间的关系表达式建立成复合概念知识库,只在基本知识库中保持标准概念,在分析查询句时将复合概念分解为标准概念,从而理解查询意图;所述的逻辑概念就是指可以用多个标准概念派生的概念;逻辑概念推理知识库则是用于保存逻辑概念与标准概念之间的推演规则,形式为逻辑产生式。 所述的步骤(2)中,查询句包含直接查询目标、逻辑推理目标、比较判断目标中的一级或多级,对不同形式和复杂度的查询句,采用不同层次和级别的推演变换过程,此概念变换过程可逐级或越级进行。 所述的步骤(3)中,比较判断目标对应于各种结构形式的查询句,从比较判断目
标中分析出需要进行比较和判断的逻辑推理目标或直接查询目标,然后由逻辑推理目标或
直接查询目标进行知识库查询,然后再反向推演出结果,再合成回答用户目标的值。 所述的步骤(4)中,逻辑推理目标分为直接逻辑推理目标和间接逻辑推理目标;
直接逻辑推理目标是指逻辑概念推理知识库的产生式结论中出现的知识目标;间接逻辑推
理目标是指经过概念分解等价变换最终变换为逻辑概念推理知识库的产生式结论中出现
的知识目标;逻辑推理目标化解推演变换的变换过程为直接逻辑推理目标经过逻辑概念推
理知识库的产生式逆向推理,可转换为直接查询目标;逻辑推理目标求值推演变换的变换
过程为对于直接查询目标查询到的知识结果,再经过逻辑概念推理知识库的产生式推理转换为直接逻辑推理目标的值,用于生成答句。 所述的步骤(5)中,直接查询目标是一种对应于标准概念的查询目标;根据查询 句中的直接查询目标,可以直接对知识库进行检索操作得到数据,或这些数据经过简单的 概念合成等价变换得到结果;直接查询目标分简单直接查询目标和复合直接查询目标,简 单直接查询目标是指只包含域名和聚集函数的目标;复合直接查询目标是指由简单直接查 询目标经过概念合成等价变换的目标;对于可以出现聚集函数的简单直接查询目标又可以 分为显性目标、疑问目标和聚集目标三类;显性目标是指用域名直接给出的目标;疑问目 标是指用疑问词给出的目标;聚集目标是指用聚集函数给出的目标。 所述的步骤(6)中,回答用户目标是指自然语言查询句要求系统回答的内容,所 述内容是比较判断目标、逻辑推理目标或者是直接查询目标。 回答用户目标和查询目标直接存在以下几种对应关系①当回答用户目标=直接 查询目标时,直接查询目标的内容就是回答用户目标的值;@当回答用户目标=逻辑推理 目标时,逻辑推理目标的内容就是回答用户目标的值; 当回答用户目标=比较判断目标, 且只有一个比较者和一个被比较者、比较者是直接查询目标或逻辑推理目标、被比较者为 常量或直接查询目标或逻辑推理目标时,则回答用户目标的值是二者比较结果的逻辑值; ④当回答用户目标=比较判断目标,且只有一个比较者和多个被比较者、比较者是直接查 询目标或逻辑推理目标、被比较者均为常量时,则回答用户目标的值是比较结果为真的对 应的被比较者; 当回答用户目标=比较判断目标,且只有一个比较者和多个被比较者、比 较者是直接查询目标或逻辑推理目标、被比较者均为直接查询目标或逻辑推理目标时,则 回答用户目标的值是比较结果为真的被比较者对应的查询条件块。 本发明摒弃了一直以来对于查询目标没有类型划分的一次性确定方式,将查询目 标分为直接查询目标、逻辑推理目标、比较判断目标三级,使得查询系统可以适用于中文祈 使句、特指疑问句、是非问句、正反问句、选择问句等多种形式的查询句,并可通过不同类型 查询目标的推演变化等操作,对诸如比较判断类型等较复杂查询句进行查询意图的分析。
本发明与一般的查询目标分析方法相比,具有以下优点 (1)能够理解不同结构形式的用户查询句。本发明技术方案中的三级查询目标,是
针对于各种不同类型的查询句设置的,这就使得采用该识别方法的系统不仅能够适用于特
指查询句,还能理解祈使查询句,甚至是是非问句、正反问句、选择问句等形式的查询句也
能正常回答。这样就放宽了对于用户输入查询句的限制,使用户的查询范围更广。
(2)用户查询句在表述方式上更为自由。本发明技术方案中的复合概念知识库的
设置,使系统对于查询句的理解不仅限于基本知识库的标准概念,还可以灵活地设置复合
概念规则,理解的范围更广,真正做到自然语言的交流。


图1为本发明的查询目标关系图。
具体实施例方式
本发明技术方案中所涉及的三级查询目标并不是孤立的,它们之间是存在一定的 转换和推理关系的,各查询目标的关系图如图l所示。在对查询目标进行识别时,具体查询目标分析过程的总体算法如表1所示 表1 :
INPUT :查询成分链表ql,语义模板号xtemp皿m和句型号xsent皿m,知识库aimbOUTPUT :各级查询目标的链表;Begin
(1) 根据词法、句法分析的结果——语义模板号xtemp皿m和句型号xsent皿m从基本知识库aimb中查找到相应的查询句记录,并从该记录中提取判断比较目标xcompaim、逻辑推理目标xlogaim、直接查询目标信息xdqaim ;
(2) ifxcompaim # ",,then转第三步
6ls6
ifxlogaim # ",,then转第五步else转第七步
(3) 根据比较判断目标的个数,建立compaim链表中的结点数(一般为一个);
将比较给定值或比较概念填写到判断比较目标表中;
(4) if比较概念G直接查询目标
then转第七步;
(5) ifxlogaim G间接逻辑推理目标
then调用概念分解等价变换为直接逻辑推理目标,产生复合概念分解链表logconcl,
并建立直接逻辑推理目标的链队列dlogq ;
(6) 调用逻辑推理目标化解推演变换函数,将直接逻辑推理目标变换为简单直接查询目标的若干个集合;
(7) if xdqaim G复合直接查询目标
then调用概念分解等价变换为简单直接查询目标的若干个集合同时产生复合概念分解链表dqconcl,建立直接查询目标链表dqaiml ;
(8) 确定每一个知识提取目标的操作词是C0UNT、 SUM、 MAX、 MIN、 AVG、 SELECT等6个中的哪一个;将直接查询目标链表dqaiml扩展为二级链表;
(9) 输出,结束。End 主要的步骤如下
8
步骤(1)根据系统语言的受限情况,通过大规模语料分析和统计,建立复合概念 和推演规则的知识库。 步骤(2)在句法和词法分析的基础上,对查询句进行语义理解,识别出其中的查 询目标,该查询目标可能是直接查询目标、逻辑推理目标、比较判断目标中的一种。
步骤(3)若识别出比较判断目标,则根据查询句类型、比较元素关系、比较元素值 来源以及比较结果类型等内容的不同,提取到对应的逻辑推理目标或直接查询目标。若无 比较判断目标,则直接进入步骤(4)。 步骤(4)若识别出逻辑推理目标,则系统需要经过概念分解或规则推演,将其转 化为相对应的直接查询目标。若无逻辑推理目标,则直接进入步骤(5)。
步骤(5)若识别出直接查询目标,系统可以直接进行查询转换,将其转换为数据 提取目标,用于检索专业基本知识库获取答案。 步骤(6)根据查询和分析结果,以及查询句中初始查询目标的类型,通过概念合 成和推理,产生回答用户目标的值,并以此形成反馈给用户的答句。 在所述步骤(1)中,复合概念和推演规则的知识库一般指系统所属应用领域的复 合概念知识库compb和逻辑概念推理知识库logicb。所谓复合概念就是指可以分解为多个 标准概念,或一个标准概念与常量的算术运算式的概念。将复合概念与标准概念之间的关 系表达式建立成知识库compb,可以只在基本知识库中保持标准概念,但却可以在分析查询 句时将复合概念分解为标准概念,从而理解查询意图。所谓逻辑概念就是指可以用多个标 准概念派生的概念。知识库logicb则是用于保存逻辑概念与标准概念之间的推演规则,一 般形式为逻辑产生式。 在所述步骤(2)中,并不是任何一个查询句都包含所有的三级查询目标,往往只 有一级查询目标或者两级查询目标,根据该步骤中识别出的查询目标的类型,其后续的处 理步骤也会有所不同。对不同形式和复杂度的查询句,采用不同层次和级别的推演变换过 程,此概念变换过程可逐级或越级进行。 在所述步骤(3)中,比较判断目标是一个相对较为复杂的查询目标,一般对应于 是非问句、选择问句、正反问句等结构形式的查询句。此类查询句所要求的结果,往往是两 个或多个同类的逻辑推理目标或直接查询目标的比较值,比较的数值来源可以是知识库的 查询结果,也可以是查询句中带有的源数据,而对于期望的结果可以是比较之后的某个数 值结果,也可能是一个逻辑值。如果要得到比较判断目标的结果值,则必须首先提取出其中 包含的逻辑推理目标或直接查询目标。 在所述步骤(4)中,逻辑推理目标分为直接逻辑推理目标和间接逻辑推理目标。 直接逻辑推理目标是指logicb知识库的产生式结论中出现的知识目标。间接逻辑推理 目标是指经过概念分解等价变换最终变换为logicb知识库的产生式结论中出现的知识目 标。 直接逻辑推理目标经过logicb知识库的产生式逆向推理,可转换为直接查询目 标,该变换过程称为逻辑推理目标化解推演变换。对于直接查询目标查询到的知识结果,再 经过logicb知识库的产生式推理转换为直接逻辑推理目标的值,用于生成答句,该变换过 程称为逻辑推理目标求值推演变换。 在所述步骤(5)中,直接查询目标是一种对应于标准概念的查询目标。根据查询句中的直接查询目标,可以直接对知识库进行检索操作得到数据,或这些数据经过简单的概念合成等价变换得到结果。 直接查询目标分简单直接查询目标和复合直接查询目标,简单直接查询目标是指只包含域名和聚集函数的目标;复合直接查询目标是指由简单直接查询目标经过概念合成等价变换的目标。对于可以出现聚集函数的简单直接查询目标又可以分为显性目标、疑问目标和聚集目标三类。显性目标是指用域名直接给出的目标。疑问目标是指用疑问词给出的目标。聚集目标是指用聚集函数给出的目标。 在所述步骤(6)中,回答用户目标是指自然语言查询句要求系统回答的内容,它可能是比较判断目标、也可能是逻辑推理目标或者是直接查询目标。本发明技术方案中,不同类型的查询句其所对应的回答用户目标也是不同的。 一般来说,回答用户目标和查询目标直接存在以下几种对应关系 当回答用户目标=直接查询目标时,直接查询目标的内容就是回答用户目标的值; ②当回答用户目标=逻辑推理目标时,逻辑推理目标的内容就是回答用户目标的值; 当回答用户目标=判断比较目标,且只有一个比较者和一个被比较者(是非问句或正反问句)、比较者是直接查询目标或逻辑推理目标、被比较者为常量或直接查询目标或逻辑推理目标时,则回答用户目标的值是二者比较结果的逻辑值; 当回答用户目标=判断比较目标,且只有一个比较者和多个被比较者(选择问句)、比较者是直接查询目标或逻辑推理目标、被比较者均为常量时,则回答用户目标的值是比较结果为真的对应的被比较者; 当回答用户目标=判断比较目标,且只有一个比较者和多个被比较者(选择问
句)、比较者是直接查询目标或逻辑推理目标、被比较者均为直接查询目标或逻辑推理目标
时,则回答用户目标的值是比较结果为真的被比较者对应的查询条件块。 用祈使句或特指问句查询时,回答用户目标一般等于直接查询目标或逻辑推理目
标;用是非问句、正反问句、选择问句等方式查询时,回答用户目标一般等于判断比较目标。 下面结合附图对本发明做进一步的实施说明。 步骤(1)建立查询目标概念复合和推演所需的知识库一一应用领域复合概念知识库compb和应用领域逻辑概念推理知识库logicb。 其中,应用领域复合概念知识库compb应包含复合概念、关系式子和概念类型等主要的属性域,参考数据结构为compb(cconc印t-复合概念,relaform-关系式子,typecode-概念类型)。应用领域逻辑概念推理知识库logicb中,对于逻辑概念的存储可分静态存储和动态存储两种形式。所谓静态存储是指系统处于未运行时的存储状态,采用二维关系表,参考数据结构为(logconc印t-逻辑概念,reason-前件组合表达式,result-结论表达式)。动态存储是指系统启动后的存储状态,采用二级链表,loglink为逻辑概念链表结构,subloglink为同一逻辑概念对应不同产生式的子链表,相关属性域名称及含义可定义如下 structure loglink
{











char logconc印t [16]
loglink 承next subloglink承subp
structure subloglink
char logconc印t [16]
char reason[50]
char result[30] subloglink 承next
逻辑概念
下一个结点指针
同一个逻辑概念的子链表指针
逻辑概念 前件组合表达式 结论表达式 下一个结点指针
系统在启动时自动将静态存储状态的知识转化为动态存储状态。当系统运行,对 逻辑概念进行分析时,只对处于动态存储状态的知识进行操作。
步骤(2)对具体的查询句进行语义理解,识别出其中的查询目标。
步骤(3)若查询句中包含比较判断目标,则可用比较判断目标链表comparelink 表示该查询目标。comparelink链表是一个一对多的链表,即一个比较者和多个被比较者。 在该链表中,应该明确标识以下信息 ①比较判断的结果类型。结果是逻辑值还是算术值,可以决定回答用户目标的类 型。 ②比较关系。这将决定比较判断所要做的操作类型,常见的两个元素比较关系主 要是大于、等于、小于等;多个元素的比较关系有最大、最小、顺序等;若是一个元素与一个 集合比较,则常见的比较关系是包含关系。 ③比较者和被比较者的概念类型,其中,比较者的概念类型可以是直接查询目标 或逻辑推理目标,被比较者的概念类型还可以是查询句中包含的常量。 ④比较者和被比较者的概念和值,也就是所要查询内容的域名或属性。在对此比 较判断目标分析之后,就可根据比较者和被比较者的概念类型来求值,获取具体值后再按 比较关系进行运算,从而得到结果。 步骤(4)若查询句中包含逻辑推理目标,或者经过步骤(3)的推演得到逻辑推理 目标,可能包括间接逻辑推理目标和直接逻辑推理目标,这些推理目标仍然无法生成可直 接查询数据库的数据提取目标,需要进一步地推理变换成直接查询目标。
其中,若包含间接逻辑推理目标,要首先通过经过概念分解等价变换将其变换 为直接逻辑推理目标,其实质过程就是复合概念的分解。在进行复合概念分解时,需要 采用多级链表来描述该过程。链表中所包含的各个域及含义分别为conc印t——概念; typecode——概念类型代码;next——指向下一个同级概念结点的指针;op——与下一个 同级概念结点的运算符;value——计算得来的概念值;subp——指向下级概念结点的指 针。链表的第一个结点中的概念为初始概念,它的next为NULL(空),subp指向本概念分 解的一系列子概念构成的链表。概念每分解一次,链表多一层,直到所有概念类型为域名或 逻辑概念为止;每一个需分解的原始概念形成以它为首结点的一个多级链表。
复合概念分解等价变换的一般算法如表2所示。
表2 :
INPUT :复合概念xconc,应用领域复合概念知识库compb,应用领域标准概念 的知识库stanb2 ;
OUTPUT :复合概念分解等价变换链表concl ; Begin
(1) 先定义链表指针concl, xnew :复合概念等价变换链表conc印tlink
(2) 以xnew创建一个结点; concl = xnew ;
xnew — concept = xconc ; xnew — typecode = 7 ; xnew — op = (全子付串); xnew — next = null ;
(3) 调用递归函数decompose (xconc, 7, xnew — subp); 调用函数生成xconc概念分解的子链表,并将子链表的头指针赋给 xnew — subp ;
(4) 返回复合概念分解等价变换链表concl ; End 在该算法的第3步中,使用到了递归函数decompose(yconc,ytypecode,ypoint), 其主要功能是如果ytypecode = 7(即yconc为复合概念),输出以ypoint为指针的复 合概念分解等价变换的下一级子链表(不包括yconc概念本身的结点),否则置ypoint = null。 若查询句中仅包含直接逻辑推理目标,则要进行如表3所示的逻辑推理目标的化 解推演变换算法,生成直接查询目标。
表3:
INPUT :直接逻辑推理目标链队列dlogq ;逻辑概念推理知识库longicb ; OUTPUT :直接查询目标链表dqaiml ;
(1) 先定义逻辑推理目标链队列指针Q :dlogqueue ; 将Q指向dlogq的第一个结点;Q = dlogq ; 定义直接查询目标链表指针P, R : dqaiml ink ; 定义一个集合S,T,其中S = {};
(2) 以R为指针创建一个知识提取目标结点;P = R ;dqaiml = P ;
(3) 初始化推理知识库logicb知识扫描指针J,将J指向第一条推理知识;
(4) 执行循环,使J移到所指的产生式结论中含有上述逻辑概念的产生式; while ((J # END) and (notQ — onc印t G longicb. Result))
(5) if J = ENDthen转(7);
(6) T = (J所指的产生式的前件中所有域名};
S : = TUS ;
将J移到下一条产生式;转(4);
(7) P_>fieldns = S ;Q = Q — next ;
(8) ifQ # NULLthen以R为指针创建一个知识提取目标结点; P_>next = R ;
P = P->next ;转(3); End 所谓逻辑推理目标的化解推演变换算法是指经过logicb知识库中的产生式逆向 推理,即由结论到前提的推理,将直接逻辑推理目标转换为直接查询目标的过程。该算法的 主要思想是在应用领域逻辑概念推理知识库logicb的所有产生式中查找,找到产生式结 果与该直接逻辑推理目标概念相同的,分离每个产生式前件中的域名,所有这些域名构成 的集合就是所要转换的直接查询目标。 步骤(5)若查询句中只有直接查询目标,则对于每一个直接查询目标系统可以直 接转换为数据提取目标,用于检索专业基本知识库获取答案。 经过以上步骤的转换,每个查询句最终会对应着一个直接查询目标链表。该链表 是一个由主链表dqaimlink和子链表dqsubaimlink构成的二级链表,其中各属性域名称及 含义可定义如下
struct dqsubaimlink
J指向下一条产生式,即将;



struct dqaimlink { char operate [10] dqaimlink 氺next ; char fieldns[20] condtree 氺 condp ; antityqueue 氺 antip dqsubaimlink 氺 subp ; }
/操作词代码(不是汉语词) /指向下一个结点的指针 域名标准汉字名集合field_name_set 指向条件树根结点的指针 指向实体队列的指针 指向子链表的指针 直接查询目标链表的主链表由知识提取目标组成,子链表由知识提取子目标组 成。主链表中每一个结点可以转换为一个SQL语句,用于生成查询语句进行答案检索。
步骤(6)在完成知识库检索后,得到的是直接查询目标的返回答案值,要形成最 终反馈给用户的回答用户目标,还需经过与上述查询目标变换过程相逆向的合成转换算 法,从而产生自然语言的答句。其中包括标准概念到复合概念的合成、直接推理目标值到间 接推理目标值的转换、以及比较判断目标答案的计算。
权利要求
一种面向中文查询句的三级查询目标分析方法,其特征在于包括以下步骤(1)根据系统语言的受限情况,通过大规模语料分析和统计,建立复合概念和推演规则的知识库;(2)在句法和词法分析的基础上,对查询句进行语义理解,识别出其中的查询目标,并将该查询目标归类为直接查询目标、逻辑推理目标、比较判断目标;(3)若识别出比较判断目标,则根据查询句类型、比较元素关系、比较元素值来源以及比较结果类型内容的不同,提取到对应的逻辑推理目标或直接查询目标;若无比较判断目标,则直接进入步骤(4);(4)若识别出逻辑推理目标,则系统需要经过概念分解或规则推演,转化为相对应的直接查询目标;若无逻辑推理目标,则直接进入步骤(5);(5)若识别出直接查询目标,系统可以直接进行查询转换,将其转换为数据提取目标,用于检索专业基本知识库获取答案;(6)根据查询和分析结果,以及查询句中初始查询目标的类型,通过概念合成和推理,产生回答用户目标的值,并以此形成反馈给用户的答句。
2. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于所 述的步骤(1)中,复合概念和推演规则的知识库指系统所属应用领域的复合概念知识库和 逻辑概念推理知识库;所述的复合概念就是指可以分解为多个标准概念,或一个标准概念 与常量的算术运算式的概念;将复合概念与标准概念之间的关系表达式建立成复合概念知 识库,只在基本知识库中保持标准概念,在分析查询句时将复合概念分解为标准概念,从而 理解查询意图;所述的逻辑概念就是指可以用多个标准概念派生的概念;逻辑概念推理知 识库则是用于保存逻辑概念与标准概念之间的推演规则,形式为逻辑产生式。
3. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于所 述的步骤(2)中,查询句包含直接查询目标、逻辑推理目标、比较判断目标中的一级或多 级,对不同形式和复杂度的查询句,采用不同层次和级别的推演变换过程,此概念变换过程 可逐级或越级进行。
4. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于所 述的步骤(3)中,比较判断目标对应于各种结构形式的查询句,从比较判断目标中分析出 需要进行比较和判断的逻辑推理目标或直接查询目标,然后由逻辑推理目标或直接查询目 标进行知识库查询,然后再反向推演出结果,再合成回答用户目标的值。
5. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于所 述的步骤(4)中,逻辑推理目标分为直接逻辑推理目标和间接逻辑推理目标;直接逻辑推 理目标是指逻辑概念推理知识库的产生式结论中出现的知识目标;间接逻辑推理目标是指 经过概念分解等价变换最终变换为逻辑概念推理知识库的产生式结论中出现的知识目标; 逻辑推理目标化解推演变换的变换过程为直接逻辑推理目标经过逻辑概念推理知识库的 产生式逆向推理,可转换为直接查询目标;逻辑推理目标求值推演变换的变换过程为对于 直接查询目标查询到的知识结果,再经过逻辑概念推理知识库的产生式推理转换为直接逻 辑推理目标的值,用于生成答句。
6. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于所 述的步骤(5)中,直接查询目标是一种对应于标准概念的查询目标;根据查询句中的直接查询目标,可以直接对知识库进行检索操作得到数据,或这些数据经过简单的概念合成等 价变换得到结果;直接查询目标分简单直接查询目标和复合直接查询目标,简单直接查询目标是指只包 含域名和聚集函数的目标;复合直接查询目标是指由简单直接查询目标经过概念合成等价 变换的目标;对于可以出现聚集函数的简单直接查询目标又可以分为显性目标、疑问目标和聚集目 标三类;显性目标是指用域名直接给出的目标;疑问目标是指用疑问词给出的目标;聚集 目标是指用聚集函数给出的目标。
7. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于所 述的步骤(6)中,回答用户目标是指自然语言查询句要求系统回答的内容,所述内容是比 较判断目标、逻辑推理目标或者是直接查询目标。
8. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于回 答用户目标和查询目标直接存在以下几种对应关系 当回答用户目标=直接查询目标时,直接查询目标的内容就是回答用户目标的值;② 当回答用户目标=逻辑推理目标时,逻辑推理目标的内容就是回答用户目标的值;③ 当回答用户目标=比较判断目标,且只有一个比较者和一个被比较者、比较者是直 接查询目标或逻辑推理目标、被比较者为常量或直接查询目标或逻辑推理目标时,则回答 用户目标的值是二者比较结果的逻辑值;④ 当回答用户目标=比较判断目标,且只有一个比较者和多个被比较者、比较者是直 接查询目标或逻辑推理目标、被比较者均为常量时,则回答用户目标的值是比较结果为真 的对应的被比较者;⑤ 当回答用户目标=比较判断目标,且只有一个比较者和多个被比较者、比较者是直 接查询目标或逻辑推理目标、被比较者均为直接查询目标或逻辑推理目标时,则回答用户 目标的值是比较结果为真的被比较者对应的查询条件块。
9. 根据权利要求1所述的面向中文查询句的三级查询目标分析方法,其特征在于所 述的步骤(1)中,复合概念和推演规则的知识库指系统所属应用领域的复合概念知识库和 逻辑概念推理知识库;所述的复合概念就是指可以分解为多个标准概念,或一个标准概念 与常量的算术运算式的概念;将复合概念与标准概念之间的关系表达式建立成复合概念知 识库,只在基本知识库中保持标准概念,在分析查询句时将复合概念分解为标准概念,从而 理解查询意图;所述的逻辑概念就是指可以用多个标准概念派生的概念;逻辑概念推理知 识库则是用于保存逻辑概念与标准概念之间的推演规则,形式为逻辑产生式;所述的步骤(2)中,查询句包含直接查询目标、逻辑推理目标、比较判断目标中的一级 或多级,对不同形式和复杂度的查询句,采用不同层次和级别的推演变换过程,此概念变换 过程可逐级或越级进行;所述的步骤(3)中,比较判断目标对应于各种结构形式的查询句,从比较判断目标中 分析出需要进行比较和判断的逻辑推理目标或直接查询目标,然后由逻辑推理目标或直接 查询目标进行知识库查询,然后再反向推演出结果,再合成回答用户目标的值;所述的步骤(4)中,逻辑推理目标分为直接逻辑推理目标和间接逻辑推理目标;直接 逻辑推理目标是指逻辑概念推理知识库的产生式结论中出现的知识目标;间接逻辑推理目标是指经过概念分解等价变换最终变换为逻辑概念推理知识库的产生式结论中出现的知 识目标;逻辑推理目标化解推演变换的变换过程为直接逻辑推理目标经过逻辑概念推理知 识库的产生式逆向推理,可转换为直接查询目标;逻辑推理目标求值推演变换的变换过程 为对于直接查询目标查询到的知识结果,再经过逻辑概念推理知识库的产生式推理转换为 直接逻辑推理目标的值,用于生成答句;所述的步骤(5)中,直接查询目标是一种对应于标准概念的查询目标;根据查询句中 的直接查询目标,可以直接对知识库进行检索操作得到数据,或这些数据经过简单的概念 合成等价变换得到结果;直接查询目标分简单直接查询目标和复合直接查询目标,简单直 接查询目标是指只包含域名和聚集函数的目标;复合直接查询目标是指由简单直接查询目 标经过概念合成等价变换的目标;对于可以出现聚集函数的简单直接查询目标又可以分为 显性目标、疑问目标和聚集目标三类;显性目标是指用域名直接给出的目标;疑问目标是 指用疑问词给出的目标;聚集目标是指用聚集函数给出的目标;所述的步骤(6)中,回答用户目标是指自然语言查询句要求系统回答的内容,所述内 容是比较判断目标、逻辑推理目标或者是直接查询目标;回答用户目标和查询目标直接存在以下几种对应关系①当回答用户目标=直接查询 目标时,直接查询目标的内容就是回答用户目标的值;@当回答用户目标=逻辑推理目标 时,逻辑推理目标的内容就是回答用户目标的值; 当回答用户目标=比较判断目标,且只 有一个比较者和一个被比较者、比较者是直接查询目标或逻辑推理目标、被比较者为常量 或直接查询目标或逻辑推理目标时,则回答用户目标的值是二者比较结果的逻辑值;④当 回答用户目标=比较判断目标,且只有一个比较者和多个被比较者、比较者是直接查询目 标或逻辑推理目标、被比较者均为常量时,则回答用户目标的值是比较结果为真的对应的 被比较者;⑤当回答用户目标=比较判断目标,且只有一个比较者和多个被比较者、比较者 是直接查询目标或逻辑推理目标、被比较者均为直接查询目标或逻辑推理目标时,则回答 用户目标的值是比较结果为真的被比较者对应的查询条件块。
全文摘要
一种面向中文查询句的三级查询目标分析方法,包括步骤根据系统语言的受限情况,建立复合概念和推演规则的知识库;识别出其中的查询目标并归类为直接查询目标、逻辑推理目标、比较判断目标;若识别出比较判断目标,提取到对应的逻辑推理目标或直接查询目标,若无则直接进入下一步骤;若识别出逻辑推理目标,转化为相对应的直接查询目标,若无则直接进入下一步骤;若识别出直接查询目标,系统可以直接进行查询转换,将其转换为数据提取目标,用于检索专业基本知识库获取答案;根据查询和分析结果,以及查询句中初始查询目标的类型,通过概念合成和推理,产生回答用户目标的值,并以此形成反馈给用户的答句。本发明能够理解不同结构形式的用户查询句,用户查询句在表述方式上更为自由。
文档编号G06F17/30GK101706792SQ200910172770
公开日2010年5月12日 申请日期2009年11月27日 优先权日2009年11月27日
发明者乔保军, 毋琳, 葛强, 赖积保, 郑逢斌 申请人:河南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1