语言表达的自然语言识别方法和装置的制作方法

文档序号:2830503阅读:261来源:国知局

专利名称::语言表达的自然语言识别方法和装置的制作方法
技术领域
:内的客户咨询,例如与移动电话和费用相关的事宜上,总是要求一个高效的语言识别系统。为了理解为数众多的客户所作的表达,则要求较大的语法块,其范围会造成识别可靠性的降低。每个自动语言识别过程都建立在对一个储存了词汇和语句的具体呼叫表达进行比较的基础上。只有当其一致时,一条表达才会被识别并触发一个特定的行为。但由此会产生一个"Gmmmer困境"小语法块的识别范围较小,但却拥有较好的识别可靠性;相反,大语法块涵盖了一个较大的表达范围,但其识别可靠性却会降低。因此,本发明的目的就在于,在语法块范围较小时实现具有较大识别范围的语言识别方法和系统,寻求一个能发挥大语法块和小语法块的优势而避免其各自短处的语法模块。按照本发明,该目的是通过具有独立专利要求中所描述技术特征的一种方法和装置来实现的。从属权利要求中阐述了本发明的优选实施方式以及其它的优势特征。符合本发明的方法建立在以下基础上理解某个人的语言表达,并将其转化为一种可由语言识别装置进行处理的语言信号,在语言识别装置的多个语言识别分支中使用多个语法块对该语言信号进行同时或连续性的分析,以及在至少一个语言识别分支中对语言信号的分析为肯定的情形下成功地完成该识别过程。7在本发明的第一种实施方式中,通过两个或多个独立语法块对语言表达同时进行分析。在这种情况下,一个人的语言表达将同时启动两个或多个识别过程,所述的识别过程相互独立地对语言表达进行分析和鉴定。例如,可以在一个具有小识别范围的相对较小的主语法块旁边设置一个具有扩展了识别范围的较大的次语法块。两个语法块之间没有交集。本发明的第二种实施方式涉及一个语法块阶梯。在此模式中,各种不同的语法块是一个接一个地、即连续性地发挥作用。一个语法块在其给出识别结果这一刻离开阶梯,识别过程也就结束。在这个方法中所有要被识别的表达将百分之百地与第一语法块相比较。根据语法块的工作效率和排列形式的不同,有一部分(如20%)未被识别的表达被送至第二识别阶。如果还设置了第三识别阶,则可以推断,收到的所有表达的一部分(如5%)会到达这个第三识别阶。两种识别方法都以多个"较小"语法块覆盖了一个广泛的表达范围。这些"较小"语法块相互连接而保障了一个大的识别可靠性。如上所述,这一点可以以同时的或相继的识别方法的形式进行。以下籍由附图对本发明的两种优选实施方式进行描述。图1用图表形式示出了语言识别系统的第一种实施方式,在该实施方式中,语言识别系统具有平行工作的语言识别分支。图2用图表形式示出了语言识别系统的第二种实施方式,在该实施方式中,语言识别系统具有相继工作的、呈阶梯状的语言识别分支。根据图l,一个人的语言表达,在此处作为语言信号IO,同时流向两个语言识别分支,并通过两个语法块12和14(语法块A和语法块B)进行分析。两个语法块12和14没有交集,也就是说,它们是建立在不同的规则体系上。对语言信号进行平行处理使得分析耗费上升,由此在一台电脑上应用该方法时也增加了必要的计算机负荷。但这种状况将通过快速识别和得到显著改善的识别可靠性得以补偿。将语言信号和语法块(A)12进行比较16,或者导致一个肯定的识别结果(是),或者导致一个否定的识别结果(否)。同样语言信号和语法块(B)14的比较18也或者导致一个肯定的识别结果(是),或者导致一个否定的识别结果(否)。在语法块12和14同时工作的识别过程框架下,会产生四种可能的识别情形,它们可通过一个逻辑20以不同方法进行分析利用。9<table>tableseeoriginaldocumentpage10</column></row><table>识别情形1至3给出的结果为明确的,就这点而言不会有什么问题。情形l中,语言信号未被识别并因此引起一个回绝(位置24)。情形2和3各自仅给出一个肯定的结果并因此明确显示对语言信号的识别(位置22)。情形4中,两个语法块12和14都识别了语言信号10,而为此必须执行一个特殊的程序逻辑,因为其结果不是明确的。所述的程序逻辑可固定作出有利于语法块12的决定,或根据识别可靠性(confidencelevel)作决定,或者形成上述两点的一个混合形式(例如语法块14产生的结果只有在其识别可靠性比语法块12的结果高出一个预设值时才能被使用)。按照本发明,也可以并非设置两个平行的语言识别分支,而是三个或多个平杆T作的误吉诏别4V方。图2示出的是本发明的另一种优选实施方式。此处将多个语法块12、14和26(语法块A、B和C)以一个阶梯形式顺序连接起来,也就是说,在语法块阶梯中不同的语法块12、14和26不是同时、而是相继地起作用的。其识别过程通过图示作了如此描述一个语法块在其给出一个肯定结果的一刻离开阶梯,识别过程也就结束(位置22)。语言信号10首先流向第一个语法块(A)12,并在这里得以分析。语言信号与语法块(A)12的比较16或者导致一个肯定的识别结果(是),这时识别过程成功地结束;或者导致一个否定的结果(否),这时语言信号为了作进一步的分析而流向第二个语法块(B)14。语言信号10与语法块(B)14的比较18或者导致一个肯定的识别结果(是),这时识别过程成功地结束;或者导致一个否定的结果(否),这时语言信号为了作进一步的分析而流向第三个语法块(C)26。语言信号与语法块(C)26的比较28或者导致一个肯定的识别结果(是),这时识别过程成功地结束;或者导致一个否定的结果(否),这时语言信号作为未被识别的信号而被回绝(位置24)。在这个方法中,首先所有收到的语言信号10百分之百地与第一个语法块12进行比较。根据该语法块工作效率和设计形式的不同,语言表达的一部分将未被识别,这些未被识别的语言信号于是继续被送至第二个识别阶。根据第二个识别阶的工作效率和设计形式的不同,语言信号于是继续被送至第三个识别阶。相对于通过多个语法块同时进行识别的方法而言,语法块阶梯的优先在于该方法不会产生额外的计算机负荷,因为语言信号10在任何时刻都仅仅与一个语法块进行比较。但是通过这种相继性识别必然会引起系统的延迟时间增加。按照本发明,也可以并非设置三个阶梯状的语言识别分支,而是四个或多个相继工作的语言识别分支。12附图标记表10语言信号12语法块A14语法块B18分支A20分支B22识别成功24识别不成功26语法块C28分支C权利要求1.一种语言表达的自然语言识别方法,包括以下步骤-理解语言表达,并将其转化为由语言识别装置进行处理的语言信号(10),-在语言识别装置的多个语言识别分支中使用多个语法块(12,14,26)对该语言信号(10)进行平行或相继地分析,以及-在至少一个语言识别分支对该语言信号的分析给出肯定的分析结果的情形下成功地结束语言表达的识别过程。2.根据权利要求1所述的方法,其特征在于以下步骤a)语言信号至少流向包含第一个语法块(12)的第一个语言识别分支,以对语言信号(10)进行分析,并且同时流向包含第二个语法块(14)的第二个语言识别分支,以对语言信号进行分析;b)通过第一个语法块(12)对语言信号进行分析,其中,在语言表达被识别的情形下产生一个肯定的第一个识别结果,在语言表达未被识别的情形下产生一个否定的第一个识别结果;c)通过第二个语法块(14)对语言信号进行分析,其中,在语言表达被识别的情形下产生一个肯定的第二个识别结果,在语言表达未被识别的情形下产生一个否定的第二个识别结果;d)籍由对第一个和第二个识别结果的分析,作出成功识别语言表达的决定。3.根据权利要求1所述的方法,其特征在于以下步骤a)语言信号流向包含第一个语法块(12)的第一个语言识别分支,以对语言信号(10)进行分析;b)通过第一个语法块(12)对语言信号(10)进行分析,其中,在语言表达被识别的情形下产生一个肯定的第一个识别结果,识别过程也就结束,在语言表达未被识别的情形下产生一个否定的第一个识别结果;c)其中,在识别结果为否定的情形下,语言信号流向包含另外一个语法块(14)的另外一个语言识别分支;d)通过该另外一个语法块(14)对语言信号(10)进行分析,其中,在语言表达被识别的情形下产生一个肯定的识别结果,识别过程也就结束,在语言表达未被识别的情形下产生一个否定的识别结果;e)其中,在识别结果为否定的情形下,以步骤(c)继续,直到所有存在的语言识别分支的语法块(26)被用到为止。4.根据权利要求1至3中任何一个权利要求所述的方法,其特征在于,语法块(12,14,26)的各套规则互相无交集。5.根据权利要求1至3中任何一个权利要求所述的方法,其特征在于,语法块(12,14,26)的各套规则6.根据权利要求1至5中任何一个权利要求所述的方法,其特征在于,第一个语法块(12)分析的是经常出现的语言表达,第二个语法块(14)分析的较少出现的语言表达,而其它的每一个语法块(26)分析的语言表达出现的频率甚至更少。7.根据权利要求1至6中任何一个权利要求所述的方法,其特征在于,如果第一个和第二个识别结果均为肯定,则使用由第一个语法块(12)给出的识别结果。8.根据权利要求1至6中任何一个权利要求所述的方法,其特征在于,如果第一个和第二个识别结果均为肯定,则使用识别可靠性最高的识别结果。9.一种语言表达的自然语言识别装置,包括-理解语言表达,并将语言表达转化为由语言识别装置进行处理的语言信号的设备(IO),-带有多个语言识别分支的语言识别装置,其中每个语言识别分支有一个语法块(12;14;26)对该语言信号(10)进行分析,其中,该语言信号是平行地或相继地流向语言识别分支,以及-根据至少一个语言识别分支的识别结果,对识别过程进行操控和分析的设备(20;22,24)。10.带有一个在计算机上运行的程序代码的计算机程序,用于实施根据权利要求1至8中任何一个权利要求所述的方法。11.包含可在计算机上运行的程序代码的计算机程序产品,,用以实施根据权利要求1至8中任何一个权利要求所述的方法。全文摘要本发明涉及一种语言表达的自然语言识别方法及装置。首先理解一个人的语言表达,并将其转化为由语言识别装置进行处理的语言信号,此后在语言识别装置的多个语言识别分支中使用多个语法块对该语言信号进行平行或相继地分析,其中。在至少一个语言识别分支对该语言信号的分析给出肯定的分析结果的情形下成功地结束语言表达的识别过程。文档编号G10L15/28GK101484934SQ200780024659公开日2009年7月15日申请日期2007年6月14日优先权日2006年6月27日发明者克劳斯迪特尔·利特克,古特博特·马克盖夫卡,埃克哈德·海恩斯申请人:德国电信股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1