一种开放式自然语言动态生成系统的制作方法

文档序号:6605244阅读:191来源:国知局
专利名称:一种开放式自然语言动态生成系统的制作方法
技术领域
本发明涉及计算机对自然语言的处理技术,特别涉及一种开放式自然语言动态生成系统。
背景技术
目前,随着计算机的普及,人们对智能化人机交互系统、机器翻译系统及其他特定信息处理系统的需求不断增多,对系统相关信息进行处理并加以智能化和人性化的呈现成为一个被广泛关注的领域,而作为人类最基本的信息交流手段之一自然语言的智能化呈现,则是该领域中的一个热点。
现有的智能化人机交互系统中,往往是一对一的方式。一般的情况是用计算机的程序语言实现各种约定好的语言逻辑,这需要完全按照约定好的语言逻辑来编写程序语言,同时要求在人机交互过程中,必须按照约定好的语言逻辑来输入自然语言,这种方法实现过程繁琐且无法适应灵活多变的交互引导需求。
现有的机器翻译系统中,大多只能按照程序中所描述的语法、语义对翻译后的词汇进行重新组合,并形成最终的目标语言。
虽然有极少数系统在形成目标语言过程中还引入了一定的语言模板概念,给出了固定的语言模板,以填空为基本方式形成目标语言。这样的固定语言模板,对于简单的特定业务或专业翻译有一定的成效。但是,固定语言模板只能针对某些特定的业务或特定的翻译专业,这就需要对每种要求自然语言呈现的业务或翻译的专业分别进行程序开发,并要求开发人员具有多种业务知识和所翻译专业的专业知识,从而造成大量的人力、物力的资源浪费。而且,由于面向的是最终用户,产品一旦发布便难以对即定的语法关系及语言模板进行调整,而其要求自然语言呈现的对象却是一个无限的不确定领域,因此采用固定的语言模板难以生成符合人的表述习惯的自然语言。

发明内容
有鉴于此,本发明的目的在于提供一种开放式自然语言动态生成系统,能够由用户根据业务需求自主地动态编写或解析自然语言模板,形成人性化的自然语言。
为达到上述目的,本发明的技术方案具体是这样实现的一种开放式自然语言动态生成系统,该系统包含自然语言模板创建模块,将从动态信息存储模块中提取的信息变量作为信息槽,和根据不同业务信息提取的自然语言原形进行组合,创建自然语言模板;动态信息存储模块,用于存储业务信息;自然语言模板解析模块,将从动态信息存储模块中提取的信息值插入自然语言模板的信息槽,生成自然语言输出。
其中,自然语言模板创建模块可以进一步包含自然语言模板组合单元,其将自然语言原形中的具体业务信息用信息槽替换,组合为自然语言模板。自然语言模板创建模块还可以进一步包含自然语言模板修改单元,由用户根据业务要求通过该修改单元修改自然语言模板的自然语言原形和信息槽。自然语言模板创建模块骇异包含自然语言模板检验单元,检验创建的语言模板的完整性和是否符合自然语言模板的编写格式。同时,自然语言模板创建模块还可以进一步包含自然语言模板存储单元,其将生成的自然语言模板以文件形式或数据库记录形式保存。
动态信息存储模块可以为计算机存储器或网络存储器。
自然语言模板解析模块可以进一步包含自然语言模板检验单元,检验自然语言模板创建模块创建的语言模板的完整性和是否符合自然语言模板的编写格式。自然语言模板解析模块还可以进一步包含自然语言输出单元,其将生成的自然语言由计算机合成为语音通过放音设备输出;或将该自然语言以文字形式输出到计算机显示器上。
因此,本发明的这种开放式自然语言动态生成系统,为用户提供了一种简单、灵活的创建语言模板及对该语言模板进行解析的系统,用户在该系统中不需要编写任何的代码便能够创造出各种灵活的自然语言模板,并在该系统中能够方便的实现语言模板与相关动态信息的有机融合,降低了开发成本,提高了灵活性。


图1为本发明系统的应用方式示意图。
具体实施例方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明进一步详细说明。
参见图1,图1为本发明系统的应用方式示意图。如图1所示,本发明的开放式自然语言动态生成系统100包含自然语言模板创建模块101、动态信息存储模块102和自然语言模板解析模块103。
其中,自然语言模板创建模块101,包含了一个自然语言模板组合单元,其将从动态信息存储模块中提取的信息变量作为信息槽,并将自然语言原形中的具体业务信息值用信息槽替换,组合为自然语言模板104。自然语言模板创建模块101还包含自然语言模板修改单元,用户可以根据业务要求通过该修改单元修改自然语言模板的自然语言原形和信息槽。自然语言模板创建模块101还包含自然语言模板检验单元,检验创建的语言模板104的完整性和是否符合自然语言模板的编写格式。另外,自然语言模板创建模块101还包含自然语言模板存储单元,其将生成的自然语言模板以文件形式或数据库记录形式保存。
动态信息存储模块102,用于存储业务动态信息,该模块可以是计算机存储器或网络存储器。
自然语言模板解析模块103,将从动态信息存储模块中提取的信息值插入自然语言模板104的信息槽,生成自然语言输出。自然语言模板解析模块103还包含自然语言模板检验单元,检验自然语言模板创建模块创建的语言模板104的完整性和是否符合自然语言模板的编写格式。同时,自然语言模板解析模块103还包含自然语言输出单元,其根据所应用系统的需要将生成的自然语言保存,或将该自然语言由计算机合成为语音通过放音设备输出,或将该自然语言以文字形式输出到计算机显示器上。
总之,自然语言模板创建模块101主要用于创建一系列可供系统按照灵活的自然语言方式呈现内部动态信息的自然语言模板104;自然语言模板解析模块103则对系统所有自然语言模板的呈现提供相应的支持。
由图1可知,开放式自然语言动态生成系统100实际上完成了从人性化自然语言中抽象自然语言模板104,然后再将自然语言模板104恢复为与之对应的自然语言的一个循环过程。在该循环过程中除了上述两种语言状态及两大功能模块之外,其中的动态信息存储模块103主要存储一些与具体语言模板涉及业务相关的数据信息,并且其内容通常具有动态和不确定性的特点。
以下结合开放式自然语言动态生成系统在语音邮件系统中的应用实例,有针对性的对开放式自然语言动态生成系统的具体应用过程进行说明。这里的语音邮件系统是指通过电话与系统的语音交互来进行邮件读和写的系统。
开放式自然语言动态生成系统在语音邮件系统中的应用,主要是在人机对话过程中,将系统信息以自然语言通过放音设备播放给用户。
要将系统信息以自然语言通过放音设备播放给用户,需要在语音邮件系统投入使用之前,在系统中通过开放式自然语言动态生成系统建立自然语言模板。其具体应用过程为第一步,在使用开放式自然语言动态生成系统创建自然语言模板之前,首先需要明确当前创建语言模板所需要涉及的业务范围,即图1中的动态信息存储模块中存储的是哪些业务动态信息,在本实施例中,业务动态信息是指邮件主题、邮件正文、发信人等与邮件相关的各种系统原始信息,动态信息存储模块在语音邮件系统中可以是服务器中的存储器。
第二步,根据动态信息存储模块中存储的动态信息涉及业务的语言呈现需要,整理提取各种描述系统服务和业务状态的人性化自然语言原形并将其中的信息变量设置为信息槽,如“您现在有五封邮件,一封来自张三、两封来自李四、两封来自王五”。其中,总邮件数“五”设置为信息槽[AllMailNum]、一个用户发送的邮件总数“一”或“两”设置为信息槽[UserMailNum]、发送邮件的用户“张三”、“李四”或“王五”设置为信息槽[UserMailName],即能够从系统中获得信息值的信息变量可以设置为信息槽。这些信息变量有些是直接从系统能够获得的信息,如邮件来源“张三”等,有些是需要系统经过统计获得的信息,如邮件的封数“五”等。这两类信息共同满足自然语言原形对系统各种描述的需要,另外有些语言原形如“您现在没有任何邮件”与系统中保存的系统信息相同,不需要信息槽支持,保留语言原形。
第三步,利用开放式自然语言模板创建模块,将自然语言原形与信息槽按照创建开放式自然语言模板的规则,用信息槽替换在自然语言原形中与之对应的词汇,并最终形成与自然语言原形对应的自然语言模板。另外有些语言原形如“您现在没有任何邮件”与系统中保存的系统信息相同,不含信息槽,直接用做自然语言模板。如表一所示的两种不同表述的自然语言模板。由表一可知对于不需要信息槽支持的自然语言模板,如表一中的例二,其保留与自然语言原形完全一样的词汇信息。表一中,{}表示其中有重复的内容。

表一自然语言模板生成后,由自然语言模板创建模块中的检验单元来检验该模板的完整性和是否符合自然语言模板的编写格式,检验正确后,保存该模板。
这样生成的自然语言模板,在本实施例中以数据库记录形式存储于系统的数据库中,当业务发生变化或信息槽需要修改时,通过自然语言模板创建模块中的自然语言模板修改单元直接修改数据库记录即可。
在语音邮件系统使用过程中,将系统中的系统信息以人性化描述的自然语言播放给用户。此时,利用开放式自然语言模板解析模块将上述过程创建的自然语言模板进行解析,该模块能够将该自然语言模板唯一解析为人性化描述的自然语言,为了实现该解析过程,首先需要确定当前自然语言模板所属的业务范畴,如表一中例一所示的自然语言模板“您现在有[AllMailNum]封邮件,{[UserMailNum]封来自[UserMailName]、}”属于语音邮件业务;其次将开放式自然语言动态生成系统中动态信息存储模块中存储的动态信息相关联,即调用与邮件服务器相关的接口,实现语音邮件系统与远程邮件动态信息之间的信息同步。
具体地说,就是自然语言模板解析模块,将从动态信息存储模块中提取的信息值插入自然语言模板的信息槽,生成自然语言。自然语言生成后,由自然语言模板解析模块中的自然语言检验单元检验自然语言模板的完整性和是否符合自然语言模板的编写格式。检验正确后,保存该自然语言,并由自然语言模板解析模块中的自然语言输出单元,将该自然语言由语音邮件系统通过放音设备输出给用户,实现对系统信息动态个性化的呈现。
本发明的这种开放式自然语言动态生成系统,不仅能够为用户提供灵活多样的自然语言模板,并根据动态信息源的动态信息对其进行智能化的解析,最终形成人性化的自然语言。而且真正实现了自然语言模板创建和解析过程的分离,并将原本需要通过一对一编程实现的烦琐过程变的非常简单,不需要通过编程实现各种信息的呈现,而只需用户明确希望呈现的内容和表述方式,然后按照语言模板的编写规则,便完成了采用自然语言呈现系统信息的工作。降低了开发成本,提高了灵活性,具有广阔的应用前景。
权利要求
1.一种开放式自然语言动态生成系统,其特征在于,该系统包含自然语言模板创建模块,将从动态信息存储模块中提取的信息变量作为信息槽,和根据不同业务信息提取的自然语言原形进行组合,创建自然语言模板;动态信息存储模块,用于存储业务信息;自然语言模板解析模块,将从动态信息存储模块中提取的信息值插入自然语言模板的信息槽,生成自然语言输出。
2.如权利要求1所述的开放式自然语言动态生成系统,其特征在于所述的自然语言模板创建模块进一步包含自然语言模板组合单元,其将自然语言原形中的具体业务信息用信息槽替换,组合为自然语言模板。
3.如权利要求1所述的开放式自然语言动态生成系统,其特征在于所述的自然语言模板创建模块进一步包含自然语言模板修改单元,由用户根据业务要求通过该修改单元修改自然语言模板的自然语言原形和信息槽。
4.如权利要求1所述的开放式自然语言动态生成系统,其特征在于所述的自然语言模板创建模块进一步包含自然语言模板检验单元,检验创建的语言模板的完整性和是否符合自然语言模板的编写格式。
5.如权利要求1所述的开放式自然语言动态生成系统,其特征在于所述的自然语言模板创建模块进一步包含自然语言模板存储单元,其将生成的自然语言模板以文件形式或数据库记录形式保存。
6.如权利要求1所述的开放式自然语言动态生成系统,其特征在于所述的动态信息存储模块为计算机存储器或网络存储器。
7.如权利要求1所述的开放式自然语言动态生成系统,其特征在于所述的自然语言模板解析模块进一步包含自然语言模板检验单元,检验自然语言模板创建模块创建的语言模板的完整性和是否符合自然语言模板的编写格式。
8.如权利要求1所述的开放式自然语言动态生成系统,其特征在于所述的自然语言模板解析模块进一步包含自然语言输出单元,其将生成的自然语言由计算机合成为语音通过放音设备输出;或将该自然语言以文字形式输出到计算机显示器上。
全文摘要
本发明公开了一种开放式自然语言动态生成系统,该系统包含自然语言模板创建模块,将从动态信息存储模块中提取的信息变量作为信息槽,和根据不同业务信息提取的自然语言原形进行组合,创建自然语言模板;动态信息存储模块,用于存储业务信息;自然语言模板解析模块,将从动态信息存储模块中提取的信息值插入自然语言模板的信息槽,生成自然语言输出。用户在该系统中不需要编写任何的代码便能够创造出各种人性化的自然语言模板,并在该系统中能够方便的实现语言模板与相关动态信息的有机融合,降低了开发成本,提高了灵活性。
文档编号G06F17/28GK1512398SQ0215924
公开日2004年7月14日 申请日期2002年12月27日 优先权日2002年12月27日
发明者孙久文, 王楠, 孙文彦, 诸光, 任文捷, 刘武, 王江, 申江涛, 高建忠, 王建新 申请人:联想(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1