产生具有多样化对话行为的对话管理机制的方法及系统的制作方法

文档序号:6468694阅读:144来源:国知局

专利名称::产生具有多样化对话行为的对话管理机制的方法及系统的制作方法
技术领域
:本发明关于一种用于产生具有多样化对话行为的对话管理机制的方法及系统。
背景技术
:由于语音对话系统(spokendialoguesystem)已广泛使用,对话系统中的对话管理才几制(dialoguemanager,DM)变得日益复杂。在对话系统的设计中,DM不单单牵涉到技术,更与设计有关。因此,除了根据所分析的使用者语音数据来判定适当的系统回应之外,亦考虑使用者回应于系统的观感。因而,当前对话系统中的大多数是通过人工设计的。虽然手动设计确保了对话系统的精确度,但设计成本相当高,尤其是在设计复杂的对话系统时。此外,当DM规则的总数增加时,难以维持整个系统的一致性。在已知对话系统的设计中,固定对话行为模式已满足了基本需要。然而,随着对话系统的应用的扩展,许多应用需要更加多样化及变化的对话系统。以对话系统在语言学习中的应用为例,如果每次使用者与系统互动时,系统行为始终不变,则使用者/学习者使用所述系统的兴趣降低。相反,如果系统行为多样化,则即使教材内容不变,多样化的系统行为亦可增强学习者的学习动力。因此,对于下一代对话系统,在对话系统的设计中,如何有效促进对话系统产生多样化对话行为已成为一重要课题。在名为「用于互动式面向对象对话管理的方法及系统(MethodandSystemforInteractiveObject-orientedDialogueManagement)」的美国专利第5,694,558号中,提供一种互动式面向对象DM系统,其中使用基于状干不同状态),且每一子对话具有相应对话内容及对话流程。操作DM以根据当前对话的环境来判定是否需过渡至其他状态。每一状态(亦即,每一子对话)可由一对象来表示。在名为「用于对话管理的方法(MethodforDialogManagement)」的美国专利第7,167,832号中,提供一种DM系统,其中DM的流程架构集中于动因(motivator)的设计。由所述专利7>开的DM包含多个动因,且根据动因来处理对话系统中的对话内容。所述专利的DM至少包含两个动因假设及确认。此外,名为r对话流程解译器开发工具(DialogueFlowInterpreterDevelopmentTool)」的美国专利第7,024,348号提供用于对话系统的对话流程开发工具,以便经由特定控制语言产生数据文件。数据文件含有语音系统中所需的提示、回应、分支及对话流程。经由特殊处理,数据文件可自动产生语音应用,以便节约整个语音对话系统的开发成本。已知DM设计方法一般包含经由基于对话文法的设计、基于计划的DM及协作DM(CollaborativeDM)。不同方法具有不同特性,且可应用于不同领域。此外,近几年来,在实作中相当通用的做法是将所述方法彼此组合。除了在过去几十年中一般使用的方法之外,一些学者最近提出经由与使用者的互动进行对话系统学习相关回应。在所述方法中,一般而言,使用者设计对话的状态及相关目标函数,且利用强化学习(reinforcementlearning)的才支术。举例而言,在诸i口由E.Levin、R.Pieraccini及Eckert等人发表的"UsingMarkovDecisionProcessesforLearningDialogueStrategies"(其公布于IEEEr语音及音讯处理学l艮」(TransactionsonSpeechandAudioProcessing)的会议记录,1998年,第8巻,第11至23页中)或由S.Singh、D.Litman、M.Kearns及M.^Valker等人发表的"OptimizingDialogueManagementwithReinforcementLearning:ExperimentswiththeNJ-flinSystem"(其/>布于r人工智慧研究期刊」(JournalofArtificialIntelligenceResearch),2002年,第16巻,第105至133页中)的论文中,令对话系统经由目标函数了解在状态之间过渡的权重。经由所述方法,可通过自动训练获得权重,但设计者必须预先界定状态间的转换。然而,经由以此方法进行设计,所获得的DM为固定DM,且无法经训练而产生具有相同对话目的的多样化变化。
发明内容为了使本发明的前文提及与其他目标、特征及优点易于理解,下文辅以附图详细描述实施例。6本发明提供一种用于产生具有多样化对话行为的对话管理机制(dialoguemanager,DM)的系统。系统包4舌训练才莫块(trainingmodule)及使用者模拟模块(usersimulationmodule)。训练模块接收原始DM初始随机地产生多个第一对话管理机制。使用者模拟模块用于模拟使用者行为,且所述第一对话管理机制会经由使用者模拟模块模拟使用者行为之间的所述对话以产生多个对话记录,其中训练-溪块#4居对话记录调整新DM,以便产生至少一多样化对话管理机制。本发明提供一种用于产生具有多样化对话行为的对话管理机制(DM)的方法。在所述方法中,依据原始DM随机产生多个新DM。以一预设DM以用于模拟使用者行为,且每一新DM经由该预设DM以用于模拟使用者行为以产生分别对应于每一新DM的至少一对应对话记录。通过分析对话记录而获得每一新产生的DM的评估分数。相应地产生至少一新导出的DM。架构的功能的示意性方块图。图2A说明由原始DM产生的状态图,且图2B说明由新DM产生的状态图。图3说明用于说明根据本发明的实施例用于产生具有多样化对话行为的对话管理机制(DM)的方法的示意性流程图。图4说明对原始DM信息执行的交换操作,且对DMi及DMj分别执行交换操作。图5A及图5B分别说明原始DM及新DM中的对话记录及状态图。图6A及图6B说明用于通过状态图评估DM的分数的实施例。图7A及图7B说明本发明的实施例的使用者模拟模块的架构的实施例。图8A说明对话实例的内容。图8B说明根据图8A的原始对话实例依据按活动、日程及建议的类别产生的两组新的对话内容。图9说明一组原始DM规则。图10说明依据DM规则将DM规则之一部分标记为活动,且回应对话对应于所述活动。图11说明将DM规则的一部分标记为语音行为。图12说明将DM身见则的一部分标记为其他变量。图13说明新产生的DM。图14说明用于说明根据本发明的实施例的具有多样化对话行为的DM架构的功能的示意性方块图。图15A为由原始DM产生的对话状态图。图15B为新对话状态图。图16A及图16B为分别由原始DM及新DM产生的经放大的对话状态主要元件符号说明100、1400:架构110:原始DM120、1420:训练才莫块122、1422:评估模块124、1424:规则产生模块130:DM信息140、1460:使用者模拟模块510:原始DM失见则组520、1470、1472、1474:对话记录530、540:状态图610:原始状态图620:新状态图700:对话系统710、730:对话管理机制712、732、746、1454、1456:语言产生单元714、734、748:文字转语音单元716、736、742:自动语音识别单元718、738、744、1452、1458:语言理解单元720:使用者740:使用者模拟对话管理机制1412、1442、1444、1446:控制文件1430:对话管理模块1440:存储装置AE:状态ala5、Mb5:规则S310S340:方法步骤具体实施例方式现将详细参考本发明的本实施例,本实施例的实例在随附附图中说明。凡可能之处,在附图及实施方式中使用相同参考标号代表相同或类似部分。本发明的实施例针对用于根据由设计者设计的对话管理机制(dialoguemanager,以下简称为DM)自动产生多个具有相同目的^f旦具有不同对话行为的DM。本发明提供自动辅助工具,以便促进对话流程的设计及DM规则的调整,且亦帮助系统设计者找出原始DM中的可能问题。上述方法可应用于具有任一架构的DM,包含基于对话文法、基于计划的DM及协作DM。本发明的实施例的上述方法集中于产生具有不同对话行为但具有相同对话目的的多样化DM。在上述用于对话系统的DM中,将原始DM与使用者模拟技术及经特殊设计的计分函数一起利用,以便在重复对话模拟多次之后自动产生多个新DM。新的DM达成与原始DM相同的对话目的,但在对话过程中在系统行为及回应方面与原始DM不同。经由上述方法,可使对话系统的对话流程更加丰富,同时亦促进对DM的设计及改良。根据一实施例,提供一种用于产生具有多样化对话行为的DM的方法,所述方法采用训练机制(trainingmechanism)、使用者才莫拟模块(usersimulationmodule)。训练机制包含评估模块,用于根据对话记录(dialoguelog)评估不同DM的对话目的之间的相似度,藉此产生多个DM。使用者模拟机制为经预设以模拟使用者行为的DM。根据一实施例,训练机制包含评估模块及规则产生模块。评估模块根据由DM与使用者模拟模块之间的互动所产生的对话记录来产生对DM的9评估分数。规则产生模块根据多个DM的评估分数对DM执行变化操作。接着,产生新DM。在若干轮训练之后,随着所产生的DM的评估分数变高,对话目的愈来愈相似于原始DM的对话目的。同时,经由规则产生模块,确保所产生DM的行为与原始DM的行为不同。根据一实施例,评估模块分析由DM与使用者模拟^t块之间的互动产生的对话记录,以便找出新产生的DM与由使用者设计的DM之间的差异,藉此根据所述差异设定对DM的评估分数。根据一实施例,规则产生模块首先根据使用者设计的DM随机地改变DM的一部分内容,以便产生多个不同DM。每一DM与使用者模拟机制之间的互动可产生对应对话记录。对话记录由评估机制评估。在评估之后,变异机制及规则产生模块根据每一对话DM的评估分数对DM执行变异操作,藉此产生新DM,以便提供用于随后训练的DM。使用者模拟机制亦为用于经由人工而设计或收集DM行为的DM,以便模拟与对话系统互动的使用者的所有可能行为模式。根据本发明,自动产生多个具有相同目的但具有不同对话行为的DM。即将当前DM与使用者模拟技术及经特殊设计的计分函数一起利用,以便自动产生多个新DM。下文经由特定实施例详细说明本发明。参看图1,提供用于说明根据本发明的另一实施例的具有多样化对话行为的DM架构的功能的示意性方块图。架构100包含训练模块120及使用者模拟模块140。训练模块120还包含评估模块122及规则产生模块124。训练模块120接收在外部用人工制作的原始DM110。首先,规则产生模块.124随机地产生多个不同DM信息130,例如,图中展示的DM,、DM2........DMN。使用者模拟模块140为经预设以模拟使用者行为的DM。使用者模拟模块140在使用者利用系统的DM模块进行对话时模拟使用者的行为,且在根据不同DM单元DM。DM2........DMN经使用者模拟模块140的对话模拟之后产生N个对应对话记录(例如,图中所示的DL。DL2........DLN)。接着,训练模块120中的评估模块122依据对话记录DLpDL2........DLw评估不同DM的对话目的之间的相似度。最后,规则产生模块j^据现存DM的分数产生多个DM。重复上述动作,将新的多个DM经过n次的对话模拟分别产生对话记录后,则经n次对话模拟产生的多个DM则会相似于原始DM110。规则产生模块124的操作方式描述如下。起始时,随机修改原始DM110中的某些规则以获得新DM。因此,相应地产生总共N个DM,即DM!、DM2........DMN,经使用者模拟模块140的对话4莫拟之后产生N个对应对话记录DLi、DL2.......、DLN,根据对应对话记录DL"DL2........DLN得到的评估分数分别为S,、S2........Sn。规则产生模块124可根据演化计算(evolutionarycomputation)来产生新的DM。例如,以"再生(reproduction)"演算法来产生新的DM。因此,假设DM;在下一周期中被保留机率Pj为尸二i/7=i保留机率Pi根据评估分数的量值判定。亦即,根据保留机率Pj,保留N个DM中的m个DM,且经由随机修改原始DM而产生其他(N-m)个DM。规则产生模块124亦可采用演化计算的变异(mutation)演算法。变异演算法是将DM中的某些规则"变异"为新规则。举例而言,如果存在DM规则,A为主体,C为活动,r为"Tom",s为"打网球",则Action!意味着对话行为如果(A^)且(C:s)则Action"在变异之后,"Action,可改变成"Actionn",使得规则变成如果(A^)且(C二s)则Actionn。Actionn为不同于Action,的另一对"i舌4亍为。规则产生模块124可采用另一演化计算-"交换(crossover)"演算法,将随附图4介绍"交换"模式。评估模块122的评估方式亦在下文随附图5A及图5B介绍,评估模块122的评估分数随附图6A及图6B介绍。规则产生模块124亦可将上述演化计算,再生、变异、组合、交换等演算法分别结合来产生新的DM。评估模块122的设计展示如下。1.界定对话系统的一组可能状态,使得对话记录DL!、DL2........DLN中的每一句子对应于系统状态的清单中的一对话状态。其中,对话状态可依使用者的常用对话状态来分类,例如可将对话状态分成以下三种态样,语音行为(speechact)类型、活动(activities)类型、4亍程(schedule)类型。2.将所有对话记录中的每一句子对应的对话状态,且对话状态根据对话的上下文4皮此互相连接,以获得一状态图(statediagram)。此状态图表示当前DM与使用者模拟机制之间的对话行为。3.对原始DM的状态图与新DM的状态图进行比较,以便根据相似度判定是否需要新DM。其中,新DM的状态图间的连接不能超过当前DM的连接。然而,自初始状态至结束状态的路径可与原始DM的路径不同。因此,在步骤3中,将相似度界定为(1)新DM的状态连接超过原始DM的状态连接的比例,其中比例愈低,新DM与原始DM在状态之间的可能过渡方面愈趋向于相似,因此分数愈高;及(2)在新DM的状态连接中,初始状态是否连接至其他状态及所述状态中是否有任一者连接至结束状态。4.在步骤3中,相似度的定义(1)及(2)为两个不同评估类型,且经由两个类型的权重获得分数。分数用于代表正在测试的新DM。参看图2A及图2B,假设图2A为由原始DM产生的状态图,且图2B为由新DM产生的状态图。可发现两个状态图具有不同对话行为,但两个图均自初始状态开始并至结束状态。同时,图2B中的状态过渡未超过图2A的状态过渡,新DM类似于原始DM,因此图2B中的评估分数极高。在上述训练流程中,在设定评估机制之后,可在图1所示的以下步骤中执行对话机制的训练及产生。1.规则产生模块124产生多个DM(DN^、DM2.....DMN)。2.DM模块130分别与使用者模拟模块140的互动产生对应的多个对话记录,如图中的对话记录DLi、DL2、...、DLN。3.每一对话记录DL"DL2、…、DLN用作训练模块120的评估模块122中的输入,接着获得分数。4.规则产生模块124根据每一DM的评估分数适当地调整产生多个新DM。所述的新DM可包含原始DM、由规则产生模块124调整且修改的规12则,或随机产生的全新的DM。用于产生新种类文件的比例可为固定的,同时,保持现存DM的机率与评估分数成正比。5.最后,经过多次训练后,所产生的DM达成较高平均分数。亦即,所产生的DM的对话目的更加相似于原始DM的对话目的,即所产生的DM的对话目的与原始对话管理机制的对话目的之间的评估分数越接近于一预定值。此外,所产生的DM具有与原始DM相同的对话目的,但在对话行为上不同。请参看图3,其说明用于产生具有多样化对话行为的对话管理机制(DM)的方法的实施例的示意性流程图。图3说明用于说明根据本发明的实施例的用于产生具有多样化对话行为的对话管理机制(DM)的方法的示意性流程图。参看图3,在所述方法中,如在步骤S310中,基于原始对话管理机制产生多个新DM。接着,在步骤S320中,使用者模拟模块以一预设DM来模拟使用者行为,并藉此使用者模拟模块产生分别对应于每一新DM的至少一对应对话记录。在随后步骤S330中,通过分析对话记录及原始DM导出每一新DM的对应评估分数。用于导出新产生的DM的评估分数的方法包括原始DM内的多个规则,且新产生的DM分别映射至对应对话历史。依据新产生的DM的对应对话状态获得状态图。接着比较新产生的DM的状态图与原始DM的状态图以导出评估分数。接着,如在步骤S340中,产生至少一新导出的DM。新导出的DM的对话目的充分接近对话系统中的原始DM。图4中说明本发明的可应用于规则产生模块以训练具有多样化对话行为的新导出的DM的变化方式的实施例。此范例中,规则产生模块采用"交换(crossover)"演算法,即两个DM中的规则组中之一部分以预设机率与彼此交换。参看图4,DM规则(亦即,DMi及DMj)分别由五个规则"al、a2、...、a5,,及"bl、b2、...、b5"形成。在测试及对话模拟之后,DMj的规则改变成DMi',为"al、a2、a3、b4、b5",DMj的规则改变成DM/,为"bl、b2、b3、a4、a5"。图5A及图5B中说明本发明的评估模块的评估方式的实施例。首先,界定对话系统的状态组。因此,对话记录中的每一句子对应于仅一个状态。举例而言,对话内容"你喜欢踢足球吗?"设定为对话状态"state—verify—activity",对话内容"你明天有空吗?"设定为对话状态"state—verify—schedule"。原始DM中的对话记录对应于用于表示原始DM的对话行为的状态图。图5A中的原始DM规则组510经由使用者模拟转变成对话记录520,接着转变成状态图530。接着,参看图5B,新产生的DM中的任何一个经由使用者模拟(亦即,新DM的对话行为)对应于状态图540。之后,将状态图530、540彼此比较以判定新产生的DM的评估分数。图6A及图6B中展示用于说明本发明的评估模块的评估分数的实施例。图6A为原始DM的状态图,图6B为新DM的状态图。状态图的变量分别界定如下。在图6A的原始状态图610Dwg中,为Dorg的边集合。边(edge)意味着存在自一状态至另一状态的过渡。举例而言,如果对话如下A:你喜欢踢足球吗?B:是,我喜欢。则存在自表示第一句子的对话状态"state—verify—activity"至表示第二句子的对话状态"state—affirm—yes"的边,且在图6B为新DM的状态图620Dwew中,为的边集合。因此,经由分数评估函数,状态过渡的相似度d新状态连接占原始状态连接的比例1/T门£I此外,成功完成对话的比例C2为边集合占完整对话的比例_|用于完成对话的边的数目|C2=l对话记录中边的总数目l°因此,图6B的新DM的状态图620所得到的评估分数S,如下所示:Snew=pxCl+(l-p)xC2,其中Op^1。举例而言,下文参考图6A及图6B说明以上内容。首先,新状态图620中的对话记录为ABD、ABD、ABC、AD、ABED、ABE、ABC、ABC及ABC。新状态图620中的顶点&,为AB、BE、ED、AD、BD及BC。其中l五腳n£。巧|为AB、BE、ED及BC。一=0.67£6对话记录ABD、ABD、ABC、AD、ABED、ABE、ABC、ABC及ABC。l用于完成对话的边的数目l8八_C=■!_!■=丄=0442l对话记录中边的总数阔18。如果p=0.5:则状态图620所得到的评估分数为=0.5x0.67+(1-0.5)x0.44=0,56。7A及图7B中展示使用者模拟模块的架构的实施例。参看图7A,已知DM710中的对话内容的对应语音经由LG单元712及文字转语音(texttospeech,TTS)单元714传输至使用者720。接着,使用者720根据语音内容作出回应。4妄着,i吾音内容由自动i吾音i口、另'J(automatedspeechrecognition,ASR)单元716获得且接着经由LU单元718传输回至DM710。图7B中展示本发明的例示性架构,其中经由系统行为及经使用者模拟获得的使用者行为自动执行对话训练。在对话系统700中,将DM730中的对话内容的对应语音经由LG单元732传输至使用者模拟模块。之后,获得语音内容且将其经由LU单元744传输回至使用者才莫拟DM740。接着,将使用者模拟DM740产生的对应对话内容经由LG单元746传输至系统。之后,获得语音内容且将其经由LU单元738传输回至DM730。在已知架构中,因为系统是由使用者操作,所以需要TTS及ASR模块来进行操作。然而,在本发明的使用者模拟架构中,着重在语句之间的互动,故可忽略TTS以及ASR模块。在实施例中,系统侧的LG单元732直接连接至使用者模拟侧的LU单元744,且LG单元746亦在无ASR单元及TTS单元的情况下直接连接至LU单元738。下文提供实际实施例。参看图8A,对话内容列出如下使用者1使用者2使用者1使用者2使用者1使用者2你喜欢踢足球吗?不,我不喜欢!星期五你打算做什么?还没有计划。愿意去跳舞吗?跳舞不错,但我更想打网球、踢足球、看电视、看电影<15使用者l:星期一下午踢足球怎么样?使用者2:太棒了!使用者l:好!我们星期一下午去踢足球。使用者2:到时见。接着,参看图8B,产生两个新的对话内容且在下文列出。新对话1使用者l:星期四你打算做什么?使用者2:还没有计划。使用者l:你喜欢球类运动吗?使用者2:球类运动不错,但我更想看电视或看电影。使用者1:打篮球怎么样?使用者2:我不喜欢打篮球!使用者l:愿意星期五下午看电影吗?使用者2:太棒了!使用者l:好!我们星期五下午去看电影。使用者2:到时见。新对话2使用者l:愿意星期六晚上玩球类运动吗?使用者2:球类运动不错,但我更想跳舞或看电影。使用者1:游泳怎么样?使用者2:对不起,我不会游泳!使用者l:星期天你打算做什么?使用者2:我计划去看电影。使用者l:愿意星期六晚上去跳舞吗?使用者2:太棒了!使用者l:好!我们星期六晚上去跳舞。使用者2:到时见。在所有对话中,对话的内容可划分成三个部分询问活动,询问日程,且建议在适当时间进行的活动,所述三个部分分别由短划线、点线及实线标记。举例而言,在原始对话中,"使用者l:你喜欢踢足球吗?使用者2:不,我不喜欢!"为关于询问活动的对话,最后两个对话"使用者l:星期一下午踢足球怎么样?使用者2:太棒了!使用者l:好!我们星期一下午去踢足球。使用者2:到时见。"为关于建议的对话。在新对话1及2中,如图所示,分别标记关于活动、日程或建议的内容。在原始DM规则中,如图9所示,说明对话之内容,同时,相应地获得回应对话之内容。根据上文的描述,对话内容划分成询问活动、询问曰程及建议。因此,在图10中,依据DM规则,将回应内容之一部分标记为活动,且回应只于"^^于应于所述活动,卞者i口"rephrase—question"、"close—off,、"initial—question"、■"apologize—not—understood"及"repeat—response"。jt匕夕卜,力口图11戶斤示,才示i己i吾音4亍为,<列^口,speech—act"confirm"、speech—act"close—off,、speech—act"state—dislike,,、speech_act"state—busy,,及speech—act"a伍rm—okay,,。在图12中标记不同变量,例如"actionunderstand&:truth—valuenot""meta—clause"good—bye"|is—final"l"""initial—question""actionrepeat"'"activity|:question"whatareyoudoing"""my_proposition"accept"""my_proposition"invite"|:search—key'"activity""参看表l,上述语音行为可按内容分类成19个类别。表1<table>tableseeoriginaldocumentpage17</column></row><table>举例而言,"verify—like"表示"你喜欢踢足球吗?,,,"state—dislike"表示"不,我不喜欢!"。天。为达到概念一致性,应针对一致性来考虑语音行为之内容,例如,问题中的活动与回答中的活动应考虑为;f皮此一致。举例而言,问题及回答如下问题愿意明天去打网球吗?回答太棒了!我们明天去踢足球!问题中的活动为"网球"而回答中的活动为"足球",其中发生不一致性问题且将考虑进一步操作。应考虑内容词而非其实际值之上下文一致性如果an=a21贝'J(M幽)(M2a21)=(M10)(M20)如果a#a21则(M^u)(M2a21)=(M10)(M21)i^(M)(M20)。举例而言,au代表"今天,,,321代表"明天"。通过比较此等关键词来确认一致性。前文提及的时间及活动栏位的值可为0、1或NULL(无效)。全部对话状态为19(语音行为类型)x3(活动类型)x3(行程类型)=171,亦即,存在总共171个对话状态类型,因此可形成变化的状态图。之后,如图13所示,通过此实施例提供的具有多样化对话行为的DM架构转变成新DM。图14说明用于说明根据本发明的另一实施例的具有多样化对话行为的DM架构的功能的示意性方块图。在实施例中,以DM的控制文件(controlfile)为例进行说明。架构1400包含训练模块1420、DM模块1430、存储模块1440及使用者模拟模块1460。训练模块1420接收外部原始DM的控制文件1412。首先,规则产生模块124随机地产生多个不同控制文件1442、1444或1446。训练模块1420中的评估模块1422评估不同控制文件1442、1444或1446的对话目的之间的相似度,藉此产生用于不同的多个控制文件。控制文件,例如图14所示的控制文件M42、1444或1446,暂时存储于存储装置1440中。DM模块1430根据DM的控制文件判定行为。使用者模拟模块1460为经预设以模拟使用者行为的DM。使用者模拟模块1460亦为用于在使用者与系统的DM模块1430互动时模拟使用者的行为的DM。DM模块1430及使用者模拟模块1460经由语言理解(languageunderstanding,"LU")才莫块及语言产生(languagegeneration,"LG")模块而与彼此互动,从而产生一系列对话记录。如图14所示,DM模块1430与使用者模拟模块1460之间的对话行为由LU1452、LG1454、LG1456及LU1458以互逆方式执行。在所述互动过程中产生的多个对话记录,例如,诸如图14所示的1470、1472、1474的多个对话记录,由训练模块1420评估。因此,根据评估中获得的上述分数,选择、调整且产生许多新DM的控制文件。在DM模块1430与使用者模拟模块1460之间的若干轮对话行为之后,产生诸如1470、1472及1474的多个对话记录,接着由训练模块1420产生多个控制文件,从而可满足特定需求,亦即,本发明的DM具有与原始DM相同的对话目的,但对话行为不同。下文描述此实施例中提供的不同模块。训练模块1420可经由不同训练方法产生DM控制文件。为了经由训练获得具有相同对话目的的多样化DM,关键因素在于训练模块内部的适当评估模块,用以评估由系统中的DM模块1430与使用者模拟模块1460之间的互动产生的对话记录,以便确定所测试的DM控制文件是否可准确地完成此系统的任务。图15A为一范例说明由一原始DM产生的对话状态图,图15B为为一范例,说明经由本发明的系统训练产生之一新的DM的对话状态图。另夕卜,图16A及图16B为分别由原始DM及新DM产生的经放大的对话状态图。由图16B可看出与原始DM对话行为不同。本领域技术人员将了解,在不脱离本发明的范围或精神的情况下,可对本发明的结构进行各种修改及变化。鉴于前述内容,希望本发明涵盖在权利要求书及其等效物的范围内的对本发明的修改及变化。权利要求1.一种用于产生具有多样化对话行为的对话管理机制的系统,包括一训练模块,其用于接收一原始对话管理机制,初始随机地产生多个第一对话管理机制;以及一使用者模拟模块,其用于模拟使用者行为,所述第一对话管理机制经由该使用者模拟模块模拟使用者行为之间的所述对话以产生多个对话记录,其中所述训练模块根据所述对话记录调整所述第一对话管理机制以便产生多个第二对话管理机制。2.如权利要求1所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述训练模块包括一评估模块,所述评估模块用于评估所述原始对话管理机制与所述第一对话管理机制或所述第二对话管理机制中的每一个的对话目的之间的相似度。3.如权利要求1所述的用于产生具有多样化对话行为的对话管理机制的系统,还包括用于一对话管理机制模块与所述使用者模拟模块之间的对话行为的一语言理解模块及一语言产生模块。4.如权利要求1所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述使用者模拟模块包括用于在所述使用者与所述对话系统进行对话时模拟使用者行为的一使用者对话管理机制。5.如权利要求1所述的用于产生具有多样化对话行为的对话管理机制的系统,其中经由所述系统多次训练后,以产生所述多个第二对话管理机制。6.如权利要求1所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述训练模块还包括一规则产生模块,初始随机地修改所述原始对话管理机制内的多个规则以产生所述多个第一对话管理机制;以及一评估模块,其通过分析所述对话记录导出所述多个第一对话管理机制或所述多个第二对话管理机制中的每一个的评估分数,其中所述规则产生模块依据所述多个第一对话管理机制或所述多个第二对话管理机制的所述评估分数适应性地产生多个所导出的新对话管理机制。7.如权利要求6所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述规则产生模块使用演化计算,依据所述多个第一对话管理机制或所述多个第二对话管理机制中的每一个的所述评估分数适应性地产生所述至少一所导出的新对话管理机制。8.如权利要求7所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述演化计算包括如再生、变异或交换的演化运算子。9.如权利要求6所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述评估模块将所述原始对话管理机制与所述多个第一对话管理机制或所述多个第二对话管理机制的互动结果别映射至所述多个对话记录,依据所述对话管理机制中的每一个的所述多个对话记录获得一状态图,且对所述多个第一对话管理机制或所述多个第二对话管理机制中的每一个的所述状态图与所述原始对话管理机制的所述状态图进行比较,从而导出所述多个第一对话管理机制或所述多个第二对话管理机制的所述评估分数。10.如权利要求9所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述评估模块对所述多个第一对话管理机制或所述多个第二对话管理机制中的每一个的所述状态图的每一边与所述原始对话管理机制的所述状态图的每一边进行比较,从而导出对应于所述多个第一对话管理机制或所述多个第二对话管理机制中的每一个的所述评估分数。11.如权利要求9所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述评估模块导出完整对话边集合与所述状态图中的所有边的比率,作为所述多个第一对话管理机制或所述多个第二对话管理机制中的每一个的所述评估分数。12.如权利要求9所述的用于产生具有多样化对话行为的对话管理机制的系统,其中所述对话管理机制包括至少一控制文件。13.—种用于产生具有多样化对话行为的对话管理机制的方法,包括基于一原始对话管理机制随机产生多个第一对话管理机制;以一预设对话管理机制来模拟使用者行为,所述多个第一对话管理机制经由所述预设对话管理机制来模拟使用者行为以产生分别对应于所述多个第一对话管理机制中的每一个的至少一对应对话记录;通过分析所述对话记录导出所述多个第一对话管理机制中的每一个的评估分数;以及产生多个第二对话管理机制。14.如权利要求13所述的用于产生具有多样化对话行为的对话管理机制的方法,其中导出所述多个第一对话管理机制或所述多个第二对话管理机制的所述评估分数包括将所述原始对话管理机制及所述多个第一对话管理机制或所述多个第二对话管理^L制内的规则分别映射至所述对应对话记录;依据所述多个第一对话管理机制或所述多个第二对话管理机制的所述对应对话记录获得一状态图,以及对所述多个第一对话管理机制或所述多个第二对话管理机制的所述状态图与所述原始对话管理机制的所述状态图进行比较,从而导出所述评估分数。15.如权利要求13所述的用于产生具有多样化对话行为的对话管理机制的方法,对所述多个第一对话管理机制或所述多个第二对话管理机制中的所述每一个的所述状态图的每一边与所述原始对话管理^L制的所述状态图的每一边进行比较,从而导出所述评估分数。16.如权利要求13所述的用于产生具有多样化对话行为的对话管理机制的方法,其中所述评估分数为完整对话边集合与所述多个第一对话管理机制或所述多个第二对话管理机制的所述状态图中的所有边的比率。17.如权利要求13所述的用于产生具有多样化对话行为的对话管理机制的方法,其中所述对话管理机制包括至少一控制文件。全文摘要一种用以产生对话管理机制(DM)的方法,其中根据由设计者设计的DM自动产生多个具有相同目的但具有不同对话行为的DM。自动辅助工具促进对话流程的设计及DM规则的调整,且亦帮助系统设计者找出原始DM中的潜在问题。所述方法采用当前DM并结合使用者模拟技术,且进一步利用经特殊设计的计分函数,以便自动产生多个新DM。新DM达成与原始DM相同的对话目的,但在对话过程中在系统行为及回应方面与原始DM不同。对话系统的对话流程增强,同时亦促进对DM的设计及改良。文档编号G06N5/00GK101673356SQ20081018560公开日2010年3月17日申请日期2008年12月17日优先权日2008年9月9日发明者吴旭智,李青宪申请人:财团法人工业技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1