语言变换规则产生装置、语言变换装置及程序记录媒体的制作方法

文档序号:6537205阅读:105来源:国知局
专利名称:语言变换规则产生装置、语言变换装置及程序记录媒体的制作方法
技术领域
本发明涉及把输入语音或输入文本变换为另一种语言或另一种文体的语言变换装置,本发明还涉及产生语言变换装置的变换规则的语言变换规则产生装置。
背景技术
以下将描述传统技术,作为语言变换装置的一个例子,它将输入语言翻译为另一种语言(以下称为解释)。
在解释装置中,解释是通过依次解释语音识别以及语言翻译实现的,前者把作为声音信号输入的发声句子变换为由文本字串表示的输出句子,后者接收由文本字串所表示的句子,然后将其翻译为另一种语言的句子。语言翻译部分由对输入句子的句法或语义结构作分析的语言分析部分;基于分析结果把输入句子变换为另一种语言的语言变换部分;以及从翻译的结果产生自然输出句子的输出句子产生部分构成。
然而,在语音识别部分错误地识别了一部分发声句子的情况中,或者在发声句子本身在句法和语义两方面都反常的情况中,诸如把谐音和复述等插入句子中的这些情况或者在该句子还未完成时结束发声的这些情况,存在一个问题,即,即使当语音识别的结果被输入到语言分析部分中时,未能作出分析,因此不输出翻译结果。
为了解决这一问题,提出一种结构,其中将句子划分为短语,分别作出短语内规则和短语间规则,仅仅利用短语内规则分析不完整发声,由此能够输出分析的结果。(例如Takezawa和Morimoto电子和通信工程师协会会刊D-IIVol.J79-D-II(12))。

图14示出传统技术的短语内和短语间规则的例子。在这一例子中,对于“KONBAN,SINGLE NO HEYA NO YOYAKAU ONEGAI NE”的大全例子,基于语法规则(对书面语言也是共同的),在诸如短语内规则302的树结构中描述了短语内规则,并在训练大全的短语当中以邻接几率描述短语间规则。例如,正如短语间规则303所示,描述短语间规则。
在对输入句子进行分析时,从句子的开头起,把短语内规则依次应用到短语。对输入句子进行分析,因为短语彼此相连接,以致于对于每个短语,更高邻接几率的候选短语彼此相邻接。在这一句子分析方法中,即使当一部分句子被错误地识别并且整个句子的正常分析失败,也能够正确地分析不包括错误识别的这部分的短语。因此,形成一种方案,使得通过仅翻译被分析的部分短语便能够部分地输出翻译结果。
为了解决这一问题,提出另一种方法,其中与按照语法进行语言分析的传统技术不同,从包括通过传统语法不能分析的发声句子的发声句子例子中抽取相应源语言和目标语言句子的对照翻译(parallel translation)短语,产生对照翻译短语字典,其中以尽可能远地概括的形式描述短语对,利用字典进行语言分析和语言变换。(例如,Furuse、Sumida和Iida,日本信息处理协会会刊Vol35,No3,1994-3)。图15示出传统技术的语言变换规则产生装置。在进行解释之前,从发声句子对照翻译大全(parallel translation corpus)先产生对照翻译短语字典。此外,在这种方法中,考虑到一部分字是错误的或省略的情况,把发声句子划分为短语,产生短语内规则和短语间依赖规则。首先,词态分析部分360分析源语言句子和目标语言句子的词态,将句子变换为词态串。接着,短语确定部分361以短语单元对源语言和目标语言的词态串进行划分,然后产生短语内规则和短语间依赖关系规则。在这种情况中,考虑到在部分句子中对照翻译的对应关系是显然的,以人工方式确定每个短语单元,除此之外,每个短语单元是在语义上一致的单元。例如,把“HEYA NO YOYAKU OONEGAISHITAINGESUGA”和“I’d like to reserve a room”的对照翻译句子例子划分为两个对照翻译短语(a)和(b),或者(a)“HEYA NO YOYAKU”和“reservea room”,和(b)“O ONEGAISHITAINGESUGA”和“I’d like to”,对“(a)O(b)SURU”和“(b)to(a)”的依赖关系进行规则化。把对照翻译短语存储在对照翻译短语字典362中,把以对照翻译形式表示的短语之间的依赖关系存储在短语间规则表363中。在包含在对照翻译大全中的所有发声句子上进行这一过程。根据句子的语义信息以及诸如句子不合语法程度的因素,确定短语的这一划分和依赖关系。因此对于每个句子难以自动地确定它们。通常地,必然地,它们以人工方式确定。
然而,在第一个惯例的句子分析装置中,要处理的短语是仅与源语言相关的语言相关短语,通常不能与目标语言的短语单元相一致。因此,该装置存在一个问题,即,即使当在源语言中是正确的短语输入到语言变换部分中时,通常是这些短语最终不能被接受。利用语言独立短语也能够启用第一个惯例的方案。在这种情况中,语言独立短语的分析必须以人工方式产生,由此引起进一步的问题,即开发需要大量时间,规则性能由于人工产生的判别标准的摆动而发生畸变。
在第二个惯例中产生对照翻译短语字典的方法中,不存在自动地分析发声句子的语义信息和语法信息的装置,因此这些信息必须以人工方式产生。因此,该方法存在一个问题,即开发需要大量时间,规则性能被人工产生的判别标准的摆动而发生畸变。当改变解释装置的目标任务时,或者当改变源语言和目标语言的种类时,不能应用已经建立的规则,所有规则必须再产生。因此,开发效率低且有些麻烦。
在短语字典362和短语间规则表363中,短语单元是通过重点强调对照翻译大全的对应关系而确定的,对于短语单元对于由语音识别部分364的识别是否足够不作评价。虽然以人工方式判定该短语对于语音识别是否足够,确定短语单元是困难的。该方法存在一个问题,即利用已确定的短语进行识别时,不能保证识别率。

发明内容
本发明的目的是提供一种能够解决以上讨论问题的语言变换装置,其中,即使当输入语音句子含有未训练部分时或者当语音识别是部分错误地进行时,能够确保向目标语言的变换,其中,能够自动地产生变换所需的短语字典和短语间规则,无需很多人工帮助。
为了解决这些问题,本发明的第一方面(对应于权利要求1)是针对一种语言变换装置,其特征在于该装置包括存储语言规则的存储装置,语言规则是从训练数据库由字或字串的训练语法或语义约束规则获得的,在训练数据库中以语音或文本形式输入并为要作目标语言变换的句子(在下文中把这种句子称为源语言句子,把已经经过语言变换与其对应的句子称为目标语言句子)与目标语言句子相配对(以下把这种数据库称作为对照翻译大全);利用所存储的语言规则对输入语音进行语音识别以及以目标语言变换的句子形式输出识别结果的语音识别部分;及利用与所述语音识别部分中使用的相同语言规则把要作目标语言变换的句子变换为经过了语言变换的句子的语言变换部分。
此外,本发明的第二方面(对应于权利要求2)是指根据本发明第一方面的语言变换装置,其特征在于语言规则是通过把要作目标语言变换的句子和已变换句子分割为各个部分,在各个部分中两种句子形成语义一致性(称为与文体无关(style-independent)短语),以及作出区分与文体无关短语内语言规则与与文体无关短语之间语言规则的规则而产生的。
此外,本发明的第三方面(对应于权利要求3)是指根据本发明第二方面的语言变换装置,其特征在于语言规则是通过作出有关与文体无关短语内语法或语义规则上和与文体无关短语之间的共存或连接关系的规则而产生的。
此外,本发明的第四方面(对应于权利要求4)是指根据本发明第一方面的语言变换装置,其特征在于所述装置包括利用与所述语言变换部分中使用的相同语言规则在已经经过语言变换的句子上进行语音合成的语音合成部分。
此外,本发明的第五方面(权利要求5)是指根据本发明第一至第四方面之一的语言变换装置,其特征在于所述装置包括规则距离计算部分,对于在语言规则当中借助于将同一目标语言句子的语言规则捆绑成同一类而获得的语言规则组,它计算句子的声学规则距离,所述句子是语言规则组中所包含的语言规则的目标语言变换;及最佳规则产生部分,为了增强语音识别的识别水平,它通过合并具有相似计算距离的语言规则使规则组最佳化。
本发明的第六方面(对应于权利要求6)是指一种语言变换规则产生装置,其特征在于所述装置包括对照翻译大全;短语抽取部分,它计算在所述对照翻译大全中源语言句子和目标语言句子中字或语音部分(parts of speech)的邻接频度,并使高邻接频度的字或语音部分相耦合,以抽取部分句子,在每个部分句子中形成语义一致性(以下把部分句子称为短语);短语确定部分,在由所述短语抽取部分所抽取的短语当中,它检查源语言与目标语言的短语之间的关系,以确定对应短语;及短语字典,它存储预定的对应短语,在进行语言变换时采用所述短语字典,在输入源语言句子时,语言变换使输入句子与存储在所述短语字典中的对应短语相匹配,由此进行语言或文体变换。
此外,本发明的第七方面(对应于权利要求7)是指根据本发明第六方面的语言变换规则产生装置,其特征在于所述短语确定部分检查源语言与目标语言的短语之间的共存关系,由此确定对应短语。
此外,本发明的第八方面(对应于权利要求8)是指根据本发明第六方面的语言变换规则产生装置,其特征在于所述装置进一步包括词态分析部分,它把对照翻译大全的源语言句子翻译为字串;及利用语音部分的字片段(clastering)部分,通过利用所述词态分析部分的结果,它产生对照翻译大全,其中一部分或全部源语言句子和目标语言句子的字被语音部分名称替代,而且所述短语抽取部分从对照翻译大全抽取短语,在对照翻译大全中,由利用语音部分的所述字片段部分命名的语音部分替代字。
此外,本发明的第九方面(对应于权利要求9)是指根据本发明第八方面的语言变换规则产生装置,其特征在于所述装置包括源语言和目标语言的对照翻译字字典,以及利用语音部分的所述字片段部分用语音部分名称替代在所述对照翻译字字典中对应的字,其中源语言是内容字。
此外,本发明的第十方面(对应于权利要求10)是指根据本发明第六方面的语言变换规则产生装置,其特征在于所述装置进一步包括词态分析部分,它把对照翻译大全的源语言句子变换为字串;及语义编码部分,通过利用所述词态分析部分的结果,基于对字进行分类而把在语义上相似的字视为是在同一类中,且对于同一类中的字给出相同代码的表(以下把这种表称为分类词汇表),语义编码部分产生对照翻译大全,在对照翻译大全中用分类词汇表的代码替代一部分或全部源语言句子和目标语言句子的字,所述短语抽取部分从对照翻译大全抽取短语,在对照翻译大全中由所述语义编码部分用代码替代字。
此外,本发明的第十一方面(对应于权利要求11)是指根据本发明第十方面的语言变换规则产生装置,其特征在于所述装置具有源语言和目标语言的对照翻译字字典,所述语义编码部分用语义编码仅替代在对照翻译字字典对应的字。
此外,本发明的第十二方面(对应于权利要求12)是指根据本发明第六方面的语言变换规则产生装置,其特征在于所述短语抽取部分通过还利用短语定义表抽取短语,短语定义表以前存储了希望最好被视为短语的字或句子部分串,使源语言与目标语言配对。
此外,本发明的第十三方面(对应于权利要求13)是指根据本发明第六至第十三方面之一的语言变换规则产生装置,其特征在于所述装置包括计算大全难度(perplexity)的难度计算部分,所述短语抽取部分通过利用字或字类的邻接的频度和难度抽取短语。
此外,本发明的第十四方面(对应于权利要求14)是指一种程序记录媒体,其特征在于所述媒体存储引起计算机执行按照本发明第一至第十三之一的语言变换装置或语言变换规则产生装置的整个或部分部件功能的程序。
附图简述图1是一方框图,表明本发明第一实施例中语言变换装置的结构。
图2是一方框图,表明本发明第二实施例中语言变换装置的结构。
图3是说明本发明第一实施例中语言规则的产生的图。
图4是说明本发明第二实施例中语言规则的产生的图。
图5是一方框图,表明本发明第三实施例中语言变换装置和语言规则产生装置的结构。
图6是说明本发明第三实施例中语言变换规则的产生的图。
图7是表明本发明第三实施例中对照翻译短语间规则表和对照翻译短语字典的例子的图。
图8是一方框图,表明本发明第四实施例中语言变换装置和语言规则产生装置的结构。
图9是本发明第四实施例中短语定义表的例子的图。
图10是一方框图,表明本发明第五实施例中语言变换装置和语言规则产生装置的结构。
图11是说明本发明第五实施例中语言规则的产生的图。
图12是一方框图,表明本发明第六实施例中语言变换规则产生装置的结构。
图13是一方框图,表明具有语音合成部分的语言变换装置的结构的例子图14是表明传统语言变换装置中使用的语言规则的例子的图。
图15是一方框图,表明传统语言变换装置的结构。
(参考编号和符号的描述)1 对照翻译大全2 语言规则再现部分3 短语内语言规则4 短语间语言规则6 麦克风7 语音识别部分8 声学模式9 语言变换部分10 输出句子产生部分101 对照翻译大全102 词态分析部分103 内容字定义表104 利用语音部分的字片段部分105 短语抽取部分106 短语确定部分107 对照翻译字字典108 对照翻译短语间规则表
109 对照翻译短语字典110 语音识别111 语言变换112 输出句子产生113 声学模式114 句子产生规则具体实施方式
以下将参考附图描述本发明的实施例(第一实施例)首先将描述第一实施例。
在第一实施例中,利用解释装置作为语言变换装置的一个例子进行描述,该解释装置以与传统技术例子中相同的方式在不同语言之间进行变换。图1是本实施例的解释装置的方框图。
在本实施例的解释装置中,在进行解释之前,语言分析部分2从训练数据库1先训练源语言句子和发出声音句子的目标语言句子的语言规则,训练数据库具有对照翻译大全、对照翻译字字典等。图3示出语言规则的训练的例子。
在语言规则产生部分2,利用例如给出语音部分标记的对照翻译大全,源语言和目标语言的内容字被语音部分名称所替代。在源语言中短语和目标语言中短语彼此对应作为一组的情况中,这一组设定为与风格无关的短语并划定界限。即,在源语言中与风格相关短语和目标语言中与风格相关短语彼此对应作为一组的情况,这一组设定为与风格无关短语的边界。在对应于源语言中与风格相关短语的目标语言中与风格相关短语并不对应作为一组的情况中,进行与风格相关短语的耦合以及短语边界的校正,直至相应部分作为一组存在为止,由此把短语设定为与风格无关短语。参考图3,通过用语音部分名称30替代内容字,如“<普通名词>|<普通名词>NO<サ变名词>|O SHITAINGDESUGA”27,对照翻译大全的句子,“KONBAN,HEYA NO YOYAKU O SHITAI NESUGA”和“I’d liketo room-reservation tonight”26被语音部分名称所替代。此外,边界被界定为与文体无关短语或者为“<普通名词>”、“<普通名词>NO<サ变名词>”、“O SHITAINGDESUGA”。以下,在每个与文体无关短语中,把语音部分名称和字的混合串、由语音部分名称表示的一部分字的名称、以及每个与文体无关短语在对照翻译大全中的出现频度描述为与文体无关短语内规则3。对于对照翻译大全的所有句子,对上述规则作了描述。在图3中,通过短语内规则31的描述,把上述内容描述在3中。在图3的3中,规则1对日语具有|<普通名词>|和对英语具有|<普通名词>|。语音部分内容对日语是“KONBAN”和对英语是“tonight”。如果出现在对照翻译大全中,在规则1中还描述“ASU”、“tomorrow”等。
此外,把每个短语内规则的共存关系描述为与文体无关短语间规则4。例如,当共存关系要被规则化为短语bi-gram时,以前描述了与文体无关短语的邻接的频度。
上述内容意味着,在图3中,短语间规则32的描述对28进行描述,28是短语bi-gram的一个例子。例如,规则编号对是“(规则1)(规则2)”,其出现频度为4。这意味着,在从对照翻译大全训练的过程期间,规则1和规则2在句子中并列出现四次。在28的例子中,情况是规则2和规则3在句子中并列出现六次。
此外,在与文体无关短语间规则4中描述了与文体无关短语之间的句法结构。这意味着,在图3中,短语间规则32的描述对29进行描述。由于日语的与文体无关短语的出现顺序不同于英语的出现顺序,通过以25的树形式表示语音结构,短语间规则32的描述使得顺序关系彼此相对应。
在句子产生规则5中,对缺少语言规则3和4的目标语言规则进行描述。例如,在日语到英语翻译的情况中,冠词和不定冠词规则、第三人称单数规则等被描述为句子产生规则的内容。
短语内语言规则3和/或短语间语言规则4构成本发明的存储装置的一个例子。
在解释的情况中,源语言的发声语音通过麦克风6首先输入到语音识别部分7。语音识别部分从语音部分名称和字的混合串(被描述为与文体无关短语内语言规则3)和起与文体无关短语间语言规则4作用的短语Bi-gram,按照时间顺序依次预示所识别字的候选字。基于以前训练声学模型8与输入语音之间的距离值的声学得分与基于短语bi-gram的语言得分之和设定为识别得分,起识别候选字作用的连续字串是通过Nbest-search确定的。把如此确定的连续字串输入到语言变换部分9。在短语内语言规则3和短语间语言规则4中,规则是以前建立的,而源语言和目标语言彼此相对应。在语言变换部分9中,通过利用这些规则把连续字串变换为目标语言的短语串,然后将其输出。在这种情况中,当源语言的输入短语串与已经经过训练的短语之间的句法结构相一致时,按照句法结构对目标语言的短语串进行校正,然后输出。
把输出的目标语言句子输入到输出句子产生部分10,对语法不自然性进行校正。例如,进行诸如添加冠词和不定冠词、把动词变换为第三人称单数形式、复数形式、代词和动词的过去形式等的最佳化处理。以例如文本形式输出目标语言的经校正的翻译结果句子。
在以上描述的实施例中,当语音识别中所使用的语言规则有待训练时,产生规则,而源语言和目标语言都具有含义的捆绑部分被用作一个单元,基于规则的约束条件进行识别。因此,实现一种能够解决下述问题的语言变换装置是可能的,当输入的语音句子含有未训练部分或者部分错误地进行语音识别时,不输出整个句子的翻译结果的任何部分,对于已经被正确地识别的一部分,则能够输出满足要求的翻译结果。
在本实施例中,已经把解释装置作为语言变换装置的一个例子进行了描述。它同样可以用在另一种语言变换装置中,例如把非书面发声句子变换为书面语言的文本的语言变换装置。
(第二实施例)接着将参考附图描述第二实施例。在本实施例中,以与第一实施例相同的方式,利用解释装置进行描述。图2是本实施例的解释装置的方框图。
在本实施例的解释装置中,在进行解释之前,语言规则产生部分11先训练来自训练数据库1(它包括对照翻译大全和对照翻译字字典)的发声句子的源语言句子和目标语言句子的短语内语言规则12和短语间语言规则13。已训练的规则与第一实施例中语言规则的训练相同。接着,使已训练的语言规则最佳化。图4示出最佳化的例子。
在已训练的与文体无关短语当中,把相同目标语言的短语捆绑为同一类别。参考图4,12表示语言规则。语言规则被规则距离计算部分14捆绑成类,以33表示。规则1、规则2和规则3具有“I’d like to”的相同目标语言规则,因此这些规则被设定在同一类别中。由于规则4具有“please”的目标语言规则,该规则被分类到不同于规则1、规则2和规则3类别的类别中。接着,规则距离计算部分14计算包含在相同类别内的源语言短语之间的声学距离。在图4中,15表示算出的源语言短语之间的声学距离。在15中,规则1与规则2之间的距离为7,规则1与规则3之间的距离为2。
包含在相同类别规则中的源语言短语的声学距离是以以下方式计算的。首先,当句子各个部分彼此相同时,把相同字应用到该类别内所有目标语言短语中的混合串的句子部分,并把所有混合串变换为字串。为了检查字串在发音上是否相似,则利用表达式1计算相对于每个字串的字符串中差别的距离,然后写入到规则距离表15中。当由n个字构成的短语X={x1、x2、x3…、xn}(这里x表示每个字)与由m个字构成的短语Y={y1、y2、y3…、ym}之间的距离由D(Xn,Ym)表示[表达式1]D(Xn,Ym)=minD(Xi-1,Yj)+d(xi,yj)D(Xi-1,Yj-1)+d(xi,yj)D(Xi,Yj-1)+d(xi,yj)]]>这里如果xi=yj那么d(xi,yj)=0否则 d(xi,yj)=1在最佳规则产生部分16中,只有在距离值不大于固定值的短语中出现次数最多的规则被留下,所有其它规则被删除。在图4的例子中,例如,当固定值设定为2,规则1与规则3(它们在33中处于同一类别中)之间的规则距离为2,或者不大于2的固定值。在这两个规则中,因此采纳出现频度较高的规则1,从规则中删除规则3。按照如上所述,重写出现次数。
对以短语内语言规则12所写的所有规则进行上述规则最佳化之后,只有未被删除的语言规则被作为短语内最佳语言规则17存储起来。按照最佳化规则,用所采用的规则重写短语间规则13的被去除规则,还校正出现次数。参考图4,规则3被最佳规则产生部分16删除,与规则1结合。按照这,正如17表示的,规则1的出现次数设定为15,这是该规则和已经被删除的规则3的和。
在句子产生规则5中,描述从大全产生的语言规则中没有的目标语言规则。例如,在日语-英语翻译的情况中,冠词和不定冠词规则、和第三人称单数规则等作为句子产生规则的内容进行描述。
在解释的情况,源语言的发声语音通过麦克风6首先被输入到语音识别部分7。语音识别部分从描述为与文体无关短语内最佳语言规则17的语音部分名称的混合串和串字、和作为与文体无关短语间最佳语言规则18的短语邻接频度,按照时间顺序依次预示所识别字的候选字。基于以前训练声学模式8与输入语音之间距离值的声学得分、和基于短语bi-gram的语言得分之和设定为识别得分,通过N最佳搜索(Nbest-search)确定起识别候选字串作用的连续字串。把如此确定的连续字串输入到语言变换部分9。在语言规则17和18中,规则是以前建立的而源语言和目标语言彼此相对应。在语言变换部分9中,连续字串通过利用这些规则被变换为目标语言的短语串,然后输出。在这种情况中,当源语言的输入短语串与已经训练过的短语之间的句法结构相一致时,按照句法结构校正目标语言的短语串,然后输出。
把输出目标语言句子输入到输出句子产生部分10,对语法不自然性作校正。例如,进行诸如添加冠词和不定冠词、以及把动词变换为第三人称单数形式、代词或动词变换为复数形式或者过去形式的最佳化。以例如文本形式输出目标语言的经校正的最终翻译句子。
在以上所述的实施例中,当语音识别中所使用的语言规则有待训练时,产生这些规则而把源语言和目标语言具有含义的捆绑部分用作一个单元。而后,当具有相同规则化目标语言部分的源语言短语彼此声学上相似时,从相似规则中只采纳出现频度最高的规则,其余规则被删除。结果,有可能实现一个解释装置,其中由于设定与文体无关短语为一个单元可以抑制规则数目的增加而尽可能不降低语言规则的性能,因此能够进行高性能的识别和语言变换。
在本实施例中,已经把解释装置作为一种语言变换装置的例子作了描述。这同样可以用在其它语言变换装置中,例如把非书面发声句子变换为书面语言的文本句子的语言变换装置。
(实施例3)在本实施例中,作为语言变换装置的一个例子,以与传统例子相似的方式,利用在不同语言之间进行变换的解释装置进行描述。图5是本实施例的解释装置的方框图。
在本实施例中,对照翻译大全101、内容字定义表103、对照翻译字字典107、词态分析部分102、利用语音部分的字片段部分104、短语抽取部分105、短语确定部分106、对照翻译短语间规则表108和对照翻译短语字典109构成本发明的语言变换规则产生装置的一个例子。本实施例的对照翻译短语字典109是本发明权利要求6所限定的短语字典的一个例子。
在本实施例的解释装置中,在进行解释之前,词态分析部分102分析对照翻译大全101中源语言句子的词态,由此产生对照翻译大全,其中仅对源语言句子给出语音部分标记。例如,在图6的“HEYA NO YOYAKU OONEGAISHITAINDESUGA”的发声语音120的例子中,对源语言句子给出以121表示的语音部分标记。接着,利用语音部分104的字片段部分产生语音部分对照翻译大全,其中用语音部分名称替代提供了大全中语音部分标记的源语言句子中的一部分字名称。在这种情况中,假设要用语音部分名称替代的字满足以下条件。
(1)该字对应于内容字表中所列的一部分句子。
(2)被登记在对照翻译字字典中并对应于对照翻译字字典中目标语言翻译的字存在于大全中目标语言的相应对照翻译句子中。
在图6的内容字定义表103的例子中,在普通名词、サ变名词和列在内容字表中的动词当中,只有登记在对照翻译字字典107中的“HEYA”和“YOYAKU”被句子部分替代,从而产生用语音部分名称替代这些字的大全,如122所示。此外,用日语中的语音部分名称替代目标语言的对照翻译句子中的相应字名称。
至于用语音部分名称替代一部分字名称的大全,短语抽取部分105计算每个字或语音部分的双链出现频度(以下称为bi-gram)。源语言句子和目标语言句子分别经受这一计算。计算表示式以表达式2表示。
(表达式2) 对于大全中所有源语言句子和目标语言句子计算了bi-gram之后,短语抽取部分5将最高出现频度的两个字或语音部分对彼此相耦合,同时假设这些字或对作为一个字。然后,再计算bi-gram。结果,例如,诸如“O”和“NEGAI”、“NEGAI”和“SHI”、以及“SHI”和“MASU”(在其中的每一个中,字以较高频率邻接)的字对彼此相耦合而形成短语候选字“ONEGAISHIMASU”。在目标语言中,“I’d”和“like”以及“like”和“to”的字对彼此相耦合。对应所有源语言句子和目标语言句子中的每一个,重复上述的耦合和bi-gram的计算,直至所有bi-gram的值不超过固定阈值为止。把包括耦合字在内的每个字抽取为短语候选字。
短语确定部分106计算在一对源语言句子和目标语言句子中同时出现各短语的频度。当第i个源语言短语由J[i]表示而第j个目标语言短语由E[j]表示时,短语J[i]和E[j]的出现频度K[i,j]由计算表达式3计算。
K[i,j]=]]> 例如,在图7的例子中,在描述为短语串的三个对照翻译句子130当中,源语言短语“ONEGAISHIMASU”和目标语言短语“I’d like to”的同时出现频度为2/(2+3),“SHITAINDESUGA”和目标语言短语的同时出现频度为1/(1+3)。把频度不小于固定值的短语对确定为对照翻译短语,然后与频度和对照翻译短语字典109中的短语数一起登记。在没有被确定为对照翻译短语的候选短语当中,已经用语音部分名称替代的字单独作为对照翻译短语字典109中的对照翻译短语登记。至于其它部分,对照翻译对中的每个对应字串被登记为短语字典中的一对。
在图7的例子中,例如,短语被登记在对照翻译短语字典109中,如由131表示的。
以这种方式登记短语后,记录在一个句子中同时出现的短语数目,然后登记为对照翻译短语间规则表108中的短语数目对,正如图7的例子中由132表示的。
此外,获得短语数目对的短语bi-gram,还把短语bi-gram记录在对照翻译短语间规则表108中。即,源语言大全由登记在对照翻译短语字典中的一串短语数目表示,利用由短语数目表示的大全获得短语bi-gram,还把所获得的bi-gram记录在对照翻译短语间规则表108中。指示短语j相继短语i的出现几率的短语bi-gram由表达式4表示。
例如,在图7的132中,获得短语3和短语1的短语bi-gram。对于短语4、短语5和短语2的短语间规则,分别获得短语4与短语5以及短语5与短语2的bi-gram,然后记录在对照翻译短语间规则表108中。
在解释的情况中,首先把源语言的发声语音输入到语音识别部分110。语音识别部分110从被写为对照翻译短语字典109中短语的字的网络和写在对照翻译短语间规则表108中的短语bi-gram按照时间顺序依次预示所识别字的候选字。基于以前训练的声学模式113与输入语音之间距离值的声学得分和基于短语bi-gram的语言得分之和被设定为识别得分,起识别候选字作用的连续字串由Nbest-search确定。
把所识别的连续字串输入到语言变换部分111。在语言变换部分111中,把输入的连续字串变换为对照翻译短语字典109中的短语串,并搜索对应于各短语串的短语间规则。由目标语言短语(它们是所述短语的对照翻译)和目标语言的短语间规则,把输入源语言的识别结果句子变换为目标语言句子。
如上所述,在本实施例中,在语音识别部分110和语言变换部分111中都使用对照翻译短语字典109和对照翻译短语间规则表108。
把变换后的目标语言句子输入到输出句子产生部分112,并对句法不自然性进行校正。例如,进行诸如添加冠词和不定冠词、把动词变换为第三人称单数形式、代词和动词的复数形式或过去形式等最佳化。以例如文本形式输出校正后的目标语言翻译结果句子。
在如上所述的实施例中,以源语言短语对应于目标语言短语的形式描述规则,并以短语为单元进行识别。因此,即使当一部分输入句子是未知部分句子时或者当部分错误地进行语音识别时,使得语言变换装置能够适当地处理并输出已经被正确地识别和分析的一部分。此外,对照翻译短语和短语间规则是通过利用在每个源语言句子和目标语言句子中字或语音部分的邻接频度、和在对照翻译中高频度的字串或语音部分串的共存关系自动地确定的,解释是通过利用对照翻译短语规则进行的。因此,使得语言规则产生装置能够自动且有效地产生高质量的对照翻译短语字典,无需很多人工帮助。
在本实施例中,作为语言变换装置的一个例子已经描述了解释装置。这可以类似地使用在另一种语言变换装置中,例如把非书面发声句子变换为书面语言的文本句子的语言变换装置。
(实施例4)在本实施例中,作为语言变换装置的一个例子,还是通过利用以与第三实施例相同的方式在不同语言之间进行变换的解释装置进行描述。图8是本实施例的解释装置的方框图。
在本实施例中,对照翻译大全101、内容字定义表103、对照翻译字字典107、词态分析部分102、利用语音部分的字片段处理部分104、短语抽取部分142、短语确定部分143、对照翻译短语间规则表145、对照翻译短语字典144、和短语定义表141构成本发明的语言变换规则产生装置的一个例子。本实施例的对照翻译短语字典144是本发明权利要求6所限定的短语字典的一个例子。
在本实施例的解释装置中,在进行解释之前,首先分析词态,然后以与第三实施例相同的方式产生给出语音部分标记的对照翻译大全。
接着,按照短语定义表141,其中对希望被抽取作为短语的字或语音部分串以前用规则化作了描述,短语抽取部分142把对应于该规则的字或语音部分耦合起来。在图9的141例子中,例如,按照诸如“动词+助动词”和“格助词+动词”的规则把“O+(动词)+TAI”耦合作为字。对于用语音部分名称替代一部分内容字以及这些字或语音部分串被耦合视为一个字的大全,计算每个字或语音部分的双链出现(以下称为bi-gram)的频度。源语言句子和目标语言句子分别经受这一计算。计算表示式与表达式2相同。
以与第三实施例相同的方式,重复该过程,直至所有bi-gram的值不超过固定阈值为止。把包括耦合字在内的每一个字抽取作为短语候选者。以与第三实施例相同的方式,短语确定部分产生对照翻译短语字典144和对照翻译短语间规则表145。在图9中,151是按照短语定义表耦合字或语音部分的大全的例子,152是产生的对照翻译短语字典144的例子。
在解释中,本实施例还是以与第三实施例相同的方式进行工作。
在以上描述的实施例中,按照希望被视为以前定义短语的字或语音部分串的规则而耦合字或语音部分,然后,通过利用每个源语言句子和目标语言句子中字或语音部分的邻接频度、以及在对照翻译中高频度的字串或语音部分串的共存关系自动地确定对照翻译短语和短语间规则,并通过利用对照翻译短语规则进行语言或文体变换。因此,有可能提供一种在把人工帮助抑制到最低水平的范围内能够以更高效率产生高质量对照翻译短语字典的语言变换规则产生装置。
本实施例中的对照翻译短语是本发明的相应短语的一个例子。
在本实施例中,作为语言变换装置的一个例子已经描述了解释装置。它可以类似地使用在另一种语言变换装置中,例如,把非书面发声句子变换为书面语言的文本句子的语言变换装置。
(实施例5)在第三实施例中,当规则有待构建时,通过用语音部分名称替代大全中一部分字而实现更通用且具有高质量的语言规则的构建。即使当用句法代码而不是语音部分名称替代字时,预计可获得相同效果。以下,将参考图10描述本实施例。在本实施例中,也是通过利用在不同语言之间进行变换的解释装置进行描述。
在本实施例中,对照翻译大全201、、分类词汇表216、对照翻译字字典207、词态分析部分202、、句法编码部分215、短语抽取部分205、短语确定部分206、对照翻译短语间规则表208、和对照翻译短语字典209构成本发明的语言变换规则产生装置的一个例子。本实施例的对照翻译短语字典209是本发明权利要求6所限定的短语字典的一个例子。
在本实施例的解释装置中,词态分析部分202分析对照翻译大全201中源语言句子的词态,由此给出源语言句子的语音部分标记。接着,在源语言句子的词态串中,语义编码部分215将词态与写在分类词汇表216中的字进行比较。对于与在分类词汇比216中对其给出句法代码的字相一致的词态,用句法代码替代词态名称,由此把输入词态串变换为用句法代码替代一部分词态的词态串。在这种情况中,假设用句法代码替代的词态满足以下条件。
(条件)在大全中的目标语言的相应对照翻译句子中存在一个字,它被登记在对照翻译字字典中,它对应于对照翻译字字典中的目标语言翻译。
在图11的例子中,只有登记在对照翻译字字典中并在分类词汇表中给出其代码的“HEYA”和“YOYAKU”被语义代码所替代,从而产生用语义代码替代这些词态的词态串,如2132所示。此外,目标语言的对照翻译句子中的字名称也被语义代码所替代,如2133所示。
对于一部分内容字被语义代码所替代的大全,短语抽取部分205计算每个字或语义代码的双链出现的频度。源语言句子和目标语言句子分别经受这一计算。计算表示式由表达式5表示。
对于大全中的所有源语言句子和目标语言句子计算bi-gram之后,短语抽取部分使出现频度最高的两个字或语义代码对彼此耦合,同时假设字或对作为一个字。然后,再次计算bi-gram。结果,例如,在以更高频度相邻的每对字,诸如“O”与“NEGAI”、“NEGAI”与“SHI”以及“SHI”与“MASU”彼此耦合,形成短语候选者“ONEGAISHIMASU”。在目标语言中,“I’d”与“like”以及“like”与“to”彼此耦合。
对于所有源语言句子和目标语言句子中的每一个,重复上述耦合和bi-gram的计算直至所有bi-gram的值不超过固定阈值为止。把包括被耦合字在内的每一字抽取为短语候选者。
以与第三实施例相同的方式,短语确定部分206确定对照翻译短语以及把该短语登记在对照翻译短语字典209中。此外,以与第三实施例相同的方式,产生短语间语言规则和短语bi-gram,然后登记在对照翻译短语间规则表208中。
在解释中,本实施例还是以与第三实施例相同的方式工作。
在以上描述的实施例中,以源语言短语对应于目标语言短语的形式描述了规则,并以短语为单元进行识别。因此,即使当一部分输入句子是未知部分句子时或者当部分错误地进行语音识别时,使语言变换装置能够适当地处理并输出已经被正确地识别和分析的一部分。此外,通过利用每源语言句子和目标语言句子中字或语义代码的邻接频度、以及在对照翻译中高频度的字串或语义代码串的共存关系,自动地确定对照翻译短语和短语间规则,并通过利用对照翻译短语间规则而进行解释。因此,使语言规则产生装置能够自动地产生高质量的对照翻译短语字典,无需很多人工帮助。
在本实施例中,作为语言变换装置的一个例子已经描述了解释装置。它可以类似地使用在另一种语言变换装置中,例如,把非书面发声句子变换为书面语言等文本句子的语言变换装置。
(实施例6)在第五实施例中,当语言规则有待构建时,通过耦合字或语音部分、或者高频度邻接的句法代码而产生短语。另一方面,在产生短语后可以对句子的难度进行评价,由此能够产生具有更高质量并能够保证识别率的短语。
以下将参考图12描述语言变换规则产生装置的实施例。
本实施例的对照翻译短语字典是本发明权利要求6中所限定的短语字典的例子。
以与前一实施例相同的方式,在词态分析后,语义代码部分213产生将一部分词态把变换为语义代码的对照翻译大全。此外,短语抽取部分计算每个字或语义代码的bi-gram。源语言句子和目标语言句子分别经受这一计算。计算表示式与(表达式5)相同。
以与前一实施例相同的方式,重复该过程直至所有bi-gram的值都不超过固定阈值为止。把包括被耦合字在内的每一个字抽取作为短语候选者。
在上述过程中,在计算每个字或语义代码的bi-gram并基于bi-gram的值进行耦合过程时,难度计算部分218计算使字对耦合以及使字对不耦合的情况的难度,然后对这两个难度进行比较。难度由(表达式6)计算。
难度F=2H(L)
H(L)=-ΣMP(Wi|Wi-1)logP(Wi|Wi-1)/M]]>式中P(Wi|Wi-1)当第(i-1)词态为Wi-1时第i词态为Wi的几率,M是所有大全中两个字链的种类数。
短语抽取部分217从短语候选者中去除作为比较结果而证实难度是通过耦合字和语义代码而增大的短语。
在上述过程后留作短语候选者的短语当中,在与前一实施例相同的条件下进行短语的确定,并确定对照翻译短语字典209和短语间规则表208。
在以上描述的实施例中,当要确定对照翻译短语时,通过利用以语义代码手段对字分类的难度的对照翻译大全进行确定。因此,从大全能够自动地抽取对照翻译短语,无需很多人工帮助便能有效地产生高质量的对照翻译短语字典。难度的判别标准与确定短语是否适合于语音识别关系密切。因此,能够自动地进行短语抽取同时保证识别准确度。
在本实施例中,已经描述了这样一个例子,其中通过处理一部分字被语义代码替代的大全进行短语抽取。即使当短语抽取是通过处理一部分字被语音部分名称替代的大全进行的时,预计可获得同样的效果。
在第四实施例中,已经描述了处理给出语音部分标记的对照翻译大全和按照短语定义表抽取短语的例子。此外,在使用一部分字被语义代码所替代的大全和按照短语定义表抽取短语的情况中,正如在第五实施例中描述的,预计可获得同样的效果。
在第一至第五实施例中,已经作出的描述假设语言变换装置由语音识别部分、语言变换部分和输出句子产生部分构成。其构成并不局限于此。正如图13所示,可以设置一个语音合成部分,它对从输出句子产生部分212输出的翻译结果句子进行语音合成。语音合成部分是通过利用与语音识别部分中所使用的相同的对照翻译短语间规则表208和对照翻译短语字典209以及语音合成中的语言变换部分211进行语音合成的。根据这一构造,即使当输入语音句子含有未训练的部分或者部分错误地进行语音识别时,能够解决不输出整个句子的任何一部分语音合成结果的问题,并预计对于已经被正确地识别的这部分能够输出适当语音。
通过利用专用硬件或者通过利用计算机程序的软件手段可以实现本发明的语言变换装置或语言变换规则产生装置的各部分的整个或一部分功能。
一种程序记录媒体也属于本发明,其特征在于,该媒体存储了引起计算机执行本发明语言变换装置或语言变换规则产生装置的各部分的整个或一部分功能的程序。
工业应用性从以上描述可见,本发明能够提供一种语言变换规则产生装置和语言变换装置,它能够输出保证能被变换为目标语言句子的识别结果,其中,即使当一部分输入句子是未知部分句子时或者当部分错误地进行语音识别时,对已经被正确地识别和分析的这部分可进行适当处理并输出。
此外,本发明能够提供一种语言变换规则产生装置和语言变换装置,其中,即使当输入语音句子含有未训练部分或者部分错误地进行语音识别时,能够对仅仅已经被正确识别的部分进行变换以及应用适当分析规则,并可能保证输出一部分变换结果。
此外,本发明能够提供一种语言变换规则产生装置,其中无需很多人工帮助能够自动地产生语言规则。
此外,本发明能够提供一种语言变换规则产生装置,其中无需很多人工帮助能够以更高效率自动地产生高质量的语言规则。
此外,本发明能够提供一种语言变换装置,其中能够以更高效率自动地产生高质量的语言规则。
权利要求
1.一种语言变换规则产生装置,其特征在于所述装置包括对照翻译大全;短语抽取部分,它计算在所述对照翻译大全中源语言句子和目标语言句子中字或语音部分的邻接的频度,并使高邻接频度的字或语音部分相耦合,以抽取部分句子,在每个部分句子中形成语义一致性(以下把部分句子称为短语);短语确定部分,在由所述短语抽取部分所抽取的短语当中,它检查源语言与目标语言的短语之间的关系,以确定对应短语;及短语字典,它存储预定的对应短语,在进行语言变换时采用所述短语字典,在输入源语言句子时,语言变换使输入句子与存储在所述短语电子中的对应短语相匹配,由此进行语言或文体变换。
2.如权利要求1所述的语言变换规则产生装置,其特征在于所述短语确定部分检查源语言与目标语言的短语之间的共存关系,由此确定对应短语。
3.如权利要求1所述的语言变换规则产生装置,其特征在于所述装置进一步包括词态分析部分,它把对照翻译大全的源语言句子翻译为字串;及利用语音部分的字片段处理部分,通过利用所述词态分析部分的结果,它产生对照翻译大全,其中用语音部分名称替代一部分或全部源语言句子和目标语言句子的字,所述短语抽取部分从对照翻译大全抽取短语,所述对照翻译大全中,由利用语音部分的所述字片段处理部分用语音部分名称替换字。
4.如权利要求3所述的语言变换规则产生装置,其特征在于所述装置包括源语言和目标语言的对照翻译字字典,利用语音部分的所述字片段处理部分用语音部分名称替代在所述对照翻译字字典中对应的字,其中目标语言是内容字。
5.如权利要求1所述的语言变换规则产生装置,其特征在于所述装置进一步包括词态分析部分,它把对照翻译大全的源语言句子变换为字串;及语义编码部分,通过利用所述词态分析部分的结果,基于对字进行分类而把在语义上相似的字视为是在同一类中,且对于同一类中的字给出相同代码的表(以下把这种表称为分类词汇表),语义编码部分产生对照翻译大全,在对照翻译大全中用分类词汇表的代码替代一部分或全部源语言句子和目标语言句子的字,所述短语抽取部分从对照翻译大全抽取短语,在对照翻译大全中由所述语义编码部分用代码替代字。
6.如权利要求5所述的语言变换规则产生装置,其特征在于所述装置包括源语言和目标语言的对照翻译字字典,所述语义编码部分用语义编码仅替代在对照翻译字字典对应的字。
7.如权利要求1所述的语言变换规则产生装置,其特征在于所述短语抽取部分通过还利用短语定义表抽取短语,短语定义表以前存储了希望被最好地视为短语的字或句子部分串,使源语言与目标语言配对。
8.如权利要求1至7之一所述的语言变换规则产生装置,其特征在于所述装置包括计算大全难度的难度计算部分,所述短语抽取部分通过利用字或字类的邻接的频度和难度抽取短语。
全文摘要
当一部分输入语音句子包含非训练部分时或者当部分错误地进行语音识别时,无法做向目标语言的变换。此外,必须人工产生变换所需的短语字典和短语之间规则。因此,开发在效率上是低的且需要花更多劳力。装置包括语言规则产生部分,它统计地自动地训练来自对照翻译大全的部分字或字串的语法和语义约束规则,其中以源语言部分句子对应于目标语言部分句子的形式描述规则;语音识别部分,它利用所产生的语言规则在源语言的语音上进行语音识别,并输出识别的结果;以及语言变换部分,它利用相同语言规则把源语言句子变换为目标语言句子。即使当一部分输入语音句子含有非训练部分时或者当部分错误地进行语音识别时,可确保能够向目标语言的变换。此外,能够自动地产生变换所需的短语字典和短语之间规则,无需很多人工帮助。
文档编号G06F17/28GK1652107SQ20051005261
公开日2005年8月10日 申请日期1999年6月2日 优先权日1998年6月4日
发明者胁田由实 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1