文本至话音装置及使用它的方法和信息提供系统的制作方法

文档序号:2836642阅读:256来源:国知局
专利名称:文本至话音装置及使用它的方法和信息提供系统的制作方法
技术领域
本发明涉及文本至话音(缩写为TTS)装置和方法,它变换文本句子为话音以便读出变换的文本内容,以及使用上述的文本至话音装置和方法的信息提供系统。
背景技术
在先前建议的信息提供系统中,信息从信息中心发送至车辆内信息终端,该车辆内信息终端提供该信息给用户。文件作为文本数据从信息中心发送,并且在该车辆内信息终端中,已经使用先前建议的文本至话音装置,该装置变换该文本数据为话音数据以便读出该文本数据。

发明内容
但是,先前建议的文本至话音装置在该文本文件以话音读出时导致话音没有音调。为了获得近乎自然的音调话音,TTS装置的性能需要提高,但是需要求许多费用来改进其性能。
因此,本发明的目的是提供改进的文本至话音(TTS)装置和方法以及使用该改进的文本至话音(TTS)装置和方法的信息提供系统,它可以实现以最小可能的费用以实质上自然的音调话音读出文本。
根据本发明的一个方面,提供一种文本至话音装置,其包括第一存储部分,其中存储多个定义子句句型;第二存储部分,其中存储多个话音韵律(prosody)句型,每个话音韵律句型预设为对应于定义的子句句型之一并且以自然的音调话音再生该对应的定义子句句型;以及文本话音部分,当在待读出的文本句子中至少出现定义的子句句型之一时,根据对应于该定义的子句句型的话音韵律句型之一读出至少一个文本句子。
根据本发明的另一个方面,提供一种信息提供系统,其包括信息中心,用于发送包括至少一个待读出的文本句子的各种信息,该信息中心包括第一存储部分,其中存储多个定义的子句句型,并且在待读出的文本句子中包含至少一个定义的子句句型的情况下,规定在第一存储部分中存储的定义的子句句型之一;以及至少一个信息终端,该信息终端从该信息终端接收包括该文本句子的各种信息,该信息终端包括第二存储部分,其中存储多个话音韵律句型,每个话音韵律句型预设为相应于定义的子句句型之一并且以自然的音调话音再生该定义的子句句型的相应的句型;以及文本话音部分,当在所接收的待读出的文本句子中至少出现定义的子句句型之一时,根据该话音韵律句型之一读出至少一个文本句子。
根据本发明的另一个方面,提供文本至话音方法,包括存储多个定义的子句句型;存储多个话音韵律句型,每个话音韵律句型预设为相应于定义的子句句型之一,并且以自然的音调话音再生该相应的定义的子句句型之一;以及当在待读出的文本句子中至少出现该定义的子句句型之一时,根据对应于定义的子句句型之一的话音韵律句型之一读出至少一个文本句子。
本发明的这个概要不必描述所有的必要的特征,因此本发明也可以是这些描述的特征的子组合。


图1是表示优选实施例中的信息提供系统的电路方框图,根据本发明的优选实施例的文本至话音(TTS)装置和方法可应用在该信息提供系统中;图2示出了代表在图1所示的信息提供系统中使用的路由线路名字和它们的业务量信息的方向的子句句型的例子的表;图3示出了代表在图1所示的信息提供系统中使用的业务量信息的阻塞和调节的子句句型的例子的表;图4示出了业务量信息的公共的固定的子句句型的例子的表;
图5A、5B和5C示出了关于该业务量信息的话音内容的例子的表;图6示出了天气预报的子句句型的例子的表;图7示出了代表天气预报中降雨概率的子句句型的例子的表;图8示出了代表天气预报的固定的子句句型的例子的表;图9A和9B示出了关于天气预报的话音内容的例子的表;图10示出了将从图1表示的信息中心发送的读出文本文件的形式的说明图;图11A、11B、11C、11D、11E、11F和11G是表示从图1中所示的该信息中心发送至车辆内信息终端的话音内容的表;图12是表示图1中所示的该信息中心和车辆内信息终端之间的信息提供操作的操作流程图;图13是在图12的步骤S5执行的、有关NPM相应文本的信息再生的子程序。
具体实施例方式
以下参考附图能更好地理解本发明。
下面描述根据本发明的文本至话音(TTS)装置的一个优选实施例,它可应用到车辆信息提供系统,其中来自信息中心的各种信息发送至车辆内信息终端并且该信息从该车辆内信息终端提供给用户。应该注意,本发明不限制为车辆信息提供系统,而是可应用到每个信息提供系统。例如,根据本发明的文本至话音(TTS)装置可以应用于PDA(个人数字助理)或者移动的个人计算机。因此,可以获得以自然的音调读出的文本话音。本发明还可应用到作为车辆内信息终端和便携信息终端(或者PDA)的信息终端。该车辆内和便携的兼容信息终端可用作为具有在预定位置的终端机的车辆内信息终端,以及如果该车辆内信息终端从该车辆的预定位置拿出并且携带着则作为个人数字助理(PDA)。
图1表示上述的TTS装置的优选实施例的大致的配置。安装有该实施例中的文本至话音装置的车辆信息提供系统是由信息中心10和车辆内信息终端20构成的。注意,虽然在图1中仅仅示出一套车辆内信息终端20,但也可在许多汽车中安装多个相同的车辆内信息终端。还要注意,信息中心10和车辆内信息终端20是通过无线电话电路通信的。
信息中心10包括用于实现信息处理的处理单元11;用于存储各种信息内容的信息数据库(DB)12;用于存储用户信息的用户数据库(DB)13;用于存储文本文件的子句句型的子句句型存储器14;和通信设备15,用于通过无线电话电路与车辆内信息终端20实现通信。信息中心10还包括服务器16,用于通过因特网从外部信息源30输入该信息;和服务器17,用于从诸如公共道路交通信息中心和气象机构这样的外部信息源40直接地输入道路交通信息和气象信息。
另一方面,车辆内信息终端20包括用于从信息中心10输入该信息并且从信息中心10再现该输入信息的处理单元21;语音合成器22,它将文本文件转换为话音(语音)以便驱动扬声器23;用于存储话音韵律句型的话音韵律句型存储器23,每个话音韵律句型对应于一个定义的子句句型;图像再生单元25,它产生图像数据,再生该产生的图像数据并且在显示器26显示该图像数据;具有诸如开关的操作部件的输入设备27;通信设备28,用于通过GPS(全球定位系统)接收机29与信息中心10进行通信,GPS接收机29检测安装有车辆内信息终端20的汽车目前的位置。
然后,根据稍后将叙述的通常称为NPM(自然韵律映象)的话音合成方法,语音合成器22转换该文本(文件)为话音(TTS文本至话音)。注意,在本说明书中,该文本(文件或者句子)是根据对应文本读出被称作NPM(自然韵律映象)的话音韵律句型以话音的形式(或者语音形式)读出的。执行对应于NPM的文本发音读出的文本文档,文本句子和子句块分别称作NPM对应的文本文档,NPM对应的文本句子和NPM对应的子句块。另一方面,未使用话音韵律句型的先前建议的文本读出被称作NPM对应的文本读出。执行不对应于NPM的文本读出的文本文档,文本文件和子句块称作NPM非对应的文本文档,NPM非对应的文本句子和NPM非对应的子句块。
下面描述在这个实施例中在TTS装置中执行的文本读出方法。
也就是说,分析表示诸如交通信息或者气象预报之类的话音内容的写入。从句子中提取例如使用频率比较高的一个或者多个子句以定义子句句型。然后,通过组合包括未定义的子句句型的多个子句句型构成话音内容。另外,预设并且存储话音韵律句型,以便以基本上自然的音调说出再生和定义的各个子句句型。然后,当从信息中心10发送包括将以发音的形式读出的文本句子的话音内容时,规定读出文本句子中使用的定义的子句句型的数量。在车辆内信息终端20,根据对应于指示要求的子句句型的规定数量的话音韵律句型以发音的形式读出该文本句子。因此,可以以最小可能的费用获得自然音调的文本读出。注意,存储在子句句型存储器部分14中的子句句型不限制为使用频率高的子句。例如,在实现以发音的形式的文本读出时变成不自然的音调,或者将听不到的声音在定义的子句句型中可以被句型化。
在诸如道路交通信息和气象预报信息的话音内容中子句句型的提取和定义执行如下例如,假设气象预报为“降雨(下雨)概率为百分之10”和“降雨(下雨)概率为百分之100”。
另外,假设交通阻塞信息为“在Yoga收费站附近地区交通阻塞3.5公里”和“在Tanimachi交叉口交通阻塞5公里”。子句句型可以说是通过可由每个任意的片语诸如“Yoga收费站附近地区”,“Tanimachi交叉口”,“3.0”和“5”替换的可变的片语以及公用的固定而不是可变的片语构成的。
在下面将描述诸如交通信息和气象预报之类的话音内容的子句句型的一个例子。
表示有关交通信息的路由和方向的子句可以认为具有这样的句型“Tomei高速路上行”,“Tomei高速路下行”,“Wangan(东京湾)线路界限向东”,“Wangan(东京湾)线路界限向西”,“中心环线的内行线”以及“中心环线的外行线”。对于这些句型,定义交通信息子句句型1至8,正如图2表所示的。
注意,正如从图2可理解的,在括号内的片语是可以由括号内的任意的片语替换的可变的片语,而不在括号内的片语是固定的子句。(在下文中,这些规则对其它子句句型同样地适用)。
另外,表示交通阻塞和管制的子句可能具有这样的问题“在Yoga和Tanimachi之间交通阻塞3.0公里”,“在Yoga交通阻塞”,“在Yogi和Tanimachi之间交通关闭”,“在Yoga交通关闭”,“目前既不阻塞也不管制”和“没有出现阻塞”。从这些子句句型定义如图3中所示的交通信息子句句型No.9至No.14。
此外,当所表示的交通信息被定义为交通信息子句句型No.15时图4示出固定片语的例子。在图4中为日语“to natte orimasuo。”。例如,这个固定子句翻译为“这些是目前的高速路交通信息”。正如上述,使用交通信息子句句型No.1至No.15可以构造如图5A、5B和5C所示的交通信息的话音内容。在图5A的例子1中,从开始于(SyutokouWangan Sen)HigashiYuki,(Ichikawa Interchange)De Jyuutai(3.0)公里,(Kasai Junction Fikin)De Jyuutai(5.0)公里的子句句型进行图5A所示的翻译并结束于“to natte imasu。”。注意,句号“。”通常等于一个句点“.”,而另一标点符号“、”通常等于逗号“,”或单词“和”。在图5B的例子中,从开始于(Tomei Kosoku Doro)Nobori,(Yoga Ryokinsho)Kara(Tanimachi Junction)No Aidade(Tsukodome)的子句句型进行图5B所示的翻译并结束于片语“to natte imasuo。”。在图5C的例子3中,从开始于(Tomei Kosoku Doro)Nobori,(KawasakiInterchange Fikin)De Jyutai(6.0)公里to natte imasu。(Kokudo246 GoSen)Nobori的子句句型进行图5C所示的翻译且结束于“Jyutai HaArimaseno。”。
其次,表示有关天气预报的(地区的或者国家的)天气的子句可以认为如下所示“今天的天气为晴天”,“今天的天气是多云”,“今天的天气是多云”,“今天的天气是多云转晴”,“今天的天气是多云转晴”,“今天的天气是多云转晴”,“今天晚上有雨”,“今天晚上的天气是晴天”,“明天的天气是多云转晴”和“明天的天气是多云转雪”。从这些句型定义图6所示的气象预报子句句型1。另外,表示降雨(下雨)概率的子句可以认为如下“降雨概率为百分之0”,“降雨概率为百分之10”,和“降雨概率是百分之100”。从这些句型定义图7所示的天气预报子句句型2。使用上面叙述的气象预报子句句型1至3,可以构成如图9A和9B所示的天气预报的话音内容。从原始的日语句子进行图9A的翻译如下“(Kyo)NoTenki Ha(Hare NochiKumori),Kousui Kakuritsu Ha(0)Percent No Yoso Desu。”。从原始的日语句子进行图9B的翻译如下“(Kyono)Denki Ha(Hare NochiKumori),AsuNoTenki Ha(Kumori Ichizi Ame)NoYoso Desuo。”。
将上面描述的如此定义的子句句型存储入信息中心10的子句句型存储器14,而对应于在其中存储的每个子句句型的话音韵律句型存储在车辆内信息终端20的话音韵律句型存储器24中。该话音韵律句型是以发音的形式(话音)以自然的音调读出相应的子句句型的文本的句型。信息中心10的处理单元11产生交通信息、天气预报和季节的信息(樱花盛开信息,关于观看秋天红叶最佳时间的信息和滑雪场情况信息)之类的话音内容。
根据以下格式话音内容生成为发音的读出(或者话音)文本文档。图10表示由标题(部分)和数据(部分)构成的发音的读出文本文档的结构。标题描述用于表示该文本文档是NPM相应的发音读出文本以及它的属性信息(它可以被省略)的标题标记(#!npm)。属性信息包括版本信息和代表它是NPM对应或者NPM非对应的信息。版本信息被描述为(版本=“1.00”)。NPM对应的文本被描述为(npm=1)。NPM非对应的文本被描述为(npm=0)。CR+LF>新线路被设置在标题和数据之间。
如果没有关于上述的文本文档的标题标记(#!npm)的描述,则车辆内信息终端20处理从信息中心10发送的话音内容的文本文档作为NPM非对应的读出文本句子。另一方面,在从信息中心10发送的话音内容的文本文档中描述了标题标记(#!npm)和没有描述关于属性信息的情况下,或者在从信息中心10发送的话音内容的文本文档中描述了标题标记(#!npm)和描述了属性信息(npm=1)的情况下,上述的话音内容文本文档被处理为NPM对应的读出(话音)文本句子。在上面描述的文本文档中描述了属性信息(Npm=0)的情况下,甚至在描述了标题标记(#!npm)的情况下也将上述的话音内容的文本文档作为NPM非对应的读出(话音)文本句子处理。另一方面,数据部分是由多个子句块构成,<CR+LF>新线路插入在每个子句块之间。另外,为每个子句块描述子句标记,属性信息和子句数据。子句标记在每个子句块的开头描述。在NPM相应的子句情形下,子句块标记(#npm)设置为子句标记。车辆内信息终端20按顺序从向上的部分再生该数据部分的多个子句块。如果在相应的子句块的开头描述NPM相应的子句标记(#npm),则相应的子句块被处理为NPM相应的子句块。为相应的子句数据执行对应于NPM的发音的读出。注意,在子句块的开头没有描述NPM相应的子句标记(#npm)的情况下,相应的子句块被处理为NPM非相应的子句块并且执行不对应于NPM的发音读出。以这样的形式描述子句块中的属性信息定义的子句句型编号N是(句型=N)。车辆内信息终端20的语音合成器22从话音韵律句型存储器24中读出对应于子句句型编号N的话音韵律句型并且根据该话音韵律句型执行子句数据的发音读出。
图11A至11G表示从信息中心10发送到车辆内信息终端20的话音内容的例子。图11A表示有关话音内容的交通信息的例子。也就是说,在图11A中所示日语子句的翻译如下#!npm版本=“1.00”,npm=1(首行为空)#!npm句型=8Toshin Kanjyo Sen(Higashi)Sotomawari#npm句型=0;,#npm句型=22Hamasakibashi De Jyutai 1 Kilometer#npm句型=0,#npm句型=2Kl GoYokohane Sen kudari#npm句型=0,#npin句型=22TaishiYoukinsho De Jyutai 1 Kilometer#npm句型=24至Natte Imasu。
图11B表示在一些区域的天气预报信息的例子2。也就是说,在图11B中所示日语子句的翻译如下#!npm版本=“1.00”,npm=1(空)
#npm句型=30Kyou No Tenki Ha HareNochi Kumori#npm句型=0;ftnprn句型=30Kyo No Tenki Ha HareNochi Kumori#npm句型=0,#npm句型=33Kousuikakuritsu Ha 10%#npm句型=34NoYoso Desu。
图11C表示不能提取子句句型的新闻的例子3。也就是说,在图11C中描述的日语子句的翻译如下#!npm版本=“1.00”,npm=l(空)GizoHaiWayCard Wo Tsukai Konbini De Genkin Wo DamashiToru Sinte No Sagi Ziken Ga Kongetsu,Kawasaki Sinai Nadode HasseiSiteimasu。
SeikiNo Kogaku Kard Wo Kounyu,Seiko Na Gizou Ka-do WoMochikindeTeigakuWo Harai Modosu Teguchi De 7 Ken Ga Hanmei.DoitsuHannin No Shiwaza..
图11D表示观看秋天红叶的最佳时间的信息的例子4。
也就是说,日语子句的翻译如下#!npm版本=“1.00”,Npm=l;#npm句型=44Koyo at Hakone are Irozuki Hazime Teorimasu。
图11E表示樱花盛开信息的信息例子5。
也就是说,日语子句的翻译如下#!npm版本=“1.00”,npm=1(空)#npm句型=43Nogeyama Koen No Sakura Ha MoChirihazimekara Hazakura Desu.
图11F表示滑雪场情况信息的信息例子6。
也就是说,该翻译是滑雪场信息。即,日语子句的翻译如下#!npm版本=“1.00”,npm=lAmerika Dai League,National League No Cy Young Sho NiDaiyamondobakkusu NO Randy Jhonson Toshu Ga
Erabaremashita.3 Nen Renzoku 4 Dome No Zyusho Desu。
21 Sho 6 Pai No Kouseiseki De,National Riigu Tanto Kisha 32 NinChyu,30 Nin Ga 1 I,2 Ri Ga 2 I To Attoutekina Shizi Wo KakutokuSimasita。
#npm句型=61 ShinChaku Meiru Ga 3 Ken Todoiteimasu。.
在图11A和11B中描述的例子1和2中,包括不需要发音读出(没有话音)的至少一个这样的标点符号“,”。在相应的子句句型的属性信息中,(句型=0)描述为代表这是未定义的子句句型。另外,图11C表示不能提取任何子句句型的新闻的话音内容的例子(例子3)。注意,在例子3的标题部分的属性信息中描述代表这是不对应于NPM的文本文档的(npm=0)。图11D表示关于观看秋天红叶的最佳时间的信息的话音内容的例子(例子4)。图11E表示关于樱花盛开状态信息的话音内容的例子(例子3)。图11F表示滑雪场条件的话音内容的例子(例子6)。此外,图11G表示其中出现NPM非相应子句(图11G中的第2至6行)的话音内容的例子。
图12是示出了代表在信息中心10和车辆内信息终端20之间的信息提供操作的操作流程图。当响应车辆内信息终端20的输入设备27的一指示执行信息提供请求操作时,开始该信息提供操作。注意,激活该信息提供操作不限制为对通过输入设备27的请求操作的响应,而且包括从信息中心10自动地提供先前分配联系信息的情况。在步骤S1,车辆内信息终端20发送信息提供请求给信息中心10。该信息提供请求包括一种信息、它的内容、识别用户的代码、移动电话号码和现在的位置。
在步骤S11信息中心10接收来自车辆内信息终端20的信息提供请求并且与存储在用户数据库13中的用户数据核对以便确认信息提供合同。如果信息提供请求人是立约人,信息中心20根据请求内容从信息数据库12读出该信息内容,根据该请求内容从信息数据库30输入该信息,输入道路交通信息和天气信息以产生提供的信息内容。在步骤S12,信息中心10发送该信息内容给车辆内信息终端20。
在图12的步骤S2,车辆内信息终端20从信息中心10接收该信息内容。在步骤S3,车辆内信息终端20确认NPM相应的发音读出文本文档是否包括在该接收的信息中。注意,根据上面描述的确定条件,基于话音内容的文本文档的标题标记(#!npm)的描述的存在与否和它的属性信息来执行确认接收的信息是否为NPM相应的读出文本文档。
如果不包括NPM相应的文本文件(否),则子程序转到步骤S6。在步骤S6,车辆内信息终端20确定是否再生该信息。那就是说,通过图像再现设备25与在显示器26上显示的图像信息一起,通过语音合成器22从扬声器23产生发音的信息。在这个时候,利用用于NPM非对应的文本句子的语音合成器22执行不对应于NPM地读出该文本。
另一方面,在接收的信息中包括NPM相应的文本文档的情况下,子程序转到步骤S4。在步骤S4,再生不同于NPM相应的文本文档的信息。也就是说,通过图像再现设备25在显示器26上显示图像信息,并且通过语音合成器22从扬声器广播诸如音乐之类的信息。接下来,在步骤S5,执行图13所示的子程序以便执行NPM相应的文本文档的信息再生。注意,为了说明方便,执行不同于NPM相应的文本文档的信息再生,接下来执行NPM相应的文本文档的读出(话音)。但是,这些操作可以是并行的并且可以同时地执行。
在图13表示的步骤S21,车辆内信息终端20确定NPM相应的文本文档中的数据部分的第一子句块是否是NPM子句块。如果在该块的开头描述NPM相应的子句的标记(#npm),则子程序转到步骤S22。如果没有描述NPM相应的子句标记(#npm),则子程序转到步骤S26,确定这个子句是NPM非相应的子句块。
在步骤S22,车辆内信息终端20确认是否子句句型No.0(句型=0)的属性在该子句块的属性信息中。因为不存在对应于子句句型No.0的话音韵律句型,所以车辆内信息终端20确定子句句型No.0是NPM非相应的子句块,子程序转到步骤S26。
如果没有描述子句部分No.0,子程序转到步骤S23,确认是否可以识别在属性信息中描述的子句句型编号,即确定对应于所描述的子句句型编号的话音韵律句型是否存入存储器24。如果对应于该子句句型编号的话音韵律句型没有存入存储器24,则确定该子句块是NPM非对应子句块,子程序转到步骤S26。在步骤S26,车辆内信息终端20通过语音合成器22执行NPM非相应的子句块的发音合成,不使用该话音韵律句型执行NPM非相应的文本发音读出,并通过扬声器23广播它。
另一方面,如果车辆内信息终端20确定在NPM相应的子句块中接收文本文档,则该子程序转到步骤S24。从存储器24中读出在属性信息中描述的对应于子句块编号的话音韵律句型。在下一步骤S25,语音合成器22使用话音韵律句型用声音合成NPM相应的子句块,执行对应于NPM的文本的发音读出(话音),并通过扬声器23广播它。在步骤S25,语音合成器22使用话音韵律句型用声音合成NPM相应的子句块并且执行对应于NPM的文本的发音读出以便通过扬声器23广播它。然后,在步骤S27,车辆内信息终端20确认是否已经完成包括在NPM相应的文本文档中的所有的子句块的再生。如果剩下没有再生的子句块(否),子程序转到步骤S27。然后,重复上面描述的过程。如果所有的子句块的再生完成,则图13中所示的程序返回到图12中表示的主程序。
在上面描述的实施例中,由于设置了信息提供系统,该信息提供系统中提供了包括从信息中心10读出给车辆内信息终端20的文本句子的各种信息,所以信息中心10句型化这些子句并且将它们存入存储器14。在该子句句型包括在发音读出(话音)文本句子中的情况下,信息中心10规定该子句句型。然后,车辆内信息终端20存储该子句句型的发音的韵律句型,读出相应于由信息中心10规定的子句句型的话音韵律句型,并根据该话音韵律句型以话音声音执行文本句子的读出。因此,可以获得能够以自然的音调读出文本的文本至话音装置。
另外,在上面描述的实施例中,因为对由可以任意片语替换的可变片语和不同于可变片语的公用的固定片语构成的每个子句进行句型化,故可以准备可应用到许多子句的句型,因此减少了子句句型的数量。另外,可以减轻安装在信息中心10用于实现文本话音处理过程的微型计算机的负担并且可以增加它的处理速度。
在上面描述的实施例中,信息中心10规定是否应该为话音文本句子的每个子句块执行使用该话音韵律句型的读出(话音),另一方面,车辆内信息终端20使用话音韵律句型为未由信息中心10规定的每个子句块执行该话音(发音读出)。因此,通常可以执行文本句子的发音的读出(话音),即使在待说出(待读出)的文本文件中,包括子句句型的一个或者多个子句块与不包括任何子句句型的一个或者多个子句块相混合。
此外,在上面描述的实施例中,甚至在车辆内信息终端20不存储相应于由信息中心10规定的一个子句句型的话音韵律句型的情况下,也执行不使用话音韵律句型的发音读出(话音)。因此,即使由信息中心10规定不能由车辆内信息终端20识别的新的子句句型,也可以执行相应的文本文件的话音。与每个车辆内信息终端20中话音韵律句型存储器24的版本无关,可以进行信息中心10的子句句型存储器的版本升级(versionup)。
在此引用日语专利申请No.2001-389894(2001年12月21日在日本申请)的全部内容供参考。本发明的范围参见权利要求书定义。
权利要求
1.一种文本至话音装置,包括第一存储部分(14),其中存储多个定义子句句型;第二存储部分(24),其中存储多个话音韵律句型,每个话音韵律句型预设为相应于该定义子句句型之一并且以自然的音调话音声音再生该相应的一个定义子句句型;以及文本话音部分(22),用于当在待读出的文本句子中至少出现该一个定义子句句型时,根据相应于该一个定义子句句型的一个话音韵律句型读出至少一个文本句子。
2.根据权利要求1的文本至话音装置,其中存储在第一存储部分中的每个定义子句句型包括由可以任意的片语替换的可变的片语和不同于该可变的片语的公用的固定片语构成的子句。
3.根据权利要求1或者2的文本至话音装置,其中待读出的文本句子是表示预定的话音声音内容的句子。
4.根据前面的权利要求1至3的任何一个的文本至话音装置,其中存储在第一存储部分中的每个子句句型是具有预定的高使用率、从表示预定的话音声音内容的句子中提取的子句。
5.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是气象预报信息。
6.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是道路交通信息。
7.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是有关观看秋天红叶的最佳时间的信息。
8.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是有关滑雪场条件的信息。
9.根据前面的权利要求1至8的任何一个的文本至话音装置,其中在信息中心(10)内提供第一存储部分,在至少一个定义子句句型包含在待读出的文本句子中的情况下,该信息中心规定存储在第一存储部分的该一个定义子句句型,并且传送该文本句子给至少一个信息终端,并且其中在该信息终端(20)内提供第二存储部分和文本话音部分,该信息中心(10)和该信息终端(20)构成信息提供系统。
10.根据权利要求9的文本至话音装置,其中该文本句子是由多个子句块构成的,该信息中心(10)对于待读出的文本句子的每个子句块,规定是否应该使用话音韵律句型执行相应的一个子句块的读出,并且该信息终端(20)使用该话音韵律句型执行由该信息中心规定的相应的子句块的读出,并且不使用该话音韵律句型执行未由该信息中心规定的文本句子的相应的一个子句块的读出。
11.根据权利要求9或者10的文本至话音装置,其中在由该信息中心(10)规定的文本句子的一个子句块对应于定义子句句型之一的情况下,该信息终端(10)根据存储在第二存储部分(24)中的相应的一个话音韵律句型执行构成该文本句子的相应的一个子句块的读出,并且在由该信息中心(10)规定的文本句子的一个子句块对应于一个定义子句句型且相应的一个话音韵律句型没有存储在第二存储部分(24)中的情况下,不使用任何话音韵律句型执行构成该文本句子的相应的一个子句块的读出。
12.根据前面的权利要求9至11的任何一个的文本至话音装置,其中该信息终端(20)包括由用户便携的至少一个PDA和安装在汽车中的车辆内信息终端(20)。
13.一个信息提供系统,包括信息中心(10),用于发送包括至少一个待读出的文本句子的各种信息,该信息中心(10)包括第一存储部分(14),其中存储多个定义子句句型,并且在待读出的文本句子中包含至少一个定义子句句型的情况下,该信息中心规定在第一存储部分中存储的定义子句句型之一;以及至少一个信息终端(20),该信息终端接收包含来自该信息终端的文本句子的各种信息,该信息终端包括第二存储部分(24),其中存储多个话音韵律句型,每个话音韵律句型预设为相应于定义的子句句型之一并且以自然的音调话音声音再生该相应的定义子句句型之一;以及文本话音部分(22),当在所接收的待读出的文本句子中至少出现该定义子句句型之一时,根据该话音韵律句型之一读出至少一个文本句子。
14.根据权利要求13的信息提供系统,其中存储在第一存储部分中的每个定义子句句型包括由可用任意的片语替换的可变的片语和不同于该可变的片语的公用的固定片语构成的子句。
15.根据权利要求13或者14的信息提供系统,其中该文本句子是由定义子句句型与未定义子句句型的多个子句块组成,且该信息中心(10)对于待读出的该文本句子的每个子句块,规定是否应该使用话音韵律句型执行该相应的一个定义子句句型的读出,该信息终端(20)使用该话音韵律句型执行从该信息中心规定的子句块的读出并且不使用该话音韵律句型执行未由该信息中心规定的任何子句块的读出。
16.根据权利要求15的信息提供系统,其中在由该信息中心(10)规定的文本句子的一个子句块对应于一个定义子句句型的情况下,该信息终端(20)根据存储在第二存储部分(24)中的相应的一个话音韵律句型执行构成该文本句子的相应的一个子句块的读出,并且在由该信息中心(10)规定的文本句子的一个子句块对应于一个定义子句句型并且相应的一个话音韵律句型没有存储在该第二存储部分中的情况下,不使用任何话音韵律句型执行构成该文本句子的相应的一个子句块的读出。
17.根据前面的权利要求9至16的任何一个的信息提供系统,其中该信息终端(20)包括由用户便携的至少一个PDA和安装在汽车中的车辆内信息终端。
18.根据前面的权利要求9至17的任何一个的信息提供系统,其中该信息中心(10)产生和发送将读出给该信息终端的预定的话音内容的文本文档,每个文本文档包括一个标题和一个数据,该标题描述用于表示该相应的文本文档是否是至少具有话音韵律句型和属性信息的NPM相应的读出文本的标题标记,而该数据由多个子句块构成,每个子句块描述子句标记和子句数据,该子句标记用于表示该相应的子句块是否对应于定义子句句型、另一个属性信息。
19.一种文本至话音方法,包括存储多个定义子句句型;存储多个话音韵律句型,每个话音韵律句型预设为相应于一个定义子句句型并且以自然的音调话音声音再生该相应的一个定义子句句型;以及当在待读出的文本句子中至少出现该定义子句句型之一时,根据对应于该定义子句句型之一的一个话音韵律句型读出至少一个文本句子。
全文摘要
在文本至话音装置及方法和信息提供系统中,多个定义子句句型存储在信息提供系统的第一存储部分中,多个话音韵律句型存储在诸如车辆内信息终端的信息终端中的第二存储部分中,每个话音韵律句型预设为相应于一个定义子句句型并且以自然的音调话音再生该相应的一个定义子句句型,并且当在待读出的文本句子中至少出现该一个定义的子句句型时,文本话音部分根据相应于该一个定义子句句型的一个话音韵律句型执行至少一个文本句子的读出。
文档编号G10L13/00GK1430203SQ02157569
公开日2003年7月16日 申请日期2002年12月20日 优先权日2001年12月21日
发明者直井和美 申请人:日产自动车株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1