发音信息生产装置、车载信息装置以及数据库生成方法

文档序号:2825356阅读:212来源:国知局
发音信息生产装置、车载信息装置以及数据库生成方法
【专利摘要】单词串信息DB存储部(1)存储有登记了单词串的书写信息与正式发音信息的单词串信息DB。该单词串信息DB在根据书写信息自动生成的发音信息与正式发音信息一致的情况下,仅登记书写信息,在不一致的情况下,登记书写信息与正式发音信息。单词串信息检索部(2)从单词串信息DB存储部(1)获取与输入字符串相一致的单词串的信息,发音信息生成判定部(3)若判定未登记该单词串的正式发音信息,则使发音信息生成部(4)生成发音信息并进行外部输出,若判定登记有该单词串的正式发音信息,则从发音信息输出部(5)对该正式发音信息进行外部输出。
【专利说明】发音信息生产装置、车载信息装置以及数据库生成方法
【技术领域】
[0001]本发明涉及生成单词串或者单词的发音信息的发音信息生成装置、使用该发音信息生成装置进行声音合成或声音识别处理的车载信息装置以及为了使该发音信息生成装置生成发音信息所需的单词串信息数据库的生成方法。
【背景技术】
[0002]当前,车载导航装置中一般具有声音输入输出接口,需要对城市名以及到道路名等地名进行声音输出的声音合成功能、以及对用户所发声的地名进行声音识别的功能。在车载导航装置中,为了进行声音合成以及声音识别,需要发音信息,该发音信息表示地名等作为对象的单词的读音。因此,现有的声音合成装置具有存储有表示单词的书写的书写信息以及与书写相对应的发音信息的数据库(例如,参照专利文献1、2)。
[0003]另一方面,存在生成与书写相对应的发音信息的字素音素(Grapheme-to-Phoneme ;G2P或者GTP)转换等技术。例如,若对纽约州的城市的书写“ALDERBEND”进行G2P转换,则生成《*” 011 dir" bEnd))以作为发音信息。
现有技术文献 专利文献
[0004]专利文献I
日本专利特开平9 - 325789号公报 专利文献2
日本专利特开2004 - 326367号公报

【发明内容】

发明所要解决的技术问题
[0005]现有的声音合成装置在数据库中存储有对于各个书写的发音信息,因此数据库的大小变得非常大。因此,具有需要存储数据库的大容量存储器的问题。
[0006]另一方面,在利用G2P转换等技术生成与书写相对应的发音信息的情况下,在数据库中仅存储书写信息,根据需要生成发音信息即可,因此能减小数据库的大小。然而,具有所生成的发音信息不一定正确的问题。例如,纽约州的城市书写“ALDER BR00K”的正确的发音信息是《*” 01 I dir" brUk)),但若利用G2P转换,则会生成错误的发音信息《*” 01 Id@r” krik))0
[0007]本发明是为了解决上述问题而完成的,其目的在于,使用小容量的数据库,来生成与书写相对应的正确的发音信息。
解决技术问题所采用的技术方案
[0008]本发明的发音信息生成装置包括:单词串/单词信息数据库,该单词串/单词信息数据库在根据单词串或者单词的书写信息自动生成的发音信息与该单词串或者单词的书写所对应的正式的发音信息不一致的情况下,一并登记书写信息与正式的发音信息,在一致的情况下,登记书写信息而不登记正式的发音信息;单词串信息检索部,该单词串信息检索部从单词串/单词信息数据库获取与输入的单词串或者单词相应的书写信息;发音信息生成判定部,该发音信息生成判定部判定与单词串信息检索部所取得的书写信息相对应的正式的发音信息是否已登记到单词串/单词信息数据库中;发音信息生成部,该发音信息生成部根据发音信息生成判定部的判定结果,从未登记正式的发音信息的书写信息生成发音信息;以及发音信息输出部,该发音信息输出部根据发音信息生成判定部的判定结果,在未登记书写信息的正式的发音信息的情况下,输出发音信息生成部生成的发音信息,在登记了正式的发音信息的情况下,输出单词串/单词信息数据库中所登记的对应的正式的发音信息。
[0009]此外,本发明的车载信息装置包括上述发音信息生成装置,且具有声音合成部与声音识别部中的至少一个,该声音合成部利用发音信息生成装置生成进行声音输出的单词串或者单词的发音信息,并将该生成的发音信息转换为合成声音,该声音识别部将声音识别对象即单词串或者单词作为输入字符串,基于利用发音信息生成装置生成的发音信息,生成声音识别词典,利用该声音识别词典,对输入的声音信息进行声音识别。
[0010]此外,本发明的数据库生成方法包括:发音信息生成步骤,该发音信息生成步骤中,基于包含单词串或者单词的书写信息以及与该单词串或者单词的书写相对应的正式的发音信息的输入数据,从书写信息来生成发音信息;发音信息比较步骤,该发音信息比较步骤中,将发音信息生成步骤中所生成的发音信息与输入数据中包含的正式的发音信息进行比较;以及单词串信息登记步骤,该单词串信息登记步骤中,根据发音信息比较步骤的比较结果,在发音信息生成步骤中所生成的发音信息与正式的发音信息不一致的情况下,一并将书写信息与正式的发音信息登记至数据库,在一致的情况下,登记书写信息而不登记正式的发音信息。
发明效果
[0011]根据本发明,在预先判明自动生成的发音信息与正式的发音信息一致的情况下,在发音信息生成处理中根据书写信息生成发音信息,因此无需在数据库中预先登记正式的发音信息,从而能减小数据库的大小。另一方面,在预先判明自动生成的发音信息与正式的发音信息不一致的情况下,预先在数据库中登记正式的发音信息,在发音信息生成处理中并不根据书写信息生成发音信息,而是使用登记在数据库中的发音信息,因此能防止生成错误的发音信息。因此,能利用小容量的数据库来生成与书写相对应的、正确的发音信息。
[0012]此外,根据本发明能提供一种发音信息生成装置,该发音信息生成装置由于减小了数据库大小,因此能使发音信息生成装置小型化,适合用于要求小型化的车载信息装置。
【专利附图】

【附图说明】
[0013]图1是表示本发明的实施方式I所涉及的发音信息生成装置的结构的框图。
图2是表示实施方式I所涉及的发音信息生成装置具有的单词串信息DB的一个示例的图。
图3是表示实施方式I所涉及的发音信息生成装置具有的单词串信息DB的其他示例的图。
图4是表示实施方式I所涉及的发音信息生成装置的动作的流程图。图5是表示实施方式I所涉及的DB生成装置的结构的框图。
图6是表示实施方式I所涉及的DB生成装置的动作的流程图。
图7是表示本发明的实施方式2所涉及的DB生成装置的结构的流程图。
图8是表示实施方式2所涉及的DB生成装置所生成的单词串信息DB的一个示例的图。 图9是表示实施方式2所涉及的DB生成装置的动作的流程图。
图10是表示本发明的实施方式3所涉及的发音信息生成装置具有的单词串信息DB以及发音信息列表的一个示例的图。
图11是表示实施方式3所涉及的发音信息生成装置的动作的流程图。
图12是表示实施方式3所涉及的发音信息生成装置具有的单词串信息DB以及发音信息列表的其他示例的图。
图13是表示本发明的实施方式4所涉及的DB生成装置所生成的单词串信息DB以及发音信息列表的一个示例的图。
图14是表示本发明的实施方式5所涉及的导航装置的结构的框图。
【具体实施方式】
[0014]下面,为了对本发明进行更加详细的说明,参照附图对本发明的实施方式进行说明。
实施方式I
图1所示的发音信息生成装置将字`符串用于输入,并生成与该输入字符串相对应的发音信息,包括单词串信息数据库(`以下称为DB)存储部1、单词串信息检索部2、发音信息生成判定部3、发音信息生成部4以及发音信息输出部5。
[0015]单词串信息DB存储部I是存储装置,其存储有将书写信息与发音信息成组来作为单词串信息进行登记的DB(下面,称为单词串信息DBla),其中书写信息表示单词串的书写,发音信息以文字及符号来表不该书写的正式的声音。
图2是表示单词串信息DBla的一个示例的图。当根据单词串的书写信息、利用G2P转换等自动生成的发音信息与从发音字典以及地图DB等人工整备的DB取得的发音信息(下面,称为正式的发音信息)不一致时,与书写信息成组地登记正式的发音信息。
另一方面,当利用G2P转换等自动生成的发音信息与该单词串的正式的发音信息一致时,仅在单词串?目息DBla中登记书写彳目息。
另外,关于单词串信息DBla的生成方法将在后面阐述。
[0016]例如,纽约州的城市“ALDER BR00K”的正式的发音信息是《*”01 I d@r”brUk》,而利用G2P转换等自动生成的结果为《*”01 I d@r”krik》。在该情况下,登记正式的发音信息《*”01 I d@r”brUk》,以作为与书写信息“ALDER BR00K”成组的发音信息。
另一方面,纽约州的城市“ALDER BEND”的正式的发音信息是《*”01 I d@r”bEnd》,而利用G2P转换等自动生成的结果为《*”01 I dir"bEnd))0在该情况下,能通过自动生成获得正式的发音信息,因此作为与书写信息“ALDER BEND”成组的发音信息,不登记任何发音信息。
[0017]此外,例如,书写信息“HERVEY STREET”能通过自动生成获得正式的发音信息,因此单词串信息DBla中未登记发音信息,另一方面,书写信息“QUAKER STREET”不能通过自动生成获得正式的发音信息,因此在单词串信息DBla中登记正式的发音信息《*”kwe I k@r,,strit〉〉。
另外,为了方便说明,适当地假设例示的各单词串是否能通过G2P转换等自动生成正式的发音信息,有可能与实际通过G2P转换自动生成的发音信息不同。
[0018]另外,单词串信息DBla中登记的单词串并不限于如上所述的地名,住址名称、设施名称、人名、公司名称等,与发音信息的使用目的相对应的单词串即可。
[0019]单词串信息检索部2将发音信息的生成对象即输入字符串用作检索关键字对单词串信息DB存储部I的单词串信息DBla进行检索,从而取得具有与该检索关键字相一致的信息的单词串信息。该输入字符串的单词串的书写信息设为(“ALDER BR00K”等)。
[0020]发音信息生成判定部3调查由单词串信息检索部2取得的单词串信息中是否存储有正式的发音信息,并利用后级的发音信息生成部4来判定是否自动生成发音信息。在判定为需要自动生成发音信息的情况下,将相对应的单词串信息从发音信息生成判定部3输出至发音信息生成部4。另一方面,在判定为不需要自动生成发音信息的情况下,将相对应的单词串信息从发音信息生成判定部3输出至发音信息输出部5。
[0021]在由发音信息生成判定部3判定为需要自动生成发音信息的情况下,发音信息生成部4从发音信息生成判定部3接受单词串信息,并通过G2P转换等规定的方法自动生成与该单词串的书写信息相对应的发音信息。
[0022]在由发音信息生成判定部3判定为需要自动生成发音信息的情况下,发音信息输出部5接受发音信息生成部4自动生成的发音信息,并进行外部输出。另一方面,在判定为不需要自动生成的情况下,发音信息输出部5经由单词串信息检索部2以及发音信息生成判定部3,接受登记于单词串信息DBla中的正式的发音信息,并进行外部输出。
[0023]另外,单词串信息DB存储部I也可以存储有图3所示的单词串信息DBlb以代替图2所示的单词串信息DBla。如图3所示,单词串信息DBlb中作为单词串信息登记有书写信息以及发音信息,除此以外还成组地登记有单词串固有的识别信息(下面称为ID)以及表示有无发音信息的标记(True (真)或者False (假))。
在单词串信息DBlb的情况下,输入至单词串信息检索部2的输入字符串例如可以是单词串的书写信息(“ALDER BR00K”等),也可以是单词串固有的ID (“I”等)。然后,单词串信息检索部2根据输入字符串的种类(书写信息或者ID ),来变更单词串信息DBlb的检索范围(书写信息或者ID)即可。
[0024]接着,利用图4所示的流程图,对发音信息生成装置的动作进行说明。
首先,在步骤STl中,将发音信息的生成对象即输入字符串输入至单词串信息检索部2,单词串信息检索部2将该输入字符串用作检索关键字对单词串信息DBla进行检索,检索与检索关键字相一致的单词串信息。
[0025]接着,在步骤ST2中,若单词串信息检索部2未找到与检索关键字一致的单词串信息(步骤ST2为“否”),则结束一连串的发音信息生成处理。此时,例如发音信息输出部5也可以将表示该单词串未登记在单词串信息DBla中这一情况进行外部输出。
另一方面,若找到一致的单词串信息(步骤ST2为“是”),则单词串信息检索部2取得该单词串信息,并前进至下一个步骤ST3。
例如,在单词串信息DB存储部I存储有图2所示的单词串信息DBla或者图3所示的单词串信息DBlb的任一种的情况下,若输入输入字符串“ALDER BROOK",则单词串信息检索部2将该输入字符串用作书写信息的检索关键字,从单词串信息DBla或者单词串信息DBlb取得包含书写信息“ALDER BROOK”以及成组的发音信息《*” 01 I d@r”brUk》的单词
串信息。
此外,例如,在单词串信息DB存储部I存储有图3所示的单词串信息DBlb的情况下,作为输入字符串输入了“I”,则单词串信息检索部2将该输入字符串用作ID的检索关键字,从图3所示的单词串信息DBlb取得包含ID “I”、以及成组的书写信息“ALDER BR00K”、发音信息《*”01 I d@r”brUk》4^a“Ture (真)”的单词串信息。
[0026]接着,在步骤ST3中,发音信息生成判定部3检查从单词串信息检索部2输入的单词串信息中是否包含发音信息,若包含(步骤ST3为“是”),则判定为无需利用发音信息生成部4自动生成单词串的发音信息,并前进至步骤ST6,若不包含(步骤ST3为“否”),则判定为需要利用发音信息生成部4自动生成单词串的发音信息,并前进至步骤ST4。
另外,在单词串信息中包含表示有无发音信息的标记的情况下,发音信息生成判定部3可检查该标记来判定自动生成的必要性。
[0027]在由发音信息生成判定部3判定为需要自动生成单词串的发音信息的情况下(步骤ST3为“否”),接着在步骤ST4中,发音信息生成部4根据由单词串信息检索部2所获得的单词串信息中包含的显示信息,通过G2P转换等,生成该单词串的发音信息并输出至发音信息输出部5。接着,在步骤ST5中,发音信息输出部5对由发音信息生成部4自动生成的发音信息进行外部输出。
另一方面,在由发音信息生成判定部3判定为无需自动生成单词串的发音信息的情况下(步骤ST3为“是”),接着在步骤ST6中,发音信息输出部5对包含在由发音信息生成部4获得的单词串信息中的发音信息`进行外部输出。另外,在判定为无需自动生成发音信息的情况下,发音信息输出部5也可以从单词串信息DBla取得发音信息。
[0028]接下来,对存储在单词串信息DB存储部I中的单词串信息DBla的生成方法进行说明。
图5是表示生成单词串信息DBla的DB生成装置的结构的框图。图5所示的DB生成装置是生成单词串信息DBla的装置,该单词串信息DBla登记了包含于输入数据中的单词串信息,该装置包括单词串信息取得部6、发音信息生成部4、发音信息比较部7、单词串信息登记部8。另外,作为前提,设为DB生成装置所具有的发音信息生成部4的发音信息生成方法与图1所示的发音信息生成装置所具有的发音信息生成部4的方法(G2P转换等)相同。此外,输入到DB生成装置的输入数据例如在将图1所示的发音信息生成装置应用于导航装置的情况下,是表示地图DB中所包含的地名等书写信息与正式的发音信息成组的单词串信息。
[0029]单词串信息取得部6从输入数据取得未处理的单词串信息。
发音信息生成部4根据由单词串信息取得部6取得的单词串信息中包含的书写信息,利用G2P转换等规定的方法,自动生成发音信息。
发音信息比较部7将由单词串信息取得部6取得的单词串信息中包含的正式的发音信息与由发音信息生成部4自动生成的发音信息进行比较,来判定两者是否一致。
在判定为由发音信息生成部4自动生成的发音信息与正式的发音信息一致的情况下,单词串信息登记部8仅将包含在单词串信息中的书写信息登记到单词串信息DBla,而不登记发音信息。另一方面,在判定为发音信息不一致的情况下,将经由单词串信息取得部6、发音信息生成部4以及发音信息比较部7接受的、输入数据中的单词串信息中包含的书写信息与正式的发音信息成组地登记到单词串信息DBla中。因此,登记有图2所示的单词串信息的DB被生成以作为单词串信息DBla。
[0030]接着,利用图6所示的流程图,对DB生成装置的动作进行说明。
首先,在步骤STl I中,若作为单词串信息DBla的登记对象的输入数据被输入至单词串信息取得部6,则在存在未处理的单词串信息的情况下(步骤STll为“是”),单词串信息取得部6取得该单词串信息并输出至发音信息生成部4以及发音信息比较部7 (步骤ST12)。另一方面,在不存在未处理的单词串信息的情况下(步骤STll为“否”),结束DB生成处理。
[0031]在步骤ST13中,发音信息生成部4根据由单词串信息取得部6取得的单词串信息所包含的书写信息,利用G2P转换等,自动生成该单词串的发音信息,并输出至发音信息比较部7。接着,在步骤ST14中,发音信息比较部7将由发音信息生成部4自动生成的发音信息与由单词串信息取得部6所取得的、同一个单词串的单词串信息中包含的正式的发音信息进行比较,来判定两者是否一致,并将判定结果输出至单词串信息登记部8。
另外,在单词串由多个单词构成的情况下,发音信息比较部7仅在所有的单词发音信息均一致的情况下判定为一致。例如,对于书写信息“ALDER BR00K”,在从输入数据取得的发音信息为《*”01 |d@r”brUk》、而自动生成的发音信息为《*”01 |d@r”krik》的情况下,由于单词“ALDER”的发音信息一致,但单词“BR00K”的发音信息不一致,因此发音信息比较部7判定为作为整个单词串不一致。
[0032]在发音信息比较部7判定为两者一致的情况下(步骤ST14为“是”),接着在步骤ST15中,单词串信息登记部8将由单词串信息取得部6取得的单词串信息所包含的书写信息登记到单词串信息DBla,不登记发音信息。
另一方面,在发音信息比较部7判定为两者不一致的情况下(步骤ST14为“否”),接着在步骤ST16中,单词串信息登记部8将由单词串信息取得部6取得的单词串信息所包含的书写信息与正式的发音信息成组地登记到单词串信息DBla。
[0033]在DB生成装置中,若登记对象的单词串信息的处理在步骤ST15或者ST16为止结束,则再次返回到步骤ST11,开始对输入数据的下一个单词串信息进行处理。
[0034]另外,DB生成装置所生成的DB除了图2所示的单词串信息DBla那样的结构以外,也可以是图3所示的单词串信息DBlb那样的结构。在该情况下,在图6的步骤ST116中,单词串信息登记部8将单词串信息登记到单词串信息DBla中时,也登记该单词串固有的ID以及表示有无发音信息的标记。
[0035]如上所述,根据实施方式1,发音信息生装置包括:单词串信息DB存储部1,该单词串信息DB存储部I存储有单词串信息DBla,在根据单词串的书写信息并利用G2P转换等规定的方法自动生成的发音信息与该单词串的书写所对应的正式的发音信息不一致的情况下,该单词串信息DBla —并登记书写信息与正式的发音信息,在一致的情况下,该单词串信息DBla仅登记书写信息;单词串信息检索部2,该单词串信息检索部2从单词串信息DBla取得包含与该输入字符串相应的书写信息的单词串信息;发音信息生成判定部3,该发音信息生成判定部3判定与单词串信息检索部2所取得的书写信息相对应的正式的发音信息和与从单词串信息DBla取得的书写信息相对应的正式的发音信息是否登记在单词串信息DBla中;发音信息生成部4,该发音信息生成部4根据发音信息生成判定部3的判定结果,从未登记正式的发音信息的书写信息利用G2P转换等规定的方法,来生成发音信息;以及发音信息输出部5,该发音信息输出部5根据发音信息生成判定部3的判定结果,在对于书写信息未登记正式的发音信息的情况下,输出发音信息生成部4生成的发音信息,在登记了正式的发音信息的情况下,输出登记于单词串信息DBla中的该正式的发音信息。因此,在预先判明根据单词串的书写信息自动生成的发音信息与该单词串正式的发音信息一致的情况下,由于无需将发音信息登记到单词串信息DBla,由此,能相应减小单词串信息DBla的容量。另一方面,在预先判明根据单词串的书写信息自动生成的发音信息与该单词串正式的发音信息不一致的情况下,在单词串信息DBla中存储正式的发音信息,在发音信息生成处理过程中不进行自动生成,而是使用存储的正式的发音信息,因此能防止生成错误的发音信息。因此,能利用小容量的数据库来生成正确的发音信息。
[0036]另外,在上述实施方式I中,DB生成装置在单词串信息DBla、lb中以单词串单位(“ALDER BR00K”等)来登记书写信息与发音信息,但并不限于此,也可以以单词单位(“ALDER”等)来登记书写信息与发音信息(B卩,单词信息DB)。并且,在发音信息生成装置中,单词串信息DB存储部I存储了单词单位的单词串信息DBlaUb情况下,单词串信息检索部2、发音信息生成判定部3、发音信息生成部4以及发音信息输出部5以单词单位进行处理即可。
此外,图示例中示出了由两个单词构成的单词串,也可以是由三个以上的单词构成的单词串,或者可以不是单词串而是单词。
[0037]另外,在发音信息生成装置由计算机构成的情况下,可以是如下结构:计算机的存储器中存储有描述了单词串信息DBla、单词串信息检索部2、发音信息生成判定部3、发音信息生成部4、发音信息输出部5的处理内容的程序,计算机的CPU执行存储于存储器中的程序。
同样地,在DB生成装置由计算机构成的情况下,可以是如下结构:计算机的存储器中存储有描述了发音信息生成部4、单词串信息取得部6、发音信息比较部7、单词串信息登记部8的处理内容的程序,计算机的CPU执行存储于存储器中的程序。
[0038]实施方式2.图7是表示本实施方式2所涉及的DB生成装置的结构的框图。该DB生成装置新包括了对单词串信息DB中的单词串的出现频度进行计算的出现频度计算部9,单词串信息登记部8根据出现频度来判定是否登记单词串,并考虑出现频度来生成单词串信息DBlc。除此以外,对于图7中与图5相同或相当的部分,标注相同的标号,并省略说明。
此外,使用本实施方式2所涉及的DB生成装置所生成的单词串信息DBlc的发音信息生成装置与图1所示的发音信息生成装置结构相同,因此引用图1。
[0039]在上述实施方式I中,在由发音信息生成部4自动生成的发音信息与正式的发音信息一致的情况下,单词串信息DBla、Ib中未登记正式的发音信息,但在本实施方式2中,即使在两者一致的情况下,若该单词串的出现频度在指定的阀值以上时,则预先将正式的发音信息登记到单词串信息DBlc。
此处所谓的出现频度是指单词串信息DB I c中的出现频度,但由于DB生成时DB中的出现频度不明,因此等效地使用生成单词串信息DB的原始数据、即输入数据(发音词典、地图DB等)中的出现频度。例如,在利用发音信息生成装置生成的发音信息来进行声音合成以及声音识别处理的导航装置中,认为地图DB中出现频度较高的单词串的发音信息在导航动作中被频繁地使用。因此,预先在单词串信息DB中登记使用频度较高的发音信息,在使用时,发音信息生成装置不进行自动生成也行,从而缩短发音信息生成处理时间。
此外,若出现频度的阀值较小,则存在单词串信息DBlc的数据量增加而发音信息生成处理时间缩短的趋势,若阀值较大,则存在单词串信息DBlc的数据量减小而发音信息生成处理时间增长的趋势。因此,兼顾单词串信息DBlc的数据量与发音信息生成处理时间,相对应地设定阀值即可。
[0040]图8是表示实施方式2的DB生成装置生成的单词列信息DBlc的一个示例的图。 图2所示的单词串信息DBla中,书写信息“ALDER BEND”以及“HERVEY STREET”能自
动生成正式的发音信息,因此未登记发音信息,但在图8所示的单词串信息DBlc中,由于其中的书写信息“ALDER BEND”的出现频度在阀值以上,因此登记有正式的发音信息。
[0041]接着,利用图9所示的流程图,对DB生成装置的动作进行说明。另外,图9所示的步骤ST21?ST24是与上述实施方式I的图6中说明的步骤STll?ST14相同的处理,因此省略说明。
在判定为由发音信息生成部4自动生成的发音信息与由单词串信息取得部6所取得的正式的发音信息不一致的情况下(步骤ST24为“否”),接着在步骤ST25中,单词串信息登记部8c将由单词串信息取得部6所取得的正式的发音信息与其书写信息成组地登记到单词串信息DBlc中。
[0042]另一方面,在判定为两者一致的情况下(步骤ST24为“是”),接着在步骤ST26中,出现频度计算部9计算出该发音信息的单词串在输入数据中的出现频度,并输出至单词串信息登记部8c,单词串信息登记部Sc将该出现频度与规定的阀值进行比较。当出现频度在阀值以上时(步骤ST26为“是”),单词串信息登记部Sc将由单词串信息取得部6所取得的正式的发音信息与其书写信息成组地登记到单词串信息DBlc中(步骤ST25)。另一方面,当出现频度小于阀值时(步骤ST26为“否”),单词串信息登记部Sc仅将由单词串信息取得部6所取得的书写信息登记到单词串信息DBlc中(步骤ST27)。
[0043]另外,在单词串信息DBlc构成为登记有单词串固有ID以及表示有无发音信息的标记的情况下,单词串信息登记部8c在将单词串信息登记到单词串信息DBlc时,也可以登记该单词串固有ID以及表示有无发音信息的标记(步骤ST26、27)。
此外,图9的流程图在步骤ST26中出现频度计算部9计算出现频度,但计算时刻并不限于此,例如也可以在步骤ST21的处理开始前计算输入数据的各单词串的出现频度。
[0044]如上所述,根据实施方式2,发音信息生成装置的单词串信息DB存储部I所存储的单词串信息DBlc在根据单词串的书写信息自动生成的发音信息与该单词串的正式的发音信息不一致的情况下,一并登记有书写信息与正式的发音信息,在一致的情况下且单词串信息DBlc中该单词串的出现频度在规定的阀值以上时,也一并登记有书写信息与正式的发音信息,另一方面,在一致的情况且出现频度小于阀值时,仅登记书写信息。因此,通过恰当地设定出现频度的阀值,能兼顾到数据库容量的减少以及发音信息生成处理时间的缩短。[0045]另外,在上述实施方式2中,DB生成装置在单词串信息DBlc中以单词串单位(“ALDER BR00K”等)来登记书写信息与发音信息,但并不限于此,也可以以单词单位(“ALDER”等)来登记书写信息与发音信息。然后,DB生成装置的出现频度计算部9以单词单位来计算出现频度,并且单词串信息取得部6、发音信息生成部4、发音信息比较部7以及单词串信息登记部8c以单词单位进行处理即可。并且,在发音信息生成装置中,单词串信息DB存储部I存储了单词单位的单词串信息DBlc情况下,单词串信息检索部2、发音信息生成判定部3、发音信息生成部4以及发音信息输出部5以单词单位进行处理即可。
此外,图示例中示出了由两个单词构成的单词串,也可以是由三个以上的单词构成的单词串,或者可以不是单词串而是单词。
[0046]实施方式3.本实施方式3所涉及的发音信息生成装置的结构与图1的发音信息生成装置在图上是大致相同的结构,因此引用图1来进行说明。
[0047]图10是表示本实施方式3的发音信息生成装置中的、单词串信息DB存储部I所存储的单词串信息DBld以及发音信息列表IOd的一个示例的图。单词串信息DBld成组地登记有单词串的书写信息以及位置信息,该位置信息为存储与该书写信息相对应的发音信息的发音信息列表IOd内的位置信息。该位置信息以单词单位来登记。此外,发音信息列表IOd中与位置信息成组地登记有从发音词典、地图DB等由人工配备的DB取得的正式的发音信息。在根据单词的书写信息并利用G2P转换等自动生成的发音信息与正式的发音信息不一致的情况下,该单词的正式的发音信息与位置信息成组地登记到发音信息列表IOd中,单词串信息DBld中成组地登记有书写信息与位置信息。
另一方面,当利用G2P转换等自动生成的发音信息与该单词列的正式的发音信息一致时,不登记发音信息的位置信息。
另外,关于单词串信息DBld以及发音信息列表IOd的生成方法在后面阐述。
[0048]例如,单词串“ALDER BR00K”由单词“ALDER”与“BROOK”构成,根据“ALDER”自动生成的发音信息《*”011 d@r》与正式的发音信息一致,因此位置信息成为“(空字符串)”。另一方面,根据“BR00K”自动生成的发音信息《” krik》与正式的发音信息《”brUk》不同,因此位置信息成为“I”。因此,单词串信息DBld中作为书写信息“ALDER BR00K”的发音信息的位置信息登记有“(空字符串)/I”。
另外,在本例中,书写信息的单词单位的划分符号为“(空字符串)”,位置信息的划分符号为“/”。于是,单词串信息DBld中的“I”是单词“BR00K”的正式的发音信息的位置信息,该位置信息所表示的发音信息列表IOd的位置处,登记有“BR00K”的正式的发音信息即(("brUk)) 0
[0049]此外,例如单词串“ ALDER BEND ”能利用自动生成一并获得单词“ ALDER”以及“BEND”的正式的发音信息,因此作为与书写信息“ALDER BEND”成组的发音信息的位置信息不登记任何信息(即“(空字符串)/ (空字符串)”)。
[0050]此夕卜,例如,单词串“HERVEY STREET”中,“HERVEY”能利用自动生成获得正式的发音信息,但“STREET”不能获得,因此仅登记书写信息“STREET”的发音信息的位置信息。因此,单词串信息DBld中作为位置信息登记有“(空字符串)/2”。于是,发音信息列表IOd中,在“2”的位置处登记了书写信息“STREET”的正式的发音信息《” strit》。 另一方面,对于单词串“QUAKER STREET”,无法自动生成“QUAKER”以及“STREET”的正式的发音信息,因此登记各自的发音信息的位置信息。其中,“STREET”的正式的发音信息《”strit》已经登记在发音信息列表IOd的“2”的位置,因此单词串信息DBld中作为位置信息登记有“3/2”。另一方面,发音信息列表IOd中,在“3”的位置处登记了书写信息“QUAKER”的正式的发音信息《*” kwe I kirh
因此,对于像“STREET”这样相同的书写的正式的发音信息无需重复登记到发音信息列表IOd中,因此,能减少预先存储发音信息列表IOd的单词串信息DB存储部I的容量。
另外,为了方便说明,适当地假设例示的各单词是否能通过G2P转换等来自动生成正式的发音信息,有可能与实际通过G2P转换自动生成的发音信息不同。
[0051]另外,与上述实施方式I的图1不同,本实施方式3所涉及的发音信息生成装置中发音信息输出部5能参照单词串信息DB存储部I的发音信息列表10d。
[0052]接着,使用图11所示的流程图,对利用单词串信息DBld以及发音信息列表IOd的发音信息生成装置的动作进行说明。另外,图11所示的步骤ST31、ST32是与上述实施方式I的图4中说明的步骤ST1、ST2相同的处理,因此省略说明。
当与检索关键字一致的单词串信息不存在于单词串信息DB存储部I所存储的单词串信息DBld中时(步骤ST32为“否”),结束一连串的发音信息生成处理。此时,例如发音信息输出部5也可以将表示该单词串未登记在单词串信息DBld中这一情况进行外部输出。
[0053]另一方面,当与检索关键字一致的单词串信息存在于单词串信息DBld中时(步骤ST32为“是”),单词串信息检索部2从单词串信息DBld取得包含与检索关键字一致的书写信息以及发音信息的位置信息的单词串信息,并输出至发音信息生成判定部3。
例如,在单词串信息DB存储部I存储有图10所示的单词串信息DBld与发音信息列表IOd的情况下,若输入输入字符串“ALDER BR00K”,则单词串信息检索部2将该字符串用作书写息的检索关键字,从单词串息DBld取得单词串信息,该单词串信息包含书写信息"ALDER BR00K”、以及与书写信息成组的发音信息的位置信息“(空字符串)/I”。
[0054]接下来,在步骤ST33?ST38中,对于构成单词串信息检索部2所取得的单词串的各个单词,生成发音信息并进行外部输出。
首先,在步骤ST33中,发音信息生成判定部3检查关于构成从单词串信息检索部2输入的单词串信息的所有单词是否存在发音信息,在所有单词的发音信息均存在的情况或者已完成生成的情况下(步骤ST33为“是”),判断为不再需要生成发音信息,从而结束一连串的发音信息生成处理,若在上述以外的情况下(步骤ST33为“否”),则从单词串的首个单词开始按照顺序来判定是否需要生成各个单词的发音信息(步骤ST34)。具体而言,调查与作为处理对象的单词的书写信息相对应的位置信息是否包含在单词串信息中。
[0055]在与处理对象的单词的书写信息相对应的位置信息未包含在单词串信息中的情况下,发音信息生成判定部3判定为需要自动生成关于该单词的发音信息(步骤ST34为“否”),并将该单词的书写信息输出至发音信息生成部4。接着,在步骤ST35中,发音信息生成部4根据从发音信息生成判定部3输入的书写信息并利用G2P转换等,生成发音信息并输出至发音信息输出部5。接着,在步骤ST365中,发音信息输出部5对由发音信息生成部4自动生成的发音信息进行外部输出。
在上述“ALDER BR00K”的示例的情况下,在步骤ST33?ST38的重复处理的第一次中,与首个单词的书写信息“ALDER”相对应的发音信息的位置信息为“(空字符串)”,表示发音信息列表IOd中未登记正式的发音信息。因此,发音信息生成部4根据书写信息“ALDER”自动生成与正式的发音信息相同的发音信息《*” Ol I dir)),发音信息输出部5进行外部输出。
[0056]另一方面,在与处理对象的单词的书写信息相对应的位置信息包含在单词串信息中的情况下,发音信息生成判定部3判定为无需自动生成关于该单词的发音信息(步骤ST34为“是”),并将该单词的发音信息的位置信息输出至发音信息输出部5。接着,在步骤ST37中,发音信息输出部5基于从发音信息生成判定部3输入的发音信息的位置信息,从单词串信息DB存储部I的发音信息列表IOd取得该位置处所登记的发音信息。于是,发音信息输出部5在接下来的步骤ST38中,将从发音信息列表IOd取得的发音信息进行外部输出。
在上述“ALDER BR00K”的示例的情况下,在步骤ST33?ST38的重复处理的第二次中,与从头开始的第二个单词的书写信息“BR00K”相对应的发音信息的位置信息为“1”,表示发音信息列表IOd的位置“I”中登记了正式的发音信息《”brUk》。因此,发音信息输出部5从发音信息列表IOd取得发音信息《” brUk》,并进行外部输出。
[0057]若到步骤ST36或者步骤ST38为止处理结束,则再次返回到步骤ST33,开始对单词串信息中包含的下一个单词进行处理。由此,发音信息生成装置从与输入字符串相应的单词串的首个单词开始按顺序对发音信息进行外部输出。
另外,也可以不以单词单位来对发音信息进行外部输出,而是以单词串单位来进行外部输出。在该情况下,发音信息输出部5以输入的顺序来组合从发音信息生成判定部3输入的单词的发音信息与从发音信息生成部4输入的单词的发音信息,从而生成单词串的发音信息即可。
[0058]此外,图11的流程图中,单词串信息检索部2从单词串信息DBld取得书写信息与发音信息的位置信息,并将该位置信息通知给发音信息输出部5,发音信息输出部5从发音信息列表IOd取得与该位置信息相对应的发音信息,但并不限于此,也可以单词串信息检索部2从单词串信息DBld取得书写信息与发音信息的位置信息的同时,从发音信息列表IOd取得与该位置信息相对应的发音信息,发音信息生成部4经由发音信息生成判定部3从单词串信息检索部2获取发音信息。
[0059]此外,单词串信息DB存储部I也可以存储有图12所示的单词串信息DBle以及发音信息列表IOe以代替图10所示的单词串信息DBld以及发音信息列表10d。如图12所示,发音信息列表IOe仅预先登记了各单词串中重复出现的单词(“STREET”等)的正式的发音信息。此外,单词串信息DBle中登记了各单词串中重复的单词(“STREET”等)的书写信息与成组的发音信息的位置信息(“ I ”等),直接登记不重复单词(“BR00K”等)的书写信息与成组的正式的发音信息(《”brUk》等),对于不重复的单词且能利用G2P转换等自动生成与正式的发音信息相同的发音信息的单词(“ALDER”等)的书写信息,不登记发音信息(即“(空字符串)”。
[0060]接着,对DB生成装置的动作进行说明。本实施方式3所涉及的DB生成装置的结构除了单词串信息DBla以外与图5的DB生成装置在图上是大致相同的结构,因此,引用图5进行说明。本实施方式3所涉及的DB生成装置生成单词串信息DBld以及发音信息列表IOd以代替单词串信息DBla。 该DB生成装置与上述实施方式I的图6所示的流程图为大致相同的动作。其中,上述实施方式I的DB生成装置以单词串单位来进行发音信息的生成以及登记到DB,但实施方式3的DB生成装置以单词单位来进行发音信息的生成以及登记到DB。此外,在图6的步骤ST16中,单词串信息登记部8对于无法自动生成正式的发音信息的单词,将从输入数据获取的正式的发音信息登记到发音信息列表10d,并将该单词的书写信息与发音信息的位置信息登记到单词串信息DBld。
另一方面,在生成图12所示的单词串信息DBle与发音信息列表IOe的情况下,在步骤ST16中、单词串信息登记部8在发音信息列表IOe中登记发音信息时,确认是否已经登记了相同的发音信息,若已登记,则在单词串信息DBle中登记该发音信息的位置信息。若发音信息列表IOe中未登记相同的发音信息,贝U在发音信息列表IOe中登记该单词的正式的发音信息,在单词串信息DBle中登记书写信息与位置信息。
[0061]如上所述,根据实施方式3,发音信息生成装置的单词串信息DB存储部I包括发音信息列表IOd,该发音信息列表IOd对于根据书写信息自动生成的发音信息与正式的发音信息不一致的单词,登记有该单词的正式的发音信息,单词串信息DBld中一并登记了表示在发音信息列表IOd内的该单词的正式的发音信息的登记位置的位置信息以及书写信息,由该位置信息代替正式的发音信息,单词串信息检索部2从单词串信息DBld获取与输入字符串一致的书写信息,发音信息生成判定部3判定与单词串信息检索部2所取得的书写信息相对应的位置信息是否登记在单词串信息DBld中,发音信息生成部4根据发音信息生成判定部3的判定结果,根据未登记位置信息的书写信息并利用G2P转换等规定的方法生成发音信息,发音信息输出部5根据发音信息生成判定部3的判定结果,在未登记与书写信息相对应的位置信息的情况下,输出发音信息生成部4生成的发音信息,在登记了与书写信息相对应的位置信息的情况下,输出发音信息列表IOd中的该位置信息所指位置中登记的正式的发音信息。因此,发音信息列表IOd不会多次重复登记相同的发音信息,从而能减少单词串信息DB存储部I存储的信息量。
[0062]另外,在上述实施方式3中,DB生成装置在单词串信息DBlcUle中以单词单位(“ALDER”等)登记书写信息与发音信息的位置信息,但并不限于此,也可以以单词串单位(“ALDER BR00K”等)登记书写信息与发音信息的位置信息。在发音信息生成装置中,单词串信息DB存储部I存储了单词串单位的单词串信息DBlcUle情况下,单词串信息检索部2、发音信息生成判定部3、发音信息生成部4以及发音信息输出部5以单词串单位进行处理即可。
此外,图示例中示出了由两个单词构成的单词串,也可以是由三个以上的单词构成的单词串,或者可以不是单词串而是单词。
[0063]并且,在如单词串“ALDER BROOK ROAD”以及“ALDER BROOK PARK”那样可视作是单词串“ALDER BR00K”与单词“R0AD (或者PARK)”的组合情况下,能在单词串信息DBld、Ie中混合登记单词串与单词。
在该情况下,输入至DB生成装置的输入数据以及输入至发音信息生成装置的输入字符串中预先定义有用于划分单词的划分符号(例如“(空字符串)”)与表示划分登记单位的划分符号(例如“/”)。然后,在各装置中根据划分符号来使“ALDER BR00K/R0AD”等单词串划分为单词串与单词,并对各个进行处理即可。 另一方面,即使在输入至DB生成装置的输入数据中能预先定义了多种划分符号,也可能对于输入至发音信息生成装置的输入字符串不能预先定义多种划分符号。在该情况下,DB生成装置根据如上所述的多种划分符号来生成单词串与单词处于混合状态的单词串信息DBlcUle即可。另一方面,发音信息生成装置中,单词串信息检索部2仅根据用于划分单词的划分符号(例如“(空字符串)”),例如首先从单词串信息DBlcUle中检索“ALDER BROOKR0AD”,在未登记的情况下,接下来分为“ALDER BR00K”与“ROAD”来进行检索。若它们也未登记,则还有如下方法:改变划分位置,分为“ALDER”与“BROOK ROAD”来进行检索等,对于一个单词串利用多个划分位置来划分并进行检索。
[0064]实施方式4.本实施方式4所涉及的DB生成装置的结构除了单词串信息DBlc以外与图7的DB生成装置在图上是大致相同的结构,因此,引用图7进行说明。本实施方式4所涉及的DB生成装置生成图13所示的单词串信息DBlf以及发音信息列表IOf以代替单词串信息DBlc。
此外,本实施方式4所涉及的使用DB生成装置所生成的单词串信息DBlf以及发音信息列表IOf的发音信息生成装置与图1所示的发音信息生成装置结构相同,因此引用图1。
[0065]在上述实施方式3中,在由发音信息生成部4自动生成的发音信息与正式的发音信息一致的情况下,单词串信息DBld、Ie中未登记正式的发音信息,但在本实施方式4中,即使在两者一致的情况下,若该单词串的出现频度在指定的阀值以上,则预先将正式的发音信息登记到单词串信息DBlf。
[0066]图13是表示本发明的实施方式4所涉及的DB生成装置生成的单词串信息DBlf以及发音信息列表IOf的一个不例的图。
书写信息“ALDER”能自动生成正式的发音信息,但出现频度计算部9计算出的出现频度在规定的阀值以上,因此,图13所示的单词串信息DBlf中登记有发音信息的位置信息“I”。并且,发音信息列表IOf的位置“I”中登记了正式的发音信息《*”01 |d@r》。
与此相对,在上述实施方式3中,图10所示的单词串信息DBld中未登记书写信息“ALDER”的发音信息的位置信息。
关于其他的单词,即使能自动生成发音信息,但由于出现频度小于阀值,因此与图10所示的单词串信息DBld相同。其中,发音信息列表IOf的位置“I”中登记了《*”011 d@r》,因此之后的位置位移一位。
[0067]接着,对DB生成装置的动作进行说明。另外,该DB生成装置与上述实施方式2的图9所示的流程图为大致相同的动作。其中,上述实施方式2的DB生成装置以单词串单位来进行发音信息的生成以及登记到DB,但实施方式4的DB生成装以单词单位来进行发音信息的生成以及登记到DB。此外,在图9的步骤ST25中,单词串信息登记部Sc对于无法自动生成正式的发音信息的单词或能自动生成正式的发音信息但出现频度在阀值以上的单词,将从输入数据获取的正式的发音信息登记到发音信息列表IOf,并将该单词的书写信息与发音信息的位置信息登记到单词串信息DBlf。
[0068]如上所述,根据实施方式4,发音信息生成装置的单词串信息DB存储部I包括发音信息列表IOf,该发音信息列表IOf对于根据书写信息自动生成的发音信息与正式的发音信息不一致的单词,登记有该单词的正式的发音信息,单词串信息DBlf在根据单词的书写信息自动生成的发音信息与该单词的正式的发音信息不一致的情况下,一并登记了书写信息以及表示在发音信息列表IOf内的该单词的正式的发音信息的登记位置的位置信息,在一致的情况下且当单词串信息DBlf中该单词的出现频度在规定的阀值以上时,也一并登记书写信息与位置信息,另一方面,在一致的情况下而当该单词的出现频度小于阀值时,仅登记书写信息。因此,与上述实施方式3相同,发音信息列表IOf不会多次重复登记相同的发音信息,从而能减少单词串信息DB存储部I存储的信息量。此外,与上述实施方式2相同,通过恰当地设定出现频度的阀值,能兼顾单词串信息DB存储部I存储的信息量的减小以及发音信息生成处理时间的缩短。
[0069]另外,在上述实施方式4中,DB生成装置在单词串信息DBlf中以单词单位(“ALDER “等)登记书写信息与发音信息的位置信息,但并不限于此,也可以以单词串单位(“ALDER BR00K”等)登记书写信息与发音信息。然后,DB生成装置的出现频度计算部9以单词单位来计算出现频度,并单词串信息取得部6、发音信息生成部4、发音信息比较部7以及单词串信息登记部Sc以单词串单位进行处理即可。并且,在发音信息生成装置中,单词串信息DB存储部I中存储了单词串单位的单词串信息DBlf情况下,单词串信息检索部2、发音信息生成判定部3、发音信息生成部4以及发音信息输出部5以单词串单位进行处理即可。
此外,图示例中示出了由两个单词构成的单词串,也可以是由三个以上的单词构成的单词串,或者可以不是单词串而是单词。
并且,对于像“ALDER BROOK ROAD”以及“ALDERB ROOK PARK”那样单词串与单词混合的单词串信息,与上述实施方式3所说明的情况相同地,可以将单词串与单词混合登记到单词串信息DB If。
[0070]实施方式5.图14是表示本发明的实施方式5所涉及的导航装置的结构的框图。该导航装置包括:发音信息生成装置100,该发音信息生成装置100生成声音合成以及声音识别中使用的发音信息;地图DB101,该地图DBlOl存储有包含地名、道路名称、设施名称以及各个位置的地图信息;导航控制部102,该导航控制部102利用地图信息来进行路径搜索以及路径引导等;声音合成部103,该声音合成部103对进行路径引导的声音进行合成;输出合成声音的扬声器104 ;对用户发出的声音进行集声的麦克风105 ;声音识别部106,该声音识别部106利用声音识别词典107进行目的地等的声音识别;以及声音识别词典生成部108,该声音识别词典生成部108根据发音信息生成装置100的发音信息生成声音识别词典107。
[0071]发音信息生成装置100是上述实施方式I?4中说明的发音信息生成装置。此处,以实施方式I所涉及的发音信息生成装置为例来说明发音信息生成装置100,并引用图1。发音信息生成装置100的单词串信息DB存储部I存储了从地图DBlOl中所存放的地名,设施名称等单词串或单词生成的单词串信息DB。
声音识别词典生成部108利用发音信息生成装置100输出的发音信息来生成声音识别用的声音识别词典107。由于从发音信息生成声音识别词典的方法使用众所周知的技术即可,因此此处省略说明。
[0072]在导航装置中,例如在进行路径搜索时,导航控制部102在检索某个地点周边的设施(当前所在地或者目的地周边的设施等)时,从地图DBlOl取得作为检索对象的设施名称,并输出至发音信息生成装置100。发音信息生成装置100生成与所输入的设施名称的单词串或单词相对应的发音信息,并输出至声音识别词典生成部108。声音识别词典生成部108利用输入的单词串或者单词生成声音识别词典107。
或者,导航控制部102在检索某个城市中包含的道路名称时,从地图DBlOl取得作为检索对象的道路名称(通过所选择的城市的道路名称),并输出至发音信息生成装置100,与上述设施名称相同,也能生成道路名称的声音识别词典107。
[0073]接着,导航控制部102对作为检索对象的设施名称进行画面显示,令用户说出表示所希望的目的地的设施名称,并利用麦克风105进行集声,声音识别部106使用声音识别词典107进行声音识别,返回至导航控制部102。
接着,为了确认用户说出的目的地是否被正确地声音识别出,导航控制部102将从声音识别部106输入的表示目的地的声音识别结果的字符串(或者对该字符串所设定的固有ID)输出至声音合成部103,声音合成部103向发音信息生成装置100输出目的地的字符串(或者ID)。发音信息生成装置100生成与目的地的单词串或单词相对应的发音信息,并输出至声音合成部103。然后,声音合成部103对与该发音信息相对应的声音信息进行合成,并从扬声器104输出。
[0074]此外,例如在进行路径引导时,导航控制部102将引导中使用的地名、设施名称、道路名称等字符串(或者ID)输出至声音合成部103,声音合成部103从发音信息生成装置100取得与该字符串(或者ID)相对应的发音信息,对声音信息进行合成,并从扬声器104输出。
[0075]另外,发音信息生成装置100除了图14所示的导航装置以外,例如也能适用于音频装置中。若是音频装置,则包括用于进行⑶等的重放的音频控制部,以代替导航控制部102。
然后,例如在将媒体插入到音频装置中时,将目录数据(例如曲名、艺术家名等)作为输入字符串,发音信息生成装置100与声音识别词典生成部108进行协作,生成艺术家名的声音识别用、曲名的声音识别用等声音识别词典107。
此外,例如用户在进行某个检索时,也能将检索结果(例如以艺术家名作为检索关键字所提取的专辑名称)作为输入字符串,来生成专辑名称的声音识别用的声音识别词典107。
接着,声音识别部106对用户说出的曲名、艺术家名、专辑名称等进行声音识别,音频控制部根据该识别结果来重放乐曲,或声音合成部103对该乐曲的曲目数据进行声音合成并通知用户。
并且,也可以是音频一体型的导航装置。此外,也可以包括执行免提通话等电话用的功能。在该情况下,在电话与汽车音响本体(head unit)相连接时,从电话簿检索用的词典中提取出电话簿的各条目名称(人名、饭店名称等设施名称),使用发音信息生成装置100生成声音识别词典。于是,能对用户发出的声音进行声音识别来确定拨打对象,从而开始通话。
[0076]如上所述,上述实施方式I?4的任一种发音信息生成装置能通过减小数据库大小来实现小型化,因此适合用于要求小型化的车载导航装置或者车载音频装置等车载信息装置中。此外,在使用离线状态下预先生成的声音识别词典时,存储装置的大小会变大,但在本实施方式5中利用发音信息生成装置100以在线状态生成声音识别词典,因此声音识别词典所使用的存储装置的大小减小。
另外,导航装置并不限于车辆,也可以是包含人、铁道、船舶、飞机等移动体用的导航装置,例如为带入车辆内或者适用于车载的导航装置。
[0077]此外,上述实施方式I?5中,以英语的单词串为例进行说明,但并不限于此,当然也能适用于日语、中文、德语等任意语言。此外,发音信息的书写方式并不限于图示例,也可以使用国际首标(IPA)等。
[0078]除此以外,本发明申请在其发明范围内可以进行各实施方式的自由组合,对各实施方式的任意构成要素进行变形,或者在各实施方式中省略任意构成要素。
工业上的实用性
[0079]如上所述,本发明所涉及的发音信息生成装置使用小容量的数据库来生成正确的发音信息,因此适用于车载导航装置以及车载音频装置等车载信息装置中。
标号说明
I单词串信息DB存储部、
Ia?If单词串信息DB (单词串/单词信息数据库)、
2单词串信息检索部、
3发音信息生成判定部、
4发音信息生成部、
5发音信息输出部、
6单词串信息取得部、
7发音信息比较部、
8,8c单词串信息登记部、
9出现频度计算部、
IOd?IOf发音信息列表、
100发音信息生成装置、
101 地图DB、
102导航控制部、
103声音合成部、
104扬声器、
105麦克风、
106声音识别部、
107声音识别词典、
108声音识别词典生成部。
【权利要求】
1.一种发音信息生成装置,其特征在于,包括: 单词串/单词信息数据库,该单词串/单词信息数据库在根据单词串或者单词的书写信息自动生成的发音信息与该单词串或者单词的书写所对应的正式的发音信息不一致的情况下,一并登记所述书写信息与所述正式的发音信息,在一致的情况下,登记所述书写信息而不登记所述正式的发音信息; 单词串信息检索部,该单词串信息检索部从所述单词串/单词信息数据库获取与所输入的单词串或者单词相应的书写信息; 发音信息生成判定部,该发音信息生成判定部判定与所述单词串信息检索部所取得的所述书写信息相对应的正式的发音信息是否已登记到所述单词串/单词信息数据库中;发音信息生成部,该发音信息生成部根据所述发音信息生成判定部的判定结果,从未登记正式的发音信息的所述书写信息来生成发音信息;以及 发音信息输出部,该发音信息输出部根据所述发音信息生成判定部的判定结果,在未登记与所述书写信息对应的正式的发音信息的情况下,输出所述发音信息生成部生成的所述发音信息,在登记了正式的发音信息的情况下,输出所述单词串/单词信息数据库中所登记的该正式的发音信息。
2.如权利要求1所述的发音信息生成装置,其特征在于, 在根据单词串或者单词的书写信息自动生成的发音信息与该单词串或者单词的正式的发音信息不一致的情况下,在单词串/单词信息数据库中一并登记所述书写信息与所述正式的发音信息,在一致的情况下且当所述单词串/单词信息数据库中该单词串或者单词的出现频度在规定的阀值以上时,也在单词串/单词信息数据库中一并登记所述书写信息与所述正式的发音信息,在一致的情况下且当所述出现频度小于规定的阀值时,在单词串/单词信息数据库中登记所述书写信息而不登记所述正式的发音信息。
3.如权利要求1所述的发音信息生成装置,其特征在于, 包括发音信息列表,该发音信息列表对于根据书写信息自动生成的发音信息与正式的发音信息不一致的单词串或者单词,登记该正式的发音信息, 在单词串/单词信息数据库中一并登记了表示所述发音信息列表内的所述正式的发音信息的登记位置的位置信息以及所述书写信息,以表示所述发音信息列表内的所述正式的发音信息的登记位置的位置信息来代替所述正式的发音信息, 发音信息生成判定部判定与单词串信息检索部所取得的书写信息相对应的位置信息是否登记在所述单词串/单词信息数据库中, 所述发音信息生成部根据所述发音信息生成判定部的判定结果,从未登记位置信息的所述书写信息生成发音信息, 发音信息输出部根据所述发音信息生成判定部的判定结果,在未登记与所述书写信息相对应的位置信息的情况下,输出所述发音信息生成部所生成的发音信息,在登记了所述位置信息的情况下,输出登记在所述发音信息列表中的该位置信息所指位置的正式的发音信息。
4.如权利要求3所述的发音信息生成装置,其特征在于, 在根据单词串或者单词的书写信息自动生成的发音信息与该单词串或者单词的正式的发音信息不一致的情况下,在单词串/单词信息数据库中一并登记所述书写信息与表示发音信息列表内的所述正式的发音信息的登记位置的位置信息,在一致的情况下且当所述单词串/单词信息数据库中该单词串或者单词的出现频度在规定的阀值以上时,也在单词串/单词信息数据库中一并登记所述书写信息与所述位置信息,在一致的情况下且当所述出现频度小于规定的阀值时,登记所述书写信息而不登记所述正式的发音信息。
5.一种车载信息装置,其特征在于,包括: 权利要求1所述的发音信息生成装置;以及 具有声音合成部与声音识别部中的至少一个, 该声音合成部利用所述发音信息生成装置生成进行声音输出的单词串或者单词的发音信息,并将该生成的发音信息转换为合成声音, 该声音识别部将声音识别对象即单词串或者单词作为输入字符串,基于利用所述发音信息生成装置生成的发音信息,生成声音识别词典,利用该声音识别词典,对输入的声音信息进行声音识别。
6.一种数据库生成方法,其特征在于,包括: 发音信息生成步骤,该发音信息生成步骤中,基于包含单词串或者单词的书写信息以及与该单词串或者单词的书写相对应的正式的发音信息的输入数据,从书写信息来生成发音信息; 发音信息比较步骤,该发音信息比较步骤中,将所述发音信息生成步骤中所生成的发音信息与所述输入数据中包含的所述正式的发音信息进行比较;以及 单词串信息登记步骤,该单词串信息登记步骤中,根据所述发音信息比较步骤的比较结果,在所述发音信息生成步骤中所生成的发音信息与所述正式的发音信息不一致的情况下,一并将所述书写信息与所述正式的发音信息登记至数据库,在一致的情况下,将所述书写信息登记至所述数据库,而不登记所述正式的发音信息。
【文档编号】G10L13/08GK103635961SQ201180071596
【公开日】2014年3月12日 申请日期:2011年6月14日 优先权日:2011年6月14日
【发明者】山崎道弘 申请人:三菱电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1