信息检索装置、信息检索方法及导航系统的制作方法

文档序号:2824858阅读:141来源:国知局
专利名称:信息检索装置、信息检索方法及导航系统的制作方法
技术领域
本发明涉及信息检索装置、信息检索方法及导航系统,尤其涉及进行利用了文本查询的声音识别辞典的定制的信息检索装置、信息检索方法及导航系统。
背景技术
以往,公知一种如下的信息检索装置,S卩为了从数据库中取出用户所期望的数据,用户对成为对象的名称的一部分进行文字输入,将与所输入的文字一致的数据提示给用户,通过用户的选择能够指定数据。另外,以往也公知一种如下的检索方法,即通过声音输入,使用户发出相应的名称的声音,利用进行了声音识别的结果来检索数据。
作为这种信息检索装置中的代表性检索有车载导航中的目的地设定的任务或音频系统中的乐曲的检索等。
在车载导航系统中,为了在全国范围内检索庞大设施名中的某设施名来设定目的地,使用了上述那样的信息检索接口。在该信息检索中,最初用户经由车载导航的触摸面板或遥控器输入设施名的一部分。然后,通过按下检索按钮来显示包括用户输入的字符串的设施名的一览,通过从中选择一个能够设定目的地。另外,用户通过声音发出设施名的声音也能设定目的地。
基于触摸面板或遥控器的输入的优点在于,即便用户不输入全部名称,也能通过输入已知的一部分名称来检索。但是,由于要多次进行按下按钮等的操作,因而操作时间变长。另一方面,利用了声音识别功能的输入的优点在于,只要发出一句话即可解决,因而能够在短时间内进行输入。但是,由于声音识别的识别率并不是100%,因而有时会产生识别错误,故必须重新进行操作。另外,在车载导航的声音识别中,为了提高识别率且缩短处理时间,一般需要将能受理的词汇的数量抑制得较少。为此,主要只能受理设施的正式名称, 另外,能受理的设施的数量也受到限制。因而,存在着在车载导航不等待用户自然想到的发声的情况下无法输入用户自己所期望的目的地的问题。该问题一般被称为词汇外发声。
为了解决该问题,公知一种如下功能,S卩用户针对某一设施登记用户自身的声音识别词汇(以下,称作声音识别词汇登记功能)。在该功能中,首先用户通过触摸面板或遥控器的名称输入或住所输入等方法选择期望的设施。然后,用户输入与选择出的设施相应的声音识别所使用的词汇。作为该输入方法,公知一种如下方法,即由触摸面板或遥控器进行的假名文字的输入、或通过声音的发声。例如,用户选择朋友铃木家的住所,在该状态下作为读音假名而设定“t ft冬“”。于是,之后用户以声音输入的方式发出“t ft 入6 ”的声音,就能执行向铃木家的目的地设定这样的车载导航的规定动作。
另外,在专利文献1中公开了如下技术,即对设施名的正式名称应用换言生成规则来生成换言语,并通过将其登记于声音识别辞典,来识别不是正式名称的发声。
(现有技术文献)
(专利文献)
专利文献1 日本特开2004-133003号公报发明内容
(发明要解决的课题)
在导航系统安装的声音识别词汇登记功能中,需要用户明示调用该功能的手续。 即、为了利用声音识别词汇登记功能,在选择相应设施的过程中需要通过触摸面板等登记所需的读音假名的手续。因而,存在着为了完全掌握声音识别功能而需要时间的问题。
在专利文献1公开的技术中,并未考虑到在用于追加声音识别辞典的换言生成规则中分别反映个别用户的知识这一点。因而,存在着用户已知的词汇并不一定登记于声音识别辞典、或者用户未知的词汇已登记于声音识别辞典的问题。
本发明的目的在于提供一种在通过声音输入进行检索时对于用户而言可操作性良好的信息检索装置、信息检索方法及利用此的导航系统。
(用于解决课题的手段)
如下示出本发明的代表性的一例。即、本发明的信息检索装置,其特征在于具备 名称数据库,其以记录为单位登记了一个以上的所述记录,该记录将成为检索对象的一个以上的属性和作为与各个所述属性相应的内容的值相关联地保存;操作输入部,其接受用户的操作输入;声音输入部,其接受所述用户的声音输入;声音识别部,其将从所述声音输入部得到的声音识别为字符串;音响模型存储部,其存储在所述声音识别部中参照的音响数据;语言模型存储部,其将在所述声音识别部中识别的词汇和该词汇的连结规则作为语言模型进行存储;检索部,其利用从所述操作输入部或声音识别部输入的输入字符串,检索在所述名称数据库中包含的所述属性的所述值,并将在该值中包含所述输入字符串的所述记录作为候补来生成;输出部,其将由所述检索部生成的所述记录的候补作为检索结果来输出;选择单元,其选择所输出的所述记录的候补;和识别词汇生成部,其接受由所述选择单元进行的所述记录的选择结果,生成作为应该追加于所述语言模型的声音识别词汇的新追加识别词汇;所述识别词汇生成部将所述输入字符串所对应的所述追加识别词汇和选择出的所述记录的对应关系记录于所述名称数据库或所述语言模型。
(发明效果)
根据本发明,能够将用户普及使用的信息检索用的字符串(检索查询)加工成对于用于而言易于发声的形式,并作为声音识别词汇进行登记。由此,能够减少用户完全掌握声音识别功能所需的手续,能够提高信息检索装置的可操作性。另外,由于将用户已使用的检索查询用作声音识别词汇,因而能够将用户已知的词汇用作声音识别词汇,能够减少词汇外发声的频度,在这点上也能够提高可操作性。


图1是本发明的第1实施方式中的信息检索装置的功能框图。
图2A是表示第1实施方式中的数据库中存储的信息的明细的表格的例子。
图2B是表示第1实施方式的变形例涉及的数据库中存储的信息的明细的表格的例子。
图3A是第1实施方式中的语言模型的辞典中存储的单词的例子。
图:3B是表示了图3A所示的语言模型之中的为可识别的单词的连结规则的图。
图3C是第1实施方式的变形例涉及的语言模型的辞典中存储的单词的例子。
图4是表示第1实施方式中的触摸面板及其画面显示的例子的图。
图5是表示基于用户的输入操作而变更了显示的画面的例子的图。
图6是示出第1实施方式中的识别词汇生成部的处理顺序的流程图。
图7A是表示本发明的第2实施方式中的词素的重要性的表格的例子。
图7B是表示第2实施方式中的词素的重要性的表格的其他例。
图8是示出本发明的第2实施方式中的识别词汇生成部的处理顺序的流程图。
图9A是第2实施方式中的对词素的组合所计算的重要性的例子。
图9B是表示在第2实施方式中基于用户的输入操作而变更了显示的画面的例子的图。
图9C是表示第2实施方式中的对词素的组合所计算的重要性的表格的例子。
图IOA是示出第2实施方式中的处理顺序的流程图。
图IOB是表示第2实施方式中的对词素的组合所计算的重要性的表格的例子。
图11是本发明的第3实施方式中的信息检索装置的功能框图。
图12是示出第3实施方式中的识别词汇生成部和词汇类别判定部的处理顺序的流程图。
图13A是表示第3实施方式中的示出某一属性所属的词素的词汇判定表格的例子的图。
图1 是表示在第3实施方式中预先记录辅类型ID编号和与其对应的设施的ID 编号之间关系的表格的例子的图。
图14是作为本发明的第4实施方式而表示乐曲检索中的名称数据库的例子的图。
图15是第4实施方式中的画面显示的例子。
图16是示出第4实施方式中的识别词汇生成部和词汇类别判定部的处理顺序的流程图。
图17是表示第4实施方式中的语言模型中存储的辞典的明细的图。
图18是表示第4实施方式中的追加识别词汇存储部中保存的表格的例子的图。
图19是示出第4实施方式中的识别词汇生成部的处理顺序的流程图。
具体实施方式
以下,利用

本发明的实施例。
实施例1
参照图1 图6,说明本发明的第1实施例涉及的信息检索装置。图1中示出本发明的第1实施例涉及的信息检索装置的功能块。
在本实施例中,在车载导航中,以用于检索店铺等设施的信息检索为例进行说明。 信息检索装置100具有通过CPU、存储器、软件等实现的各种运算处理功能或图像处理功能。信息检索装置100将其构成划分为功能块,作为输入部而具备操作输入部110,其接受用户的操作输入;和声音输入部120,其接受用户的声音输入。操作输入部110接受用户的输入之中的触摸面板操作、遥控器操作、拨号操作等的操作输入。信息检索装置100还具备声音识别部130,其将从声音输入部得到的声音识别为字符串;音响模型存储部140,其存储在声音识别部中参照的音响数据;语言模型存储部150,其存储在声音识别部中识别的词汇和词汇的连结规则;检索部160 ;名称数据库170 ;输出部180,其将由检索部检索出的记录的候补提示给用户;选择单元(省略图示),其从所提示的记录的候补中选择用户特定的候补等;及识别词汇生成部190。此外,上述信息检索装置100的各部分的结构只是一例,也可根据软件等方式将各部分综合起来,或者将各部分细分。例如,选择单元也可作为操作输入部110或声音输入部120的各功能的一部分而构成。另外,音响模型存储部140、 语言模型存储部150及名称数据库170也可作为共用的存储装置而构成。
名称数据库170以记录为单位登记了一个以上的所述记录,该记录将成为检索对象的一个以上的属性和作为与各个所述属性相应的内容的值相关联地保存。检索部160利用由用户输入的输入字符串,检索在名称数据库170中包含的一个或多个属性的值,并将在该值中包含输入字符串的记录作为候补来生成。识别词汇生成部190基于检索部160的输出,生成作为应该重新追加于语言模型存储部150的声音识别词汇的追加识别词汇。由此,本实施例的信息检索装置100能够将为了用户检索而输入的字符串、即检索查询作为声音识别词汇进行登记,并用于检索。另外,通过词素信息或其他数据库的信息来编辑检索查询,从而在声音输入时提供用户易于发声的声音识别词汇。此外,在以下的实施例中,说明用户基于英语进行声音输入的例子。下面,详细说明各部分的构成及功能。
[关于名称数据库的说明之一]
名称数据库170是预先蓄积由信息检索装置能检索的数据的数据库。在本实施例中,说明存储与车载导航的设施相关的信息的情况。
在图2A中示出名称数据库170的表格的构成例。此外,在本发明中,将各数据的单位称作“记录”进行说明。
在名称数据库170中存储了已登记于车载导航的全国(所利用国或地域)的设施名(名称)。针对1个记录赋予与多个属性相关的信息。
另外,将各个属性中保存的信息称作“值”。
名称210表示各个设施的名称。
读音220表示对各设施赋予读音假名。另外,在这里,将分割了设施名的读音的记号记载为“/”。将分割后的各个部分称作“词素”。另外,根据各词素来设置记载了其性质的词类。在后面说明词素分割的组合方法。
[词素解析方法]
这里,说明词素分割方法。
[词类的种类]
词素是指由自然语言定义的词汇的单位之一。但是,在本实施方式中,词素定义为在好划分的地方划分设施名的单位。在如英语那样将各个单词进行划分来表示的语言的情况下,能够将单词划分位置直接用作词素的分割位置。而且,不仅是单词划分位置,也能通过单词内的复合名词的划分位置、或引起词尾变化的位置来划分词素。
词素的定义因各个语言的不同而不同。在本实施例中,叙述设施名称的分割。作为用于此的词素体系,能够将分割在公知文献(岩瀬成人自然言語処理&用0 &企業名解析方式,電子情報通信学会論文誌,vol. J82-DII,no. 8,pp. 1305-1314,1999)中调查的设施名时的意思范畴用作词素的单位。在本说明书的实施方式中,以“岩瀬”的论文为参考,作为词类而假设“专有名称”、“地名”、“职业种类”这3个种类。另外,作为都不属于这3个种类的情形,设置了 “其他”这一种类进行说明。
另外,随后说明乐曲检索中的实施方式,关于乐曲名而言,能够应用挪用与所利用国或地域相应的现有语言的词类体系的方法。另外,关于作词者、作曲者、艺术家名字而言, 能够采取以姓或名为单位进行分割,并分别视作词素的方法。
[分割方法]
作为向词素分割的分割方法,能够采取几个方法。
作为第1方法,最初可以在名称数据库中组合预先赋予各名称的词素划分的位置和各词素的词类。
作为第2方法,可以主动地进行词素分割处理。例如,作为词素解析的方法,作为词素解析的方法通过将各词素和词类的关系作为辞典而采用最长一致法、分割数最小法、 连接成本最小法等的方法,从而能够将设施名分割成词素单位。
[声音合成用的辞典的利用]
另外,关于词素划分,能够利用声音合成用的辞典的信息。在车载导航中,为了以声音引导的方式读完设施名或乐曲名之外的信息,而具有各名称的读音的信息。另外,在各读音中赋予了自然读完所需的语调信息、韵律信息、词素划分的信息。利用这些信息,可以作为本发明中的词素划分的单位来使用。
[关于名称数据库的说明之二]
返回图2A,继续说明名称数据库170。
主类型230存储各设施所属的类型。
辅类型235存储比各设施所属的主类型230更详细的类型。例如,关于火车站而存储了线路名,关于超级市场而存储了各设施所属的连锁店及经营总店的名称。
住所240存储各设施的住所。
在追加识别词汇250中登记为了指定各设施而使用的声音识别词汇。随后说明该登记方法。
另外,虽然在图2A中未示出,但是在车载导航中通常使用的纬度、经度、映射码等属性也一并保存于名称数据库170。
[构成的说明]
返回图1,说明信息检索装置100的构成。
操作输入部110接受用户的输入之中的基于触摸面板、遥控器、拨号等手动操作的输入。
声音输入部120接受基于用户的声音的输入。具体而言,将从麦克风输入的用户的发声声音变换成数字信号。
声音识别部130根据声音的数字信号进行声音识别,变换成字符串。在这里,首先将用户发声的声音数据变换成特征向量列。特征向量列是指,用多维向量量来表示声音的各时刻的特征量,并将其在时间序列上排列。例如,使用下述特征向量列将各时刻的声音数据变换成被称为MFCC(Mel Frequency Cepstrum Coefficient)参数的多维向量量,并将其在时间序列上排列。
在音响模型存储部140中预先保存各音素所对应的模型。作为该模型的表现方式,能够使用以3种状态定义各音素的HMM(Hidden Markov Model)。
在语言模型存储部150中记录作为声音识别部识别对象的单词和各单词的连结规则。
[语言模型]
利用图3A、图;3B来说明语言模型存储部150的明细。
在此提及的语言模型中,以名称数据库170中的各个设施的读音220能识别的方式生成。
图3A是表示登记了语言模型之中的为识别单位的单词的辞典300。在这里,名称数据库170中的各个设施的读音220被作为单词进行登记。
1个单词的信息由单词标签310和音素串320这2个属性构成。
在单词标签310中记录作为声音识别结果而输出的字符串信息。
在音素串320中存储各个单词的读法所对应的音素记号。图3A的辞典300中的音素记号和实际音素的对应,如信息处理振兴事业协会的课题研究开发出的“日本語7 ^ 夕r-v 3 >基本y 7卜,- 7”的格式所记载的那样,记载在以下文献中。
鹿野,伊藤,河原,武田,山本「音声認識* 7〒A」,才一么社Q001) ^ 133夕。
鹿野,武田,河原,伊藤,山田,伊藤,宇津呂,小林,嵯峨山,峯松,山本「日本語〒 ^夕,—3 >基本乂 7卜々工7 O開発」,第19IPA技術発表会論文集Q000) (http:// www. ipa. go. jp/SYMP0/sympo2000/pdf/ipal9_l_51_l. pdf)
另外,作为日语以外的语言所对应的音素记号,例如也能使用X-SAMPA(Extended SAM Phonetic Alphabet)。
图;3B是表示了语言模型之中的为可识别的单词的连结规则360的图。
示出可识别从记号“start”至“end”的任意一条通路。在这里,示出能识别已登记于辞典的各个单词的有限状态语法的例子。在图3B的连结规则360中,追加了已经追加于图3A的辞典300中的单词340、350所对应的语法通路345、355等。关于这点,在后面详细说明。
此外,作为变形例而如图3C所示,语言模型存储部150的辞典300也可具有对应 ID编号330来作为第3个属性。在对应ID编号330中登记各单词所对应的名称数据库的 ID编号205。图3C的辞典300与图2B的表格170组合起来进行使用。关于其使用方法, 在后面作为第1实施例的变形例进行说明。
[声音识别部]
声音识别部130比较输入声音的特征向量列和语言模型中存储的可识别的单词串的音素系列,计算表示一致度的得分。
之后,输出得分高的单词串的单词标签的字符串。
在这里,也可仅输出得分最高的单词串,也可输出得分高的高位多个单词串。
此外,声音识别的方法详细记载于下述文献中,能够用于组合。
Lee, Reddy “ Automatic Speech Recognition :The Development of the Sphinx Recognition System“ , Kluwer Academic Publishers (1989)
Rabiner,Juang “ Fundamentals of Speech Recognition",Prentice HallPTR(1993)
[检索部]
检索部160利用从声音输入部120或声音识别部130输出的字符串,在处于名称数据库170内的各属性的值之中进行检索,生成记录的选择候补。
[基于文本输入及声音输入的候补生成的一般流程]
在这里,示出通过用户的输入而在检索部160中生成选择候补的流程。
图4表示安装于车载导航的画面的触摸面板400及其显示的例子。该触摸面板 400具有图形用户界面(GUI)功能,并具备操作输入部110、检索部160及输出部180的各功能。触摸面板400还具备从由输出部输出的记录的候补一览中选择特定候补的选择单元的功能。在这里,通过文字输入来检索设施的情况进行说明。
文字按钮410能够通过按下各按钮来输入文字。另外,也准备进行文字的删除、输入文字种类的变更、光标移动的按钮。
在显示区域420中,显示用户通过文字按钮410按下的字符串。
检索按钮430是在用户要看选择候补的明细时所按下的按钮。另外,每当用户按下文字按钮410来更新字符串时,在括号内显示由检索部160得到的选择候补为几件。
在这里,作为例子,设用户输入“7 二7 (funit)”。
该输入经由操作输入部110而传递给检索部16。
在检索部160中,从名称数据库170的属性中检索读音220的值,检索包括用户输入字符串”二”,,的记录。
此外,考虑用户输入的便利性,设拨音或拗音等含有的小的文字,也能用所对应的大的文字进行检索。另外,设无论有无浊音或半浊音都能进行检索。
该检索的结果,作为选择候补而得到了一 ^一7 二?卜国分寺;^卜了”、“工一二,卜府中卞卜了,,及“么t二 O易才、于A,,这3件。
之后,设用户根据触摸面板400的选择单元的功能对选择候补进行选择,并按下检索按钮430。
通过该选择单元的按下动作,设施的候补被送给输出部180。输出部180为了向用户提示选择候补,而进行画面显示的变更或以声音方式向用户传送选择候补的声音再生。
在图5中示出由输出部180变更后的触摸面板400的画面。在候补显示区域510 中显示了所生成的选择候补。
用户接受该动作,根据触摸面板400的选择单元的功能,从选择候补之中选择自己要前往的1个设施,按下候补显示区域510所对应的设施。该选择单元的按下结果经由操作输入部110被受理。由此,例如在用户选择了一 ^一 7 二?卜府中^卜7”的情况下,将该设施作为选择结果,进行路径搜索或地图显示等的车载导航的规定动作。
接着,说明用户作为选择单元而利用了声音输入功能的情况下的动作。
设用户以声音的方式发声为一 ^一7 二 ^卜府中^卜7”。该声音被声音输入部120变换成数字信号之后,由声音识别部130变换成字符串。
在声音识别处理中,搜索声音信号与处于语言模型存储部150内的识别对象的单词串之中的最类似的单词串。其结果,输出了一一7 二:y卜7子二々;^卜7”。
用户经由选择单元的选择结果被输入到检索部160。12
在检索部160中,比较声音识别结果“ 7— “一 7 二V卜7手二々7卜7 ”和名称数据库170的读音220,检索完全一致的设施。其结果,选出设施一 ^一7 二 ^卜府中 7卜7”。然后,自输出部180输出。这种情况下,因为候补为1件,所以进行路径搜索或地图显示等的车载导航的规定动作。
为使检索速度变得更高速,作为第1实施例的变形例,如图2B、图3C所示,有利用固有赋予给各个设施的ID编号的方法。即、作为名称数据库的变形例,在图2B中示出表格 170的构成例。在该例子中,作为属性而追加了表示固有赋予给各个设施的ID编号的ID编号205。取而代之,名称数据库170的追加识别词汇250的项目被省略。另外,如图3C所示,作为语言模型的辞典300中记载的各单词的信息,除了预先存储单词标签310及音素串 320之外,还预先存储各单词所对应的记录的ID编号205。将其记载为图3C的对应ID编号330。例如,在单词“ ζ — 一 7 二y卜7 f ^々ζ卜τ ”中,对应ID编号中预先存储了名称数据库170中的所对应的记录的ID编号“0201”。
而且,声音识别部130在输出声音识别结果之际,除了输出单词标签之外,还输出被识别的单词的对应ID编号330。检索部160参照声音识别部130的输出之中的赋予给识别单词的对应ID编号330,将在名称数据库170中具有相同的ID编号“0201”的记录作为候补来生成。作为结果,能够将设施一^一7 二?卜府中^卜7”作为候补来生成。
[检索方法]
下面,说明在上面叙述的检索部160中的实际检索的组合方法。
首先,说明成为检索查询的输入是由触摸面板400等输入并从操作输入部110得到的字符串的情况。
作为进行检索的第1个方法,有全部检索。在该方法中,首先比较从操作输入部 110得到的字符串和名称数据库170的属性的读音220的全部,将所与输入字符串部分一致的记录。然而,在全部件检索的处理中,由于比较运算的次数变多,因而处理速度变得延迟。
作为使该处理高速化的第2个检索方法,能应用采用在数据库检索中用到的索引的检索。首先,预先生成索引,该索引记录了输入字符串和用于确定所对应的记录的信息 (例如,图2B的名称数据库170的ID编号205、表示记录在存储装置上的存储位置的地址等)的关系。并且,若用户为了检索而输入了文字、即查询,则通过将所输入的字符串作为关键字来参照索引,从而能够立刻得到所对应的记录的一览。除此之外,也能够使用在数据库检索中用到的公知技术。
接着,说明成为检索查询的输入为声音输入、为从声音识别部130得到的字符串的情况。
即便在输入为声音的情况下,由于字符串也被输入到检索部160,因而能够以与触摸面板等输入同样的方法进行检索。即、能够采用比较输入字符串和名称数据库170的读音220的全部的全部检索的方法。另外,能够使用预先生成索引,将声音识别结果作为关键字来参照索引,而得到设施候补的方法,其中该索引记录了有可能从声音识别部130得到的所有字符串和用于确定各个字符串所对应的记录的信息(例如,图2B的名称数据库170 的ID编号205、表示记录在存储装置上的存储位置的地址等)的关系。
本发明中的采用了声音识别结果或触摸面板输入的检索的处理,可以根据上述这种检索处理的方法进行组合。
[声音识别的各种组合]
在上述第1实施例及其变形例的说明中,假设作为声音识别的结果而输入1个单词串的情况。但是,在声音识别处理中也可得到多个单词串。因而,在得到了多个声音识别的单词串的情况下,也可检索包括其中其中一个单词串或单词的设施名,并将其结果输出。
另外,在上述第1实施例及其变形例的说明中,在声音识别的结果与名称数据库 170的一个设施的读音220完全一致的假设下进行了说明。另外,假设了语言模型存储部 150中的语法如图;3B的连结规则360那样处于各设施的读音分别并排记录的状态。另一方面,在语言模型中,也可在更细分割设施名的单位中存储单词,将其与N-gram语言模型这种赋予了连结概率的语法组合起来进行利用。这种情况下,得到了设施名的一部分的字符串。因此,也可在检索部160中,举出识别结果的字符串包含于设施名的读音220的(部分一致的)记录作为候补,并将其结果作为候补进行使用。
[第1实施例的前提]
以下,在本实施例中说明用户通过触摸面板输入“7 二 ?”,在检索的结果中作为候补而得到了 “义一一 7 二 ”卜国分寺义卜7”、‘U—” 二夕卜府中7卜了”及“么 d易*歹这3件,且用户选择了“7— “一7 二 7卜府中7卜的情况下的识别词汇生成部190的动作。
[识别词汇生成部]
在图6中示出识别词汇生成部190的处理流程。
在步骤610中,以词素为单位进行用户输入的字符串” 二” ”和确定的设施“卞一”一7 二y卜府中ζ卜7”的读音的比较。
结果可知,用户输入字符串“7 二 7”是读音“7—”一 / 二、y Y / ·7午工勺I ^卜7”之中的词素“7 二y卜”的一部分。
在步骤620中,基于词素来编辑用户输入字符串。在这里,将用户输入的字符串 ”二,”延长到相应的词素为止,而编辑为“7二7卜”。
将其用作声音识别词汇。
在步骤630中,将由步骤620生成的声音识别词汇登记于用户选出的名称数据库 170的设施一 ^一 7 二 7卜府中^卜7 ”的追加识别词汇250。此时,为使用户更加易于发声,也可与一卜々一 ”、“歹4 ” $— ”等的词汇连结起来。在这里,设连结一卜ry 一 ”。
在图2A的名称数据库170的沈0中示出“ 一卜勺一 ”的追加的方法。
在步骤640中,沿着已登记于追加识别词汇250的词汇,将单词登记于语言模型存储部150。在这里,将表示读音一卜m卜”及其发音的音素串的对,登记于语言模型存储部150的辞典300(图3A的340)。另外,将已追加于辞典的单词所对应的语法通路追加于语法(连结规则)360 (图;3B的345)。
另外,在上述变形例的情况下,在已经追加于辞典300的单词中,将用户选出的设施“7 一 " 一 7 二y卜府中7卜7 ”的ID编号205、即“0201”登记于对应ID编号330。即、 在语言模型存储部150存储的各个词汇中一并存储了所对应的标识符(ID编号330),声音识别部130与被识别的词汇一并输出被识别的词汇所对应的标识符,检索部160参照声音识别部输出的赋予给词汇的标识符,生成具有与名称数据库170的标识符相同的标识符的记录来作为候补。因此,识别词汇生成部190在图6的步骤620中基于检索部160的输出来生成追加识别词汇,省略步骤630中的向名称数据库170的登记而进入步骤640,在步骤 640中以组合了名称数据库170中的用户选择出的记录所对应的对应ID编号和所生成的追加识别词汇的形式,也将词汇追加于语言模型存储部150的辞典300。
另外,也可一并登记管理表示一卜m卜”是追加识别词汇的标志。
[使用了追加识别词汇的目的地设定]
说明第1实施例中的之后操作。
用户通过声音而发声为“5—卜々一 7 二:V卜,,。
其结果,经由声音输入部120而由声音识别部130进行声音识别处理。
该声音识别处理的结果,得到了声音识别结果的单词标签一卜々一7 二 ^ 卜,,。
接着,在检索部160中比较声音识别结果的单词标签和名称数据库170。
在这里,除了比较名称数据库170之中的读音220之外,还与追加识别词汇250进行比较。其结果,使得与设施“7— ”一7 二 7卜府中7卜7 ”的追加识别词汇一卜, 一勹二 ” 卜,,260 —致。
受到该结果的影响,从输出部中生成“将目的地设定为‘力一 ^一7 二 7卜府中^ 卜7 ’ ”这一声音应答,且进行地图显示、路线搜索等的车载导航的规定动作。
此外,在上述变形例的情况下,关于根据用户的“ 一卜々一7 二y卜”这一发声选择了设施“力一一7 二 7卜府中ζ卜的处理顺序,省略组合了通过使用赋予给语言模型存储部的对应ID编号330而与名称数据库170的读音22、追加识别词汇250进行比较的处理。具体而言,声音识别部作为声音识别结果,除了输出单词标签“5—卜D 二 ”卜”之外,还一并输出对应ID编号“0201”。检索部160参照声音识别结果之中的对应ID 编号“0201”,生成在名称数据库170的ID编号205中的相一致的设施来作为候补。在该方法中,也能将设施一一7 二?卜府中^卜7”选择为候补。
[识别词汇生成部的其他例]
接着,说明在第1实施例中在用户从图5的候补显示区域510中选择了“各d 6 * ^ 的情况下的识别词汇生成部190的动作。
这种情况下,与用户输入的字符串一致的词素是“I d 6 ”。由此,针对“I t二 ο 石* r 而生成词汇“ 一卜々一 7 二 , >”,并登记于名称数据库170的追加识别词汇 250和语言模型存储部150。由此,若用户发声为一卜々一7 二 ?>”,则进行与“么(二 。石相关的规定动作。
以上,在本实施例中,按照用户通过触摸面板等输入的字符串,追加声音识别词汇。由此,因为能够将用户最初已知的词汇用于声音识别,所以能够减少词汇外发声,能够提高可操作性。
此外,在本实施例中,利用词素划分来扩展用户输入的字符串。由此,即便用户通过触摸面板输入的字符串如“7 二 ?”那样为不完全的字符串,通过以词素为单位进行扩展,也能扩展到为了用户发声而自然感觉到的单位。但是,也可不同于本实施例,在一点也不加工用户输入的字符串的情况下,作为追加识别词汇进行使用。
[容许了汉字假名输入的情况]
另外,在本实施例中,假定了用户通过触摸面板输入的文字为假名。然而,也可输入同时混有汉字假名的文字。这种情况下,针对名称数据库的名称210,预先将各个名称分割为词素(例如,“荻窪/ ^ r-v 3 >”)。并且,在步骤610的处理中,通过将用户输入的同时混有汉字假名的字符串与设施的名称210进行比较,来确定相应的词素。由此,也能够对应于用户的同时混有汉字假名的情况。
[基于触摸面板输入的追加识别词汇的检索]
另外,在本实施例中,使用了加工用户通过触摸面板输入的文字,并将其作为声音识别词汇进行使用的实施例。然而,所生成的声音识别词汇不仅仅用于声音识别,即便在通常的触摸面板等的操作的输入下,也能用作检索对象语言。
例如,假设针对名称数据库的设施“7 — ^一 7 二 7卜府中7卜7”,已经将“7 二 ”卜”追加于追加识别词汇属性。这种状况下,假设用户通过触摸面板输入“7 二 7卜”。这种情况下,在检索部中检索名称数据库的读音220,生成在读音后接着“7 二、y卜”的设施作为候补。
此时,从名称数据库170的追加识别词汇属性出发,也与设施“ ^ 一 〃°一7 二 ”卜府中7卜7”的追加识别词汇属性一致。基于该判断认为较之其他候补更优先向用户提示“7— ”一 7 二夕卜府中7卜7”。
例如,认为即便在检索查询“ 7 二:V卜”的候补有几百件的状况下,也认为在画面显示中在候补显示区域510的最上层显示一”一7 二 ^卜府中^卜7”。这样一来,用户能够立刻发现已知的设施。
实施例2
参照图1、图2A及图7A 图10B,说明本发明的第2实施方式涉及的信息检索装置。
该实施方式的特征在于,在第1实施方式中,针对用户选择出的设施而生成多个追加识别词汇的候补,让用户从其中进行选择。
而且,在追加识别词汇已经用于声音识别的情况、或者存在类似的识别词汇的情况下,变更追加用的动作。
此外,名称数据库170、语言模型存储部150或辞典300等的构成设为未采用在第 1实施方式中说明过的ID编号的方式,但是也可通过采用在第1实施方式的变形例中说明过的ID编号的方式来实现。
[第2实施方式的前提]
作为本实施方式的说明前提,首先,设在名称数据库170中作为追加识别词汇250 而将“ 3'—卜m — 7 二 ”卜”追加于设施“ ζ — α — 7 二 ”卜国分寺ζ卜τ ”(图 2八的沘2)。为此,设在语言模型存储部150中也已经登记了一卜my 二, 卜”这一词汇。
由此,设用户通过触摸面板输入“7 二 ?”,并从设施名候补中选择了 “力一 ^一 7 二夕卜府中7卜7 ”。
[词素重要性]
接着,说明预先对词素赋予词素重要性的情况。
图7A及图7B分别是定义了本实施方式中的词素的重要性的表格700的一例。16
设置如图7A所示那样的定义了一 ^一7 二?卜府中^卜7”中含有的各个词素710的词素重要性730的表格700。词素重要性被定义为对于用户而言,通过发声该词素能够提高到呼叫相应设施较自然的情况的指标。例如,由于认为通过词素“7 二 7卜”这一发声来指定名称“力一^一7 二^7卜府中7卜较自然,因而能够将词素重要性设定得较高。另一方面,由于认为仅通过词素“力卜这一发声来指定设施几乎不起作用,因而设“7卜7”的词素重要性为较低的值。
另外,纵使该词素重要性不依赖于词素710,也能利用按词类720定义的值进行组合。这种情况下,列举将“专有名称”、“地名”及“职业种类”设为高,将“其他”设为低。在 “其他”中,例如包含法人类别名(株式会社、财团法人等)。
另外,纵使词素重要性不是连续值,也可以是被量化后的值。例如,也可以赋予“重要”、“不重要”这种2阶段的其中一个信息。另外,虽然未图示,但是也可对词素的多个组合赋予词素重要性。例如,若“7 — ^一 /々”这样的跳过了“7 二y卜”的组合对于用户而言较自然,则对于该组合而言能够将重要性设定得较高。
[识别词汇生成部的动作]
接着,在图8中示出本实施例中的识别词汇生成部190的处理流程。
[与用户输入的字符串相当的词素重要性的加法运算]
在步骤810中,首先确定包括用户输入的字符串的读音的词素。其结果,确定词素 “7 二:y卜”为用户输入的字符串。接着,沿着增加该词素的重要性的方向进行重新计算。 在该实施例中,设加0. 5。由此,词素“ 7 二 7卜”的词素重要性如图7A的740所示那样成为 1.4。
[基于词素组合的声音识别词汇的生成]
在步骤820中,作为声音识别词汇的候补而生成设施的词素的组合。而且,还算出与该组合相应的组合重要性。组合重要性是指,重要性越高越以用户发声该词素的组合较自然的方式进行赋予的重要性。虽然其算出方法有各种方法,但是在这里将相加词素重要性中的除以词素数量后的平均值作为组合重要性进行使用。
在图9A的表格900中,表示通过步骤820计算的组合重要性的例子。词素组合 910是各个词素的组合。组合重要性920是针对各个词素的组合而算出的组合重要性。另外,组合重要性920按照从高到低的顺序依次排列。
例如,在词素组合一“一 / ”二、y卜”的情况下,一"一”的词素重要性为 0.8,” 二夕卜”的词素重要性为1.4。由此,相加之后再除以2,而计算得到1.1。
[与现有的声音识别词汇相类似的组合的重要性的降低]
在步骤825的动作中,计算所生成的各个词素组合与语言模型存储部中保存的词汇之间的类似度。在这里,在除去“5—卜々一 ”等由识别词汇生成部附加的词语之外的状态下,若完全一致则计算出类似度为1,若不完全一致则计算出类似度为0。此外,纵使不采用该方法,也可以利用单词的音素间距离等而采用连续的值。音素间距离能够通过音素记号的编辑距離或Miattacharyya距離等的公知方法进行计算。
由此计算出的结果在图9A的表格900中作为“类似度” 930进行表示。已经针对 “ Hl 二 ,卜国分寺7卜7 ”而使用了声音识别词汇“ 3'—卜々一 7 — A— 7 二 ,卜”(图2々的观2)。由此,在计算中,由于在语言模型中已经存在一卜HU二 7卜”,因而针对词素组合一”一/ 7 二 ^卜”而言“类似度” 930为1,除此之外“类似度” 930为0。
受到该结果的影响,在类似度高的情况下,沿着降低组合重要性的方向重新进行计算。在这里,作为例子,在类似度为1的情况下将组合重要性设为0。由此,与词素组合 u— I n卜”相应的组合重要性变为0 (图9A的表格900中的940的操作)。
[声音识别词汇的候补的提示与用户选择]
在步骤830的动作中,识别词汇生成部190将组合重要性920高的高位数个词素组合910视作追加识别词汇的候补。然后,输出给输出部180。在这里,输出高位3个。
受到该结果的影响,在输出部中更新画面显示。并在图9B中示出更新了显示的显示画面400。在该画面中,对于用户而言其目的在于寻找使用成为候补的追加识别词汇之中的哪个词汇。
在选定设施显示区域1010中显示用户选出的设施的名称。
在追加识别词汇候补显示区域1020中,显示自识别词汇生成部190输出的追加识别词汇的候补。此外,对于用户而言为了提高视觉识别性,通过成为追加识别词汇的源这样的同时混有汉字假名的方式进行显示。
通过该显示,让用户选择采用在显示画面400的追加识别词汇候补显示区域1020 中显示的追加识别词汇之中的哪个词汇。为此,作为声音输出而设定了“力一〃一 7 二 ,卜府中7卜Τ"”的声音指令。也可发出“请从画面中进行选择”这样的引导声音。
下面,说明用户从中选择了 “ 7 二 ^卜府中”的情况。
根据步骤840的条件式,由于用户选择了声音识别词汇,因而处理移行到步骤 850。
在步骤850中,将选择出的“7 二 7卜府中”登记于名称数据库170的“7 — ^一 7 二y卜府中;^卜7”的追加识别词汇250。此时,与第1实施方式同样地,设以赋予“5 — 卜,一 ”的形式进行追加,追加“ 一卜々一 7 二:y卜7子-々”。该处理在图2A的名称数据库170中作为270进行表示。
在步骤860中,在语言模型存储部150中追加单词“ —卜々一 7 二 7卜7子二 々,,。
以后,与实施例1同样地,通过用户发声为一卜々一7 二 7卜二々”,从而能够进行设施一一7 二 ^卜府中^卜7”所对应的规定动作。
[声音识别词汇的候补的提示与用户一个也未选择的情况]
另一方面,将处理返回到步骤830的声音识别词汇的显示来追加说明。在用户状况,有时却不想使用被作为候补显示的声音识别词汇中的任何一个词汇。为了对应于该情况,在图9B的画面400中设置了设定拒绝按钮1030。
在用户按下了该设定拒绝按钮1030的情况下,根据步骤840的条件式,由于用户未选择声音识别词汇,因而处理结束。由此,也不会采用任何声音识别词汇。
如以上说明,通过设置生成多个追加识别词汇并让用户从中选定的动作,从而用户使用了想要使用的词汇,能够进行目的地设定。另外,通过设置不使用词汇的操作方法, 从而能够防止用户不打算进行的词汇的追加。
另外,在生成追加识别词汇时,通过生成基于词素的重要性的组合,从而能够提供对于用户而言更易使用的声音识别词汇。另外,针对词素的重要性,通过进行増加与用户输入的字符串对应的词素的重要 性的动作,从而能够易于显示包括用户输入的词素的追加识别词汇。[排除成为识别错误的原因的近似的音素的词汇]另外,如本实施例所示那样,通过预先从候补中排除处于现有语言模型内的词汇, 从而能够防止在特定的近似的词汇中指定多个设施。在本实施方式中,说明了在与现有词汇完全一致的情况下从追加识别词汇的候补 中排除该词汇的例子。但是,也可进行以下的組合。首先,存在虽然不是完全一致但却极其近似的词汇出现在追加识别词汇中的情 况。例如,存在下述情況,即在“ふにつるホテル”中已经存在追加识别词汇“ゴートウ一 フニッル,,的状态下,作为“スーパーフニット府中ストァ,,用的追加识别词汇而“ゴートウ 一フニット”却被表现为候补。“フニッル”和“フニット”等的词汇在音素方面较为近似。 因而,能够认为彼此成为易于误识别的对。在这种情况下,在步骤825的词汇的类似度计算 中,通过基于音素间距離的方法将类似度作为连续值进行算出,在类似度为阈值以上的情 况下降低其組合的重要性,从而能够实现从候补中排除的作用。通过采取该方法,从而能够 从候补中排除追加识别词汇“フニット”。由此,因为预先从追加识别词汇中排除了类似度 高的词汇,因而能够抑制识别错误的产生。[与追加识别词汇以外的类似度的计算]另外,在本实施例中,与处于现有语言模型内的词汇之中的已经被追加的追加识 别词汇进行比较,结果存在近似的词汇的情况下,通过从候补中排除的处理进行了说明。但 是,现有的词汇也包含不是追加识别词汇的情况。例如,与车载导航最初可识别的设施的正 式名或车载导航的声音指令进行比较,在它们与成为候补的追加识别词汇近似的情况下, 有时也会从候补中排除。[在追加词汇近似的情况下向用户的询问]另外,在类似度高的情况下,纵使不进行将其从候补中排除的操作,也可以直接向 画面提示候补,让用户听到其使用方法。[是否使用的询问]第1,能够采取让用户听到是否追加该词汇的方法。如前述的例子,在“ふにつる ホテル”中已经存在追加识别词汇“ゴートウーフニッル”的状态下,考虑作为“スーパー フニット府中ストァ”用的追加识别词汇而“ゴートウーフニッ卜”被表现为候补的情況。 此时,也可根据声音引导询问用户“‘ゴートウ一フニット,与‘ゴートウーフニッル,近似。 是否将‘ゴートウーフニット’追加于声音指令? ”,并且仅在用户判断为追加的情况下进 行追加。[对于重写或多个设施的指定的询问]第2,在类似度高的情况下,也可询问是用与现有的追加识别词汇相同的词汇以指 定新设施的方式进行变更,或是指定多个设施。例如,在名称数据库中,在设施“スーパー フニット国分寺ストァ”中已经存在追加识别词汇“ゴートウースーパーフニッ卜,,(图2A 的观2),有时根据该状态用户会进一歩针对设施“スーパーフニット府中ストァ”追加“ス 一パーフニツト”来作为词汇。这种情况下,根据声音引导向用户询问“‘スーパーフニツ卜,已经在‘7— “一7 二、y卜国分寺7卜7,中使用了。是要以指定‘7— “一7 二、y卜府中7卜7·’的方式进行变更。还是能指定两个设施”。由此,根据用户的选择能够选择下述动作删除“7— ”一 7 二 ”卜国分寺7卜7”的追加识别词汇,在“7— ”一 7 二 7卜府中7卜7”中登记“-. 一卜m—” 二 ”卜,,;或者,在保留“7— ”一 7 二 ”卜国分寺7卜7”的追加识别词汇的情况下,在“7— ”一7 二:y卜府中7卜7”中还登记“:f一卜勺——%————7 二夕卜”。
[追加词汇作为其他设施的识别词汇也适合的情况下的处理]
另外,被表现为候补的追加识别词汇存在着也作为其他设施的追加识别词汇进行使用的可能性。例如,处于图9A的910内的词素组合之中的“ 7 二 7卜”,不仅是用户设定的“7— “一7 二y卜府中7卜7”中的词素,也可是也包含于“7— “一7 二 ”卜国分寺 ^卜7”中的词素。由此,词素组合“7 二 7卜”作为其他设施的声音识别词汇也适合。
因此,针对这种也包含于其他设施中的词素组合,进行降低其重要性的操作。由此,能够向用户提示进一步表现出用户指定的设施的特征的追加识别词汇来作为候补,能够提高可操作性。
[调节设施名词素的重要性,生成用户未输入的词素的换言]
另一方面,通过向设施的词素赋予重要性,使得对于表示该设施名的特征的程度极其强烈的词素有着特别的顾虑。例如,用户为了选择娱乐场地,而假设从通过触摸面板输入“,> 卜‘”而得到的候补之中选定了“東西/ dd / 7 > F" ( “/”表示词素划分) 这样的设施名作为结果。这种情况下,在第1实施方式中,生成了 “,> K”作为追加识别词汇。但是,由于“,> K”这样的词汇在大多数的娱乐场所中都包含,因而认为将“束西”、 “C L· 这样的其他词素作为追加识别词汇进行使用对于用户而言更容易理解。这种情况下,在本实施方式中,若给“東西”、”分配了较高的重要性,则纵使在用户输入的字符串中不包含这些词素,也能将“東西”、“d Π”这样的词汇作为追加识别词汇的候补而提示给用户。
[基于词素的词类的规则]
另外,在本实施例中,将词素的所有组合作为候补来考虑。然而,在该方法中,也生成了“7 二:y h / χ h τ·”这样的不自然的词汇。为了消除这种不自然,也可在生成词素组合时,设置“‘其他’词类的词素,仅在与该词素相邻的其他词素也存在于词素组合内的情况下,在词素组合中使用”这样的基于词类的规则,来抑制这种不自然的生成。
[基于词素的词类的组合的规则]
另外,在考虑词素的组合的情况下,也能够根据该词类的明细来左右其重要性。在这里,设在图2A的名称数据库中,用户输入“7 二 7”,并选择了设施“札幌真駒内e — f ”。
设该设施的各词素的重要性如图7B的表格700那样进行定义。而且,根据步骤810 的处理,用户输入的词素被确定为^ ι ”,,。如750所示,对词素- ι t 4 ”的词素重要性相加0.5。
在步骤820中,组合这些词素,计算与各个词素组合相应的组合重要性。在考虑了词素的组合的情况下,例如“寸7 # π / ^ 二 ^ t 4 ”双方都是地名,认为作为用于确定该设施的词汇对于用户而言较不自然。另一方面,由于“7 ” ” I e — ★ ”包含地名和职业种类双方,因而认为对于用户而言为易于理解的词汇。因此,由于考虑了这些理解容易度,因而在本实施例中进行对不同词类的组合相加词素组合的重要性的操作。
在图9C中示出该计算方法。图9C是表示第2实施方式中的对词素的组合所计算的重要性的表格1800的例子。首先,针对各个词素组合1810,计算修正前的词素组合的重要性。该方法与前述方法相同,将全部词素重要性相加起来之后再除以词素数。其结果,计算为如1820那样。接着,判定各个词素组合1810是否都为不同的词素。其结果成为1830。 例如,由于“寸7笨叫ι ” f八I e —子”包括2个地名,因而判定结果为“否”。另夕卜, 由于“寸y # 口 / Ε — f”是地名和职业种类的组合,且所有词素都不同,因而判定结果为 “是”。在只有一个词素的情况下不进行判断。结果,针对为“是”的结果,对组合重要性相加 0.2。
结果,算出修正后的组合重要性1840。修正后的组合重要性按照从高到低的顺序提示给用户。
由此,通过优先向用户提示不同词类的组合,从而能够提供对于用户而言容易理解的声音识别词汇。
[词素和其他名称数据库的词汇的组合]
另外,在考虑词素的组合的情况下,对于名称之中的词素,也可采取与其他名称数据库中包含的信息的组合。
在这里,在图2A的名称数据库170中,在用户输入“7 二 ^ ”并选择了设施“札幌真駒内Ii 一 f ”的情况下进行说明。
在图8的处理顺序中通过将处理步骤820取代为图IOA的处理步骤1910,来实现该实施例。在图8的步骤820中,生成名称中包含的词素的组合;相对于此,在图IOA的步骤1910中,生成名称中包含的词素与其他名称数据库中包含的信息的组合,并将它们分别视作各自的新词汇组合,来计算组合重要性。
根据图IOB的表格1970,说明具体的处理方法。首先,将名称的词素组合起来,计算与各个词素组合1920相应的修正前的词素组合的重要性1930。该方法与前述方法相同, 将全部词素重要性相加起来之后再除以词素数。接着,根据名称数据库的其他信息,对各个词素组合1920进行补充。在这里,作为例子而考虑通过名称数据库的辅类型、即“海水浴埸i ^ y ^ W i ”、住所中包含的“南区(S f S夕)”进行补充的情况。
根据源词素的组合,例如有如只是“寸7 # 口 ”这样的只有地名的情况。关于这里提及的情况,认为与作为辅类型的“ 7 ^ S > 7 l· 4 7 ”组合起来而将“ 7 4 S > 7 l· ^ ^ # 口”这样的词汇作为追加识别词汇,对于用户而言适合缩减设施。另一方面,关于“ Ε —子”这样的只有职业种类的词素,认为利用住所来使用“ Ε — f 4 > S f笑 ” ”这样的追加识别词汇,对于用户而言适合缩减设施。由此,在这里,在源的词素组合1920 中,在词素中不包含地名的情况下,将利用住所在最后追加“ 4 > S f S々”的组合生成为新词素组合,在词素中不包含职业种类的情况下,将利用辅类型在开头追加“ X $、乂" XX >”的组合生成为新词素组合。另外,在这些情况中的任意一种情况下,都对组合重要性相加0.5。将追加住所的情况下的明细表示为1940,将追加辅类型的情况下的明细表示为1950。最终,词素组合重要性如1960所示那样,能够向用户提示这些词素组合来作为声音识别词汇的候补。由此,能够向用户提供与住所或类型等的其他信息进行组合后的声音识别词汇。
此外,在本实施例中,在用名称数据库的名称以外的信息进行补充的情况下,说明了成为其源的词素组合1920未提示给用户的情况,但是也可向用户提示成为源的词素组合1920和组合重要性1960双方的所有明细。另外,在本实施例中,说明了根据词素的词类的明细来变更基于其他信息进行追加的方法的情况,但是也可采用其他变更方法,或者不变更。
[词素重要性的自动算出]
另外,在本实施例中,进行了从最初向名称数据库赋予词素重要性的假设。为了确定其重要性,考虑根据开发者确定的方法或基于用户调查的方法。另一方面,也可根据文书检索中使用的tf/idf这样的单词的出现次数的算出方法来推定其重要性。
另外,所生成的词汇用于声音识别。为此,考虑由声音识别引起的识别错误的引起容易度,对于易成为识别错误的原因的较短的词汇、或已经存在近似的音素串的词汇等,也可进行降低它们的重要性的动作。
实施例3
参照图11 图13B,说明本发明的第3实施方式涉及的信息检索装置。
首先,在图11中表示该实施方式的信息检索装置100的构成例。在该实施方式中, 其特征在于,在第1实施方式的基础之上设置判定识别词汇生成部190生成的追加识别词汇是哪种种类的词汇类别判定部1110。识别词汇生成部190基于由词汇类别判定部110判定出的追加识别词汇的类别,变更在名称数据库170中登记识别词汇生成部190生成的追加识别词汇的动作的方法,变更将识别词汇生成部190生成的追加识别词汇追加于语言模型存储部150的方法。而且,识别词汇生成部190按照词汇类别判定部1110的判定结果, 变更与名称数据库170、语言模型存储部150相应的追加识别词汇的追加方法。名称数据库 170、语言模型存储部150或辞典300等的构成设为未采用在第1实施方式中说明过的ID编号的方式,但是也可通过采用在第1实施方式的变形例中说明过的ID编号的方式来实现。
[第3实施方式的前提]
作为例子,而假设与第1实施方式同样地,用户输入“ ”二, ”并从设施名候补之中选择了一 ^一7 二?卜府中^卜7”。到此为止的动作与第1实施例相同,故省略其说明。
[表示类型的声音识别词汇]
在图12中示出识别词汇生成部190和词汇类别判定部1110的处理流程。
在步骤1210中,以词素为单位进行用户输入的字符串”二、),,与确定的设施名 ‘U—” 二夕卜府中7卜了”的读音之间的比较。
其结果可知,用户输入字符串“7 二 7 ”是读音“7— ”一 / m I V午工勺 / ^卜7”之中的词素“7 二y卜”的一部分。
在步骤1220中,基于词素来编辑用户输入字符串。在这里,将用户输入的字符串 “ 7 二:y,,延长到相应的词素,而编辑为“ 7 二 ^卜”。将其作为追加识别词汇进行使用。
在步骤1230中,判定通过步骤1220生成的追加识别词汇是哪种类别。在这里,判定追加识别词汇是通常的设施名,还是表示设施的类型的词汇。
作为其判定方法,例如参照图13A所示的词汇判定表格1300,判定追加识别词汇是否存在于表格中。在词汇判定表格中保存了固有赋予给辅类型的编号、即辅类型ID编号1305、辅类型1310、及各辅类型所对应的词汇1320。在这里,在设施类型词汇1320中登记表示设施的某一特定的辅类型的词汇。具体而言,为连锁店名或具有较多分店的企业的名称等。另外,该辅类型对应于名称数据库170存储的属性、即辅类型235。例如,设辅类型 “ ;^ 一 ^一 7 二:y卜”是在全国具有多个店铺的超级市场的连锁店,作为其称呼而为“ 7 二 ”卜”、“7 —/、°一7 二 7卜”这样的广为人知的词汇。因而,在词汇1320中登记这些词汇。
下面,说明使用了处理步骤1230中的图13A所示的词汇判定表格的判定方法。首先,通过参照名称数据库170,可知确定的设施名“力一^一7 二 7卜府中7卜7”的辅类型 235为一”一 7 二 ^卜”。因此,从词汇判定表格中检索辅类型1310为一”一 7 二 ,卜,,的记录。结果可知,所对应的词汇1320是“ ζ — “一 7 二ν卜”和“ 7 二y卜”这2 个。
接着,调查通过步骤1220生成的追加识别词汇是否与所对应的词汇1320之中的其中一个相一致。其结果,追加识别词汇“7 二、y卜”与词汇1320中包含的“7 二 7卜”一致。由此,判定出追加识别词汇为设施类型。
在步骤1240中,根据步骤1230的判定结果进行分支。在追加识别词汇为通常的设施名的情况下,移行到步骤1250。另一方面,在追加识别词汇为设施类型的情况下,移行到步骤1M5。即、通过该分支实现了根据追加识别词汇的类别来变更向名称数据库、语言模型追加的追加方法。
在这里,由于步骤1230中的判定结果为设施类型,因而移行到步骤1245进行说明。
关于从步骤1245到步骤1285的处理,由于追加识别词汇是表示某些设施的类型的词汇,因而以对于用户而言易于使用的方法将其作为指定设施类型的声音识别词汇进行登记。在这里,能够用作在检索设施类型时经常使用的周边设施检索。
在步骤1245中,编辑追加识别词汇。在这里,为了用于通常的设施检索,在开头追力口 “ 一卜力一”而成为“ 一卜,一 7 二、y卜,,。
在步骤1275中,以与步骤1245不同的方法,编辑追加识别词汇。在这里,为了用于周边设施检索,在开头附属“ 二 τ κ 4,,而成为“二 7 κ 4 7 二:y卜”。
以上,在步骤1245和步骤1275中,生成了不同的追加识别词汇。为了便于以后的说明,将通过步骤1245生成的通常设施检索用的追加识别词汇称作“词汇A”,将通过步骤 1275生成的周边设施检索用的追加识别词汇称作“词汇B”。
在步骤1276中,向用户询问使用生成的追加识别词汇之中的哪个词汇。作为询问方法,例如有从输出部再生以下那样的声音应答的方法。
“进行声音指令的设定。
在用‘ -‘一卜々一 7 二V卜,将‘ ζ 一“一 7 二 7卜府中7卜7,设定为目的地的情况下,请按下1 ;
在用‘二 7· K ^ 7 二y卜,检索周边超级市场的情况下,请按下2 ;
在什么也不做的情况下,请按下3。”
在步骤1277中,接受针对步骤1276的向用户的询问的用户的回答,根据该动作进行处理的分支。在这里,假设通过触摸面板的按钮按下来接受针对步骤1276的询问的回答。23
在用户按下了 1的情况下,由于选择了词汇A,因而处理向步骤1260分支。
在用户按下了 2的情况下,由于选择了词汇B,因而处理向步骤1280分支。
在用户按下了 3的情况下,由于哪个词汇都未选择,因而结束处理。
关于以后的处理,首先说明选择了词汇B的情况。
在步骤1280中,进行选择了词汇B的情况下的处理。在这里,根据辅类型235判定作为与用户选定的“力一〃一7 二 7卜府中7卜相同的连锁店的设施,针对所有的同一连锁店的设施,在追加识别词汇属性中追加“二 7 ”二,卜”。其结果,如图2々的观0 所示那样,针对“ 7 — 二 7卜府中7卜7,,、‘‘ U—7 二 ”卜国分寺7卜7 ”这两个词汇而追加了追加识别词汇“二 7 K 4 7 二:y卜”。另外,也可与其一并地,一并登记作为追加识别词汇“二 7 K47 二 7卜”是周边设施检索用的词汇的标志。
在步骤1285中,为使可声音识别追加识别词汇“二 7 K ^ 7 二:ν卜”,而存储于语言模型存储部(图3Α的350、图;3Β的355)。另外,也可与其一并地,一并登记管理作为“二 7 K 4 7 二y卜”是追加识别词汇、且是周边设施检索用的词汇的标志。
说明在这些步骤1280和步骤1285的动作之后用户声音输入“ 二 7 K ^ 7 二:ν卜” 的情况下的动作。假设用户的声音,在声音输入部120中被变换为数字信号之后,由声音识别部130被变换成字符串,然后输出“二 τ· K 4 7 二 7卜”。结果被输入到检索部160。
在检索部160中,比较声音识别结果和名称数据库170。其结果,作为候补而列举 具有“二 7 7 二:y卜,,为追加识别词汇的u — 二”卜府中ζ卜τ· ”、“ ζ — ”一 7 二夕卜国分寺7卜7 ”。
另外,由于这些是周边设施检索用的词汇,因而与车载导航的当前位置进行比较, 判定是否是列举为候补的设施作为周边设施也适合的这种程度距离。其结果,被判定为周边设施的结果被送到输出部,并进行车载导航的规定动作、即地点的候补选择画面及地图的显示、路径搜索等的动作。
[被选择为表示通常的设施名的声音识别词汇的情况]
接着,说明在处理步骤1276中用户按下1而选择了词汇A的情况。这种情况下, 处理移行到步骤1260。
步骤1260和步骤1270的处理是追加识别词汇为通常的设施名的情况下的处理。 该处理方法与第1实施方式几乎相同。
在步骤1260中,向名称数据库赋予所生成的追加识别词汇。在这里,与第1实施方式同样地,给用户选定的一 ^一7 二?卜府中^卜7 ”的追加识别词汇属性赋予词汇 A的“ 一卜々一 7 二 7卜”。其结果如沈0所示那样进行附加。
在步骤1270中,为使可识别追加识别词汇“ 一卜々一 7 二:ν卜”,而存储于语言模型存储部。另外,也可与其一并地,一并登记管理作为“ 一卜々一 7 二 ^卜”是追加识别词汇、且是通常的设施指定用的词汇的标志。
说明在这些动作之后用户声音输入“ :f 一卜々一7 二:V卜,,的情况下的动作。假设用户的声音,在声音输入部120中被变换成数字信号之后,由声音识别部130被变换成字符串,然后输出字符串“5—卜rn、乂卜”。其结果被输入到检索部160。
在检索部160中,比较声音识别结果和名称数据库170。其结果可得到具有“ 一卜々一 7 二夕卜”为追加识别词汇的“ ζ — ”一 7 二y卜府中ζ卜7 ”。
然后,从输出部输出“将目的地设定为一 ^一7 二?卜府中^卜7’”这样的声音应答,且进行地图显示或路径搜索等的车载导航的规定动作。
[仅生成表示通常的设施名的声音识别词汇的情况]
说明本实施方式的其他动作。在这里,假设用户从触摸面板400输入“ 7 二 ^卜 7”,并从设施名候补之中选择了一 ^一7 二^7卜府中^卜7”。到此为止的动作,由于与第1实施例相同,因而省略其说明。
在图12中表示识别词汇生成部190和词汇类别判定部1110的动作流程。
在步骤1210中,以词素为单位进行用户输入的字符串“7 二 7卜与确定的设施名“义一“一7 二y卜府中ζ卜了”之间的比较。
其结果可知,用户输入字符串“7 二 ,卜7”在“7— ”一 / 7 二:V卜/ 7子二々 / ^卜7”之中,包含于“7 二、y卜”禾口“7子-々”内。
在步骤1220中,基于词素来编辑用户输入字符串。在这里,将用户输入的字符串 “7二7卜7”延长到相应的词素,而编辑为“7二7卜7 々”。将其作为追加识别词汇进行使用。
在步骤1230中,判定通过步骤1220生成的追加识别词汇是哪种类别。在这里,判定声音识别词汇是通常的设施名还是表示设施类型的词汇。
在该判定中,如已经说明过的那样,使用图13A所示的词汇判定表格来进行判定。 具体而言,首先,由于确定的设施“7— ”一7 二 7卜府中7卜7”的辅类型235为“7— " 一 H卜”,因而从辅类型1310中搜索一”一7 二 ^卜”。接着,调查所生成的追加识别词汇是否与一一 7 二?卜”所对应的词汇1320之中的其中一个词汇相一致。其结果,“ 7 二:ν卜7 々”与词汇1320之中的哪个词汇都不一致。由此,判定出追加识别词汇是通常的设施名的一部分。
在步骤1240中,根据步骤1230的判定结果进行分支。在这里,由于追加识别词汇是通常的设施名,因而将处理移行到步骤1250。
从步骤1250到步骤1270的处理为声音识别词汇是通常的设施名的情况下的处理。该处理方法与第1实施方式几乎相同,但是在这里,增加了用户选择是否使用该词汇的处理。
在步骤1250中,编辑追加识别词汇。在这里,为了用于通常的设施检索,在开头追加一卜々一 ”而成为一卜々一7 二y卜7千工勺”。另外,为了便于说明,将该词汇称作“词汇A”。
在步骤1252中,询问用户是否使用所生成的追加识别词汇。作为询问方法,例如有从输出部再生以下那样的声音应答的方法。
“进行声音指令的设定。在如是否用一卜m卜7子二々,将‘7— “ 一7 二 7卜府中7卜7·’设定为目的地?这样的设定的情况下,请按下1 ;在未设定的情况下,请按下2。”
在步骤12M中,接受针对步骤1252的向用户的询问的用户的回答,根据该动作进行处理的分支。在这里,假设通过触摸面板的按钮按下来接受针对步骤1252的询问的回答。
在用户按下了 1的情况下,由于选择了词汇A,因而处理向步骤1260分支。25
在用户按下了 2的情况下,由于未选择词汇,因而结束处理。在步骤1260和步骤 1270中,将生成的追加识别词汇(词汇A)追加于名称数据库的追加识别词汇属性250。由于该方法已经进行过说明,因而省略其详细说明。
作为其结果,若用户声音输入一卜m卜7子二々”,则检索部160将 m—y 二、y卜府中7卜7·”作为候补进行输出,并进行地图显示或路径搜索等的车载导航的规定动作。
以上,通过本实施方式,能够根据用户输入的词汇的性质来变更追加识别词汇的使用方法。由此,能够提高用户的可操作性。
在本实施方式中,以判定是否是设施的类型并利用其结果来进行周边设施检索的动作的例子进行了说明。此外,也认为在车载导航的初始设定时刻可识别所有的类型。然而,由于连锁店等的设施类型名较为庞大,因而有着作为识别对象的词汇的增加、识别率的下降这样的副作用。为此,如本实施方式所示那样,通过使用用户为了实际检索而输入的字符串,从而能够缩减用作识别词汇的词汇,从而涉及到识别率的提高及可操作性的提高。
在本实施方式中,进行了追加识别词汇是设施的类型且除此之外只是通常的名称这样的分支,但是也可进行除此之外的多个分支。
另外,在本实施方式中,参照图13A所示的表格,根据是否存在词汇进行了判定。 然而,也可采用其他的能自动算出的信息。例如,也可根据基于词素的各设施名中含有的频度的方法等来判定词汇的类别。
另外,通过设置向用户确认追加识别词汇的使用方法的处理,从而能够进一步提供是否是用户期望的声音识别功能。
[基于用户输入字符串的词类的判定]
另外,也可根据比较用户从触摸面板输入的字符串和词素的结果,判定用户输入字符串是哪种词类,并基于此来改变动作。例如,用户输入“7 的结果,选定了词素是 ”千” ”、且其词类是地名这样的结果。由此,推测出对于用户而言“ ”工力”这一词汇作为地名的熟识度较深。利用该结果,例如也可在车载导航的住所检索中进行能够识别为”千工力”这一词汇的动作、或者与其他词汇相比提高识别容易度的动作。
[表示多个设施的语言模型的对应ID的赋予]
此外,在本实施例中,作为检索方法以下面情况为前提进行了说明以作为声音识别结果而得到的字符串为关键字,来检索名称数据库的读音、追加识别词汇。作为该检索方法,与在实施例1中说明的时候同样地,能够应用基于全部检索的方法及采用了索引的方法。
另外,与实施例1同样地,也可应用下述方法预先将所对应的设施的ID编号追加于语言模型存储部的辞典300中,并参照该ID编号来生成相应的设施作为候补。然而,在检索连锁店名的情况下,由于针对一个识别结果而言对应多个设施,因而需要将ID编号向语言模型存储的存储方法变更为实施例1的存储方法。在这里,对其方法进行说明。
第1个列举的方法为,在语言模型存储部中登记追加识别词汇之际,在对应ID编号330中登记多个ID编号。具体而言,如在实施例中说明过的那样,在根据词汇“二 7 〃 4 7 二 7卜”来检索与辅类型“ 7 — ^一 7 二 ,卜”相当的设施的情况下,在语言模型存储部的辞典300中作为图3A的单词“二 7 K ^ 7 二:ν卜”的对应ID编号330,只要登记多个“0200、0201”即可。然而,在该方法中,如图2A所示的名称数据库那样,在辅类型“力一〃 一 7 二 7卜”所属的设施较少为2件的情况下能够应用,但是在倘若如几百件那样存在多件的情况下,却存在着在语言模型存储部中保存的ID编号会变多这样的问题。
作为第2个方法为,作为语言模型中存储的对应ID编号,预先登记固有赋予给各辅类型的辅类型ID编号的方法。首先,根据图1 所述的表格1302的样式,预先记录辅类型ID编号和与其对应的设施的ID编号的关系。另外,在语言模型存储部的辞典300中,如图3C所示,记录单词“二 7 K 4 H卜”的对应ID编号“50001”。倘若识别结果是“二 7 κ 4 7 二y卜”,则检索部根据对应ID编号“50001”,参照图13B的表格1302,读取所对应的设施的ID编号,从名称数据库中探索具有该ID编号的设施,作为候补而生成。在该方法中,需要准备图13B所示的表格。可是,为了用于在车载导航中一般使用的类型指定的设施检索,大多情况将类型与实际的设施的对应关系作为索引来准备。由此,既可以重新利用该索引,也可以不用重新生成。因而,既能将语言模型存储部的容量抑制得较小,又能高速地检索。
[追加识别词汇的换言语的追加]
另外,在本实施例中,说明了加工用户输入的字符串的长度来作为追加识别词汇进行使用的情况。然而,作为追加识别词汇进行使用的词汇,纵使以字符串为单位不与用户输入的词汇一致,也可以采用在意思上关联性较深的换言语。例如,“力一 ^一 7 二^7卜府中7卜Τ" ”中使用的辅类型的语言“ 7 二 7卜”,有时对于人类而言完全被称作其他称呼了。将该其他称呼表示为换言语。在这种情况下,如果作为追加识别词汇,不仅将“7 二夂卜”追加于名称数据库和语言模型中,还将换言语一并地追加于名称数据库和语言模型中, 则即便在用户以换言语发声的情况下,也能将其设施作为候补而生成。
实施例4
参照图1、图14 图19,说明本发明的第4实施方式涉及的信息检索装置。名称数据库170、语言模型存储部150或辞典300等的构成设为采用在第1实施方式的变形例中说明过的ID编号的方式,但是也可通过未采用ID编号的方式来实现。
在本实施方式中,说明在名称数据库170中存在多个用户可检索的属性的情况。 另外,也对在检索时输入多个查询的情况进行说明。
在该实施方式中,假设导航系统的乐曲再生功能,以进行用于此的乐曲检索的使用方法进行说明,但是作为用途,也可在与导航系统独立的音频系统中进行乐曲检索或再生。
在图14中示出乐曲检索中的名称数据库170的例子。在名称数据库170中存储了车载导航能再生的乐曲的一览。在名称数据库170的1个记录中存储了 1个乐曲的信息。 另外,作为乐曲的属性,能够使用作为固定赋予给各乐曲的编号的ID编号1405、艺术家名字1410、唱片册名1420、乐曲名1430、作曲者名1440、及保存乐曲的解说等的说明1450。除此之外,也可以具有作词者名、乐曲的类型等。另外,各个记录不需要针对所有属性而言都具有值,可以仅对一部分属性具有值。
另外,在图14所示的名称数据库170中,假设仅对一部分属性赋予了值,但却对各个值都赋予了读音及词素划分。另外,虽然在图14中未示出,但是设也定义了词素的词类。
在选择这些乐曲之际,可以利用声音识别。然而,若乐曲中含有大量信息,并将所CN 102549652 A有信息作为声音识别词汇进行使用,则可能会导致识别率的下降及处理时间的增加。因此, 作为前提而假设在检索乐曲时的语言模型150中,连名称数据库中也仅存储唱片册名1420 中含有的词汇,并设作为用户的声音输入而仅容许基于唱片册名的指定。在图17中示出已登录于语言模型150的辞典300的明细。单词标签1710和音素串1720仅针对唱片册名进行准备。另外,除了登记唱片册名的正式名之外,还登记好发声的部分字符串(例如“夕少八夕”)。由此,即便在用户仅发声为“夕少^夕”的情况下,也能够选择唱片册“七夕- > 寸一卜”。另外,预先给各单词赋予对应ID编号1730。作为该ID,在图14的名称数据库中预先存储赋予给乐曲的ID编号。由于一般情况下在1个唱片册中收录有多个曲目,因而所存储的对应ID编号也为多个。然而,也可采用按唱片册赋予固有ID编号,并存储赋予给唱片册的ID编号的方式。
此外,虽然省略了语法,但是设以与图:3B的连结规则360同样的方式,采用图17 的辞典300的各个单词的能单独处理发声的有限状态语法。
在该名称数据库170中,与第1实施方式同样地,由操作输入部110接受用户的触摸面板输入,并利用其结果来检索名称数据库。
例如,假设用户通过触摸面板输入“ 二二,”。
该字符串被送到检索部160。在检索部160中,在名称数据库170之中的艺术家名字1410、唱片册名1420、乐曲名1430、作曲者名1440、说明1450及追加识别词汇1460中进行检索。其结果,在其中一个的属性的值中包括“二二,”的乐曲的共计3曲被作为候补而生成。
该检索结果被送到输出部180,由图15所示的画面400向用户显示候补为3曲。 在显示区域1510中显示用户输入的字符串。在候补显示区域1520中显示成为候补的曲目的属性和值。
受其影响,用户选择了自己要听的乐曲。例如,在这里假设用户选出乐曲名“ > 夕一 7 口 Λ 二T,7”,并按下触摸面板。该按下动作经由操作输入部110被处理。由此,执行再生乐曲这样的在车载导航中作为音频的规定动作。
接着,说明在该一连串操作之后识别词汇生成部190和词汇类别判定部1110进行的动作。在图16中示出处理顺序。
在步骤1610中,以词素为单位进行用户输入的字符串“二二,”与在确定的乐曲中包括用户输入的字符串的属性的值之间的比较。在这里,用户输入“二二,”的结果,选择了乐曲名和用户输入一致的乐曲“ ^夕一7 口 Λ 二τ,7”。由此,以词素为单位进行两者之间的比较。其结果可知,用户输入字符串“二 ^,”是读音“ > 夕一/7 口 Λ / 二V之中的词素“二二 y ν的一部分。
在步骤1615中,基于词素来编辑用户输入字符串。在这里,将用户输入的字符串 “二二,”延长到相应的词素,而编辑为“二 ”卞”。将其设为追加识别词汇。
在步骤1620中,进行通过步骤1615生成的追加识别词汇的判定。在这里,作为判定方法,而利用包含追加识别词汇的属性,并将其属性作为判定结果。由此,判定结果成为乐曲名ο
此外,纵使不采用该方法,也可通过其他方法来判定属性。例如,利用名称数据库的各属性中包含的词素的频度信息,预先生成绝对频度或相对频度高的词素的一览。接着,也可调查追加识别词汇属于该一览之中的哪个属性,并将其结果作为判定结果。
在步骤1630中,根据步骤1620的判定结果进行分支。由于判定结果是乐曲名,因为处理移行到步骤1635。
在步骤1635中编辑追加识别词汇。在这里,为了适用乐曲名的选择,在最初追加 “ U 7 7 >卜々一”而成为“ U 7 7 >卜々一二 ZT,7 ”。此外,该追加方法也可是其他方法。 例如,也可在乐曲名的开头附加“二二 7 7”的情况下,如“ U 7 7>卜々一二^,7寸么*那样,使用追加识别词汇在记录的值的字符串之中出现在什么位置的方法,在乐曲名的末尾附加“二- 7义,,的情况下,如“1」夕7 >卜々一寸Λ〉W 二τ 7义,,那样,使用追加识别词汇在记录的值的字符串之中出现在什么位置的方法。
在步骤1640中,在名称数据库之中的用户选择的“ > 夕一7 口 A 二 -,的追加识别词汇属性1460中追加“ ^ 7 7 >卜々一二 -,7 ”。在名称数据库170的1470中示出该追加方法。
在步骤1645中,为使可识别追加识别词汇“ U 7 7 >卜々一二 -,7 ”,而存储于语言模型存储部。在图17的1740中示出辞典300中的追加样式。另外,在对应ID编号 1730中记录所对应的乐曲“ > 夕一7 口 Λ二 -,的名称数据库中的ID编号。关于语法中的追加,也与图3Β中的连结规则的追加同样地,并排登记于现有的语法通路中。
在步骤1670中,将生成的追加识别词汇及其属性和实际选择的值为何值的对应关系,保存于在信息检索装置100的存储部中设置的追加识别词汇存储部。在图18中示出在信息检索装置100的追加识别词汇存储部中实际保存的表格2000的例子。在该处理中, 如表格2000的2030所示那样,在属性2010对应于“乐曲名”的追加识别词汇2020中,追加通过步骤1615生成的词汇“二二 W,。另外,与其一并地,也与包含追加识别词汇“二二 ,7 ”的值、即乐曲名“ > 夕一 7 口 A 二 ^,7 ”相对应地进行保存。在图18的表格2000 中,以(追加识别词汇)(值)这样的格式来表示追加识别词汇和值的关系。
说明在这些一连串动作之后用户声音输入“ U ^ 7 >卜々一二 -,7 ”的情况下的动作。假设用户的声音,在声音输入部120中被变换成数字信号之后,由声音识别部130 被变换成字符串,然后输出“U ^ ;^ >卜々一二二,7”。其结果被输入到检索部160。
在检索部160中,比较声音识别结果和名称数据库170。其结果作为候补而列举 具有“丨J夕7 >卜々一二 -,7 ”为追加识别词汇的乐曲“l·夕一7 口 Λ 二 -,7”。
另外,作为检索部160选择乐曲的方法也可为,参照赋予给追加识别单词“ U ” ^ >卜々一二 ZT,7”的对应ID编号“0004”,在名称数据库中选择ID编号一致的乐曲“ ^夕一7口 Λ 二ι,义”的方法。
然后,其结果被送到输出部,进行车载导航的音频再生等的动作。
另一方面,说明用户输入字符串“ 二二,”,最终选择艺术家名字“ 二二,^ ”的其中一个曲目的情况。
这种情况下,在步骤1610和步骤1615中进行与刚才相同的动作,提取追加识别词汇“二 - ”,,。
在步骤1620中,判定通过步骤1615生成的追加识别词汇的属性。作为判定结果, 输出包含追加识别词汇的值所对应的属性。由此,判定结果为艺术家名字。
在步骤1630中,按照步骤1620的判定结果进行分支。由于判定结果是艺术家名字,因而处理移行到步骤1650。
在步骤1650中,编辑追加识别词汇。在这里,为了适用艺术家的选择,在最初追力口“丨J夕叉父卜々一笑工一夕夕夕才义”而成为“ V夕叉父卜々一笑工一夕夕夕才歹二 -,7”。
在步骤1655中,针对名称数据库170之中的艺术家名字为“二二 7力”的所有曲目,在追加识别词汇属性1460中追加追加识别词汇“ 7 7 >卜々一 S 二一夕7夕才7·· 二 ”、”。在名称数据库170的1480中示出该追加方法。
在步骤1660中,为使可识别追加识别词汇“〗J 7 7 >卜々一 S 二一夕7夕才7·· 二二 ^力”,而存储于语言模型存储部。在图17的1750中示出追加于辞典300的样式。此时, 在对应ID编号1730中记录艺术家为“二二,^ ”的曲目的名称数据库中的ID编号。
在步骤1670中,将生成的追加识别词汇、包含追加识别词汇的属性、和包含追加识别词汇的值之间的对应关系,保存于追加识别词汇存储部。在该处理中,如图18的表格 2000的2040所示那样,在属性2010对应于“艺术家名字”的追加识别词汇2020中,将通过步骤1615生成的追加识别词汇“ 二”卞”和成为检索对象的值的“ 二”卞”相对应地进行追加。
说明在这些一连串动作之后用户声音输入“〗J 7 7 >卜々一彡二一夕?夕才7·· 二二 y 7”的情况下的动作。假设用户的声音,在声音输入部120中被变换成数字信号之后,由声音识别部130变换成字符串,然后输出“ ·」7 7 >卜々一、々二一夕7夕才7·· 二 -,7,,。 其结果被输入到检索部160。
在检索部160中,比较声音识别结果和名称数据库170。其结果作为候补而列举 具有“丨J夕7 >卜々一笑工一夕才7·· 二- 7义,,为追加识别词汇的2个乐曲。
另外,作为检索部160选择乐曲的方法也可为,参照赋予给声音识别结果“ 'J ” ^ >卜勺一 \工一々、y ”大1 二二力7”的对应ID编号“0001、0002”,在名称数据库170中选择ID编号一致的2个乐曲的方法。
然后,结果被送到输出部。并且,进行用户选择或乐曲再生等的动作。
另外,即便是其他属性也可以进行同样的处理。在步骤1661、步骤1662和步骤 1663中,记载了步骤1630中的属性的判定结果是作曲者名的时候的声音识别词汇的追加。
例如,说明用户输入为作曲者名的一部分“t夕”,并最终选择了作曲者名“日立太郎”的其中一个曲目的情况。
这种情况下,在步骤1610和步骤1615中,进行与刚才相同的动作,提取追加识别词汇“匕夕子,,。
在步骤1620中,进行通过步骤1615生成的追加识别词汇的属性的判定。其结果, 判定结果为作曲者。
在步骤1630中,按照步骤1620的判定结果进行分支,将处理移行到作曲者名的处理、即步骤1661。
在步骤1661中,编辑追加识别词汇。在这里,为了适用作曲者名的检索,在最初追力口“丨J夕叉父卜々一笑工一夕夕夕;!父水。一文K八λ ”而成为“ V夕叉父卜々一笑工一夕夕夕2父水。一文F 4匕夕千”。
在步骤1662中,针对名称数据库之中的作曲者名是“日立太郎”的所有曲目,在名26/28 页称数据库170的追加识别词汇1460中追加了生成的词汇“ U 7 ;^ >卜々一 S -—夕7夕->水。一文F八4匕夕子,,(省略图示)。
在步骤1663中,为使可识别追加识别词汇“ U 7 7 >卜々一 S 二一夕7夕二 >求一<卜^ 4 夕★ ”,而存储于语言模型存储部。此时,在对应ID编号1730中记录作曲者名是“日立太郎”的曲目的名称数据库中的ID编号。
在步骤1670中,将生成的追加识别词汇、包含追加识别词汇的属性、和包含追加识别词汇的值之间的对应关系,保存于追加识别词汇存储部。在该处理中,如图18的表格 2000的2050所示那样,在属性2010对应于“作曲者名”的追加识别词汇2020中,追加通过步骤1615生成的追加识别词汇“t夕和其值的“日立太郎”的组合。
若在这些一连串动作之后用户声音输入“ U ^ 7 >卜々一彡二一夕?夕- >求一文卜。q t夕子”,则能够选择作曲者名“日立太郎”的曲目。
根据以上的实施,由于能在考虑用户为了检索而输入的字符串在实际中是哪种属性的信息的基础上生成声音识别词汇,因而能够提供与用户知识相匹配的易于使用的声音识别词汇。
[使用了多个追加识别词汇的检索]
接着,说明通过组合在用户使用的历史记录之中蓄积的追加声音识别词汇来进行更详细的检索的方法。
的曲目
个曲目
目。
假设连续进行在第4实施方式中说明过的3个用户输入的情况。 即,假设连续进行下述⑴ ⑶的情况。(1)用户通过触摸面板输入“二^,”,并选择乐曲名是“ > 夕一 7 口 Λ二χ,义,,(2)用户通过触摸面板输入“二二,”,并选择艺术家名字是“二二 7力”的其中一(3)用户通过触摸面板输入“t夕”,并选择作曲者名是“日立太郎”的其中一个曲这种情况下,追加识别词汇存储部中的数据如图18所示那样处于下述状态在 “乐曲名”属性中存储了追加识别词汇“二二 7力” Q030),在“艺术家名字”属性中存储了追加识别词汇“二 ”、” (2040),在“作曲者名”属性中登记了追加识别词汇“ t夕千” (2050)。
接着,识别词汇生成部190参照在追加识别词汇存储部中保存的追加识别词汇, 为使即便组合发声多个追加识别词汇也可检索,而进行名称数据库的编辑和语言模型存储部的编辑。
利用图19说明此时的识别词汇生成部190的处理。
在步骤2110中,生成在追加识别词汇存储部中存储的追加识别词汇的组合。作为生成该组合时的规则,能够采用各种规则,在这里采用下述基准的规则。
·组合属性不同的追加识别词汇。
·从组合生成中排除乐曲名属性。
根据该方法,作为组合而生成了 2040和2050的组合。S卩、为(属性=艺术家名字, 追加识别词汇=“二 -,7”,值=“二 -,V)与(属性=作曲者名,追加识别词汇=“匕31夕子”,值=“日立太郎”)的组合。作为组合数而为1个。
在步骤2115中,调查在通过步骤2110生成的组合中是否存在能检索的记录,删除 1件也无法检索到的组合。这种情况下,存在通过步骤2110生成的组合数为1个,且艺术家名字是“二- 7 ^”,作曲者名是“日立太郎”的乐曲(ID编号“0002”的乐曲)。由此,不删除组合,将处理移行到步骤2120。
在步骤2120中,判定经过步骤2115的处理而剩余的组合数是否为1个以上。此时由于为1个,因而处理移行到步骤2130。倘若为0个,则结束处理。
在步骤2130中,使用组合生成作为新识别词汇的组合识别词汇。在生成组合识别词汇的过程中,预先准备与构成组合的属性相应的模板。作为该模板,设基于用户发声较自然的词序而准备几个。例如,作为模板的例子而准备下述那样的模板
(1) “丨J夕7 >卜々一 /笑工一J夕夕才7..(艺术家名字)/ 二 >水。一文F八4(作曲者名)”;
(2)“丨」夕7 >卜々一 /笑二一夕夕夕才7··(艺术家名字)/ ^ > (乐曲类型名)。
在其中一个模板中通过应用构成组合的追加识别词汇,来生成组合识别词汇。这里提及的属于组合的属性是艺术家名字和作曲者名。由此,使用⑴模板,在(作曲者名)、 (艺术家名字)中分别插入事先生成的追加识别词汇(分别为“ t夕千”、“二二 7力”),而生成以下的组合识别词汇。
“ V夕叉父卜々一笑工一夕夕夕才"Ζ 二 -,^ -父水。一文F 4匕夕手”。
在步骤2140中,将通过步骤2130生成的组合识别词汇追加于所对应的名称数据库的记录的追加识别词汇属性。具体而言,由于对应于ID编号“0002”的曲目,因而如图14 的名称数据库所示的1490那样进行追加。在该说明中,在检索对象的乐曲只有1个的情况下进行了说明,但是也可在存在多个的情况下针对各个乐曲进行追加。
在步骤2150中,为使可识别组合识别词汇"1J 7 7 >卜々一 S 二一夕7夕才7·· 二 ””〉水。一* K A ^ t夕子”,而存储于语言模型存储部。此时,在对应ID编号1730 中记录作为检索对象的乐曲的ID编号“0002”。
若在这些一连串动作之后用户声音输入“丨J 7 7 >卜々一彡二一夕7夕才7·· 二-7 ^ ^ >水。一 < KK^ t夕子”,则能够选择作曲者名是“日立太郎”且艺术家名字是“二二 ,义”的曲目。
根据以上的实施,即便在用户要以多个条件进行检索的情况下,也可通过用户的自然措辞来进行检索。
[向多个属性的展开]
此外,在第4实施方式的处理步骤1620中的判定中,虽然在上述将包括用户的输入字符串的1个属性作为判定结果,但是也可利用多个属性作为判定结果。
例如,考虑用户输入字符串“二二,”、且用户从候补中选择了乐曲“ ^夕一7 口 K 二” 的情况。这种情况下,在上述的实施例中,进行了针对乐曲“ ^ H 口 Λ 二 -7义”进行追加识别词汇“ U夕7>卜々一二二,义”的处理。
然而,通过步骤1615而得到的声音识别词汇“二二 7 ^ ”,除了包含于乐曲名中之外,大多情况下还包含于艺术家名字中。由此,认为“二二 7力”这一词汇并不限于乐曲名、 艺术家名字,也可以是对于用户而言易于理解的词汇。另外,有时也会如选择的乐曲是在乐曲名中也包含“二二 7 且艺术家名字也是“二二 7 的乐曲那样,存在输入字符串与1 个记录的多个属性一致的情况。
在此情况下,并不限于乐曲名,即便在艺术家名字的选择中,使用了“二二 7力”这一词汇的可操作性良好。
说明考虑此情况的处理。首先,在结束了针对乐曲名属性的通常的处理步骤1635、 1640、1645之后,进行针对艺术家属性的处理步骤1650、1655、1660。其中,步骤1655的处理根据图16记载的方法变更。即、从名称数据库的所有乐曲中搜索艺术家名字是“二- 7 ^,,的乐曲,给各个乐曲的追加识别词汇属性赋予“ ·」7 7 >卜々一 S三一夕7々才义二-7义”。
由此,若用户发声“ U夕7 >卜々一二 -,7,,,则能检索乐曲“l·夕一7 口 Λ 二 -7 7”,另外,若用户发声"1J 7 7 >卜々一 S工一J, ”才7·· 二- 7 7”,则能检索艺术家名字是“二二 7 V的曲目。
[用户的字符串输入中的多个条件的利用]
另外,在本实施例中,在假设最初用户从触摸面板等输入的查询为1个的情况下进行了说明。但是,即便在字符串输入中输入多个查询也能实施。例如,假设用户输入“ 一卜一”和“ Λ—”这2个字符串,并检索了具有双方字符串的乐曲(“与”检索)。其结果, 假设选择了作曲者是一卜一O”且乐曲名是“ A— >,^卜”的乐曲。此时,也可采用下述方法,即将“《一卜一 >”作为作曲者选择用的声音识别词汇进行使用,将“ A —4卜”作为曲名选择用的声音识别词汇进行使用。
[多个终端构成]
另外,本实施例中表示了单一终端的实施。然而,它们也可是基于不同终端的组合。具体而言,在乐曲名检索中公知一种例如在个人电脑上通过键盘进行输入来检索乐曲的使用方法。在这里,记录为了检索而输入的字符串和最终选择的乐曲之间的对应关系。另外,按照本说明书的实施方式来生成各乐曲用的追加识别词汇。
接着,考虑用用车载导航或便携音频设备等的组合设备听在个人电脑上检索到的乐曲的情况。此时,除了乐曲的数据之外,追加识别词汇也同时组合到信息中而移交给组合设备。由此,在组合设备中用户选择乐曲的情况下,能够通过声音输入追加识别词汇来进行指定。
本实施方式有助于,在易于键盘输入的个人电脑中进行键盘输入,在触摸面板等变小的组合设备中以声音的方式进行输入等的区分使用,且提高可操作性。
在本说明书中,以车载导航中的设施检索及乐曲检索为例说明了本发明的实施方式,当然本发明也能在除此之外的一般的信息检索设备的用途中使用。
另外,也可组合使用本说明书中的各实施方式。
-符号说明-
100-信息检索装置;110-操作输入部;120-声音输入部;130-声音识别部; 140-音响模型存储部;150-语言模型存储部;160-检索部;170-名称数据库;180-输出部; 190-识别词汇生成部;300-语言模型的辞典;400-触摸面板;700-定义了词素的重要度的表格;900-表示组合重要性的表格;1000-显示画面;1110-词汇类别判定部;1300-词汇判定表格;2000-追加识别词汇存储部所保存的表格。
权利要求
1.一种信息检索装置,其特征在于具备名称数据库,其以记录为单位登记了一个以上的所述记录,该记录将成为检索对象的一个以上的属性和作为与各个所述属性相应的内容的值相关联地保存; 操作输入部,其接受用户的操作输入; 声音输入部,其接受所述用户的声音输入; 声音识别部,其将从所述声音输入部得到的声音识别为字符串; 音响模型存储部,其存储在所述声音识别部中参照的音响数据; 语言模型存储部,其将在所述声音识别部中识别的词汇和该词汇的连结规则作为语言模型进行存储;检索部,其利用从所述操作输入部或声音识别部输入的输入字符串,检索在所述名称数据库中包含的所述属性的所述值,并将在该值中包含所述输入字符串的所述记录作为候补来生成;输出部,其将由所述检索部生成的所述记录的候补作为检索结果来输出; 选择单元,其选择所输出的所述记录的候补;和识别词汇生成部,其接受由所述选择单元进行的所述记录的选择结果,生成作为应该追加于所述语言模型的声音识别词汇的新追加识别词汇,所述识别词汇生成部将所述输入字符串所对应的所述追加识别词汇和选择出的所述记录的对应关系记录于所述名称数据库或所述语言模型。
2.根据权利要求1所述的信息检索装置,其特征在于,所述识别词汇生成部在由所述选择单元选择出的所述名称数据库的记录中,将所述追加识别词汇作为所述属性的一个属性进行登记;将所述追加识别词汇追加于所述语言模型存储部。
3.根据权利要求1所述的信息检索装置,其特征在于,识别词汇生成部生成的追加识别词汇是从操作输入部输入的字符串。
4.根据权利要求1所述的信息检索装置,其特征在于,在所述语言模型存储部存储的各个词汇中,一并存储有表示所对应的所述名称数据库的所述记录的标识符,所述声音识别部将识别出的所述词汇与识别出的该词汇所对应的标识符一并输出, 所述检索部参照对所述声音识别部输出的词汇赋予的所述标识符,将具有与所述名称数据库的标识符相同的标识符的记录作为候补来生成,所述识别词汇生成部基于所述检索部的输出而生成所述追加识别词汇, 以组合了所述名称数据库中的选择出的所述记录所对应的标识符和生成的所述追加识别词汇的形式,将所述追加识别词汇追加于所述语言模型存储部。
5.根据权利要求1所述的信息检索装置,其特征在于,所述检索部在从所述声音识别部输出了所述追加识别词汇的情况下,将包括该追加识别词汇的所述名称数据库的记录包含于所述检索结果中。
6.根据权利要求1所述的信息检索装置,其特征在于,所述检索部在从所述声音识别部输出了多个所述追加识别词汇的情况下,根据从所述声音识别部输出的各个所述追加识别词汇来检索所述名称数据库的追加识别词汇属性并生成记录的候补组,仅将存在于通过各个所述追加识别词汇的检索而得到的所述记录的候补组之中的任何候补组中的记录作为检索结果进行输出,或者将存在于通过各个追加识别词汇而得到的记录的候补组之中的至少一个候补组中的记录集合后的记录集合作为检索结果进行输出。
7.根据权利要求1所述的信息检索装置,其特征在于,所述识别词汇生成部将通过规定的方法编辑从所述操作输入部输入的字符串的结果作为所述追加识别词汇来使用。
8.根据权利要求7所述的信息检索装置,其特征在于,所述识别词汇生成部将基于对所述名称数据库已登记的各属性的值中存储的字符串进行分割后的词素的单位编辑从所述操作输入部输入的字符串的结果,作为所述追加识别词汇来使用。
9.根据权利要求1所述的信息检索装置,其特征在于,所述识别词汇生成部基于从所述操作输入部输入的字符串和选择出的所述记录的比较,通过组合对由所述选择单元选择出的所述记录的属性中存储的值的字符串进行分割后的词素,来生成一个或多个所述追加识别词汇。
10.根据权利要求9所述的信息检索装置,其特征在于,所述识别词汇生成部通过组合对由所述选择单元选择出的所述记录的属性中存储的值的字符串进行分割后的词素,来生成一个或多个所述追加识别词汇,基于所述词素的种类来决定所采用的所述追加识别词汇。
11.根据权利要求9所述的信息检索装置,其特征在于,向对由所述选择单元选择出的所述记录的属性中存储的值的字符串进行分割后的所述词素,赋予在各词素的单位或者各词素的种类的单位中表示重要性的值;所述识别词汇生成部通过组合对由所述选择单元选择出并作为所述记录的值存储的字符串进行分割后的所述词素,来生成一个或多个所述追加识别词汇;所述识别词汇生成部基于所述词素的重要性算出各个所述追加识别词汇的重要性,按照该追加识别词汇的重要性越高越包含于所述声音识别词汇的候补中的方式生成该追加识别词汇的候补。
12.根据权利要求11所述的信息检索装置,其特征在于,除了进行向所述追加识别词汇赋予的重要性的计算之外,还进行从所述操作输入部输入的所述字符串和所述追加识别词汇中含有的词素越是更加一致越提高所述追加识别词汇的重要性的规定的计算。
13.根据权利要求1所述的信息检索装置,其特征在于,所述信息检索装置具备词汇类别判定部,该词汇类别判定部判定由所述识别词汇生成部生成的所述追加识别词汇的类别;所述识别词汇生成部还具有下述功能基于由所述词汇类别判定部判定出的所述追加识别词汇的类别来变更将该追加识别词汇追加于所述名称数据库及所述语言模型存储部中的方法;所述词汇类别判定部比较由所述选择单元选择出的记录、即用户选择记录中的各个属性的值和由所述操作输入部输入的字符串、即输入字符串,并将包括所述输入字符串的所述用户选择记录中的属性作为判定结果进行输出;所述检索部读取所述用户选择记录中的所述属性的值,在所述名称数据库的所述属性中检索与所述值一致的记录、即一致记录,将生成的所述追加识别词汇追加于所述名称数据库的所述一致记录的追加识别词汇属性。
14.根据权利要求1所述的信息检索装置,其特征在于,所述识别词汇生成部计算所生成的所述追加识别词汇与在所述语言模型存储部或所述名称数据库的属性中作为值保存的字符串之间的类似度,列举作为类似的词汇的类似词汇;所述识别词汇生成部在存在该类似词汇的情况下,变更所生成的所述追加识别词汇向所述名称数据库及所述语言模型追加的追加方法。
15.根据权利要求1所述的信息检索装置,其特征在于,所述识别词汇生成部除了所生成的所述追加识别词汇之外,还生成将所述名称数据库的其中一个属性和所述追加识别词汇组合后的新追加识别词汇。
16.根据权利要求8所述的信息检索装置,其特征在于,所述词素的信息利用向所述名称数据库的各属性预先赋予的词素划分信息或词素词类fe息。
17.根据权利要求8所述的信息检索装置,其特征在于,所述信息检索装置具备对所述词素进行分割处理的词素分割处理单元。
18.一种信息检索方法,利用了信息检索装置,该信息检索方法的特征在于, 所述信息检索装置具备名称数据库,其以记录为单位登记了一个以上的所述记录,该记录将成为检索对象的一个以上的属性和作为与各个所述属性相应的内容的值相关联地保存; 输入部,其接受用户的操作输入或声音输入; 声音识别部,其将从所述输入部得到的声音识别为字符串; 音响模型存储部,其存储在所述声音识别部中参照的音响数据; 语言模型存储部,其将在所述声音识别部中识别的词汇和该词汇的连结规则作为语言模型进行存储; 检索部; 输出部; 选择单元;和识别词汇生成部, 该信息检索方法的特征在于,通过所述检索部利用从所述输入部或声音识别部输入的输入字符串,检索在所述名称数据库中包含的所述属性的所述值,并将在该值中包含所述输入字符串的所述记录作为候补来生成;将由所述检索部生成的所述记录的候补作为检索结果而提示给所述输出部; 通过所述识别词汇生成部接受与所述检索结果相应的由所述选择单元进行的所述记录的选择结果,生成作为应该追加于所述语言模型的声音识别词汇的新追加识别词汇; 将所述输入字符串所对应的所述追加识别词汇和选择出的所述记录的对应关系记录于所述名称数据库或所述语言模型;所述检索部在从所述声音识别部输出了所述追加识别词汇的情况下,将该追加识别词汇中包含的所述名称数据库的记录包括于所述检索结果中并提示给所述输出部。
19.根据权利要求18所述的信息检索方法,其特征在于,将所述识别词汇生成部生成的一个或多个所述追加识别词汇提示给所述输出部; 基于来自所述输入部的输入结果来变更作为所述追加识别词汇采用的词汇。
20.一种导航系统,接受经由输入部输入的操作输入或声音输入,检索名称数据库并将包括所输入的字符串的设施名等的候补一览提示给输出部,根据经由选择单元选择出的所述候补一览中的设施名等来设定目的地,所述导航系统的特征在于,所述名称数据库以记录为单位登记了一个以上的所述记录,该记录将成为检索对象的一个以上的属性和作为与各个所述属性相应的内容的值相关联地保存, 所述导航系统具备声音识别部,其将从所述声音输入部得到的声音识别为字符串; 音响模型存储部,其存储在所述声音识别部中参照的音响数据; 语言模型存储部,其将在所述声音识别部中识别的词汇和该词汇的连结规则作为语言模型进行存储;检索部,其利用从所述输入部或声音识别部输入的输入字符串,检索在所述名称数据库中包含的所述属性的所述值,并将在该值中包含所述输入字符串的所述记录作为候补来生成,并作为检索结果向所述输出部输出;和识别词汇生成部,其接受与所述记录的候补相应的由所述选择单元进行的选择结果, 生成作为应该追加于所述语言模型的声音识别词汇的新追加识别词汇,所述识别词汇生成部将所述输入字符串所对应的所述追加识别词汇和选择出的所述记录的对应关系记录于所述名称数据库或所述语言模型;所述检索部在从所述声音识别部输出了所述追加识别词汇的情况下,将该追加识别词汇中包含的所述名称数据库的记录包括于所述检索结果中。
全文摘要
本发明提供一种信息检索装置、信息检索方法及导航系统。将用户通过触摸面板等输入的检索查询使用为声音识别词汇。另外,根据词素信息或其他数据库的信息来编辑检索查询,从而提供用户易于发声的声音识别词汇。因而,使得利用了声音输入的可操作性良好。
文档编号G10L15/18GK102549652SQ20108003992
公开日2012年7月4日 申请日期2010年9月9日 优先权日2009年9月9日
发明者小洼浩明, 本间健, 水野佳幸 申请人:歌乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1