语音识别装置及语音识别方法与流程

文档序号:17932441发布日期:2019-06-15 01:00阅读:114来源:国知局
本发明涉及对语音进行识别处理的语音识别装置及语音识别方法。
背景技术
::近年来,针对汽车导航装置和智能手机等中的语音识别装置,提出了各种各样的技术。例如专利文献1公开的技术中,通过适用语音识别结果的评分,能够提高语音的识别精度。除了上述技术以外,还提出了根据语音的内容来推测用户意图的语音识别装置。在该语音识别装置中,通过一次语音识别,从路径检索功能、音乐检索功能和设施检索功能等多个检索功能中选择一个检索功能,并执行所选择的一个检索功能来检索所希望的对象。例如,在从用户获取到“想去x棒球场”这一语音的情况下,上述语音识别装置从“想去”这一语音推测出请求“路径检索功能”,并且将“x棒球场”判定为路径检索功能中的目的地。现有技术文献专利文献专利文献1:日本专利特开2003-15688号公报技术实现要素:发明所要解决的技术问题根据上述推测用户意图的语音识别装置,能够减少用户与语音识别装置对话的次数。然而,这样的语音识别装置中,仅仅基于用户发出的多次语音,需要进行语音识别、推测用户意图、基于识别结果和意图推测结果来检索信息这样复杂的处理,因此很多时候会误执行用户不想要的检索功能。例如,日语“想去(用罗马字表示为ikitai)”和日语“想听(用罗马字表示为kikitai)”的发音很相似。因此,在用户的语音是“想去x棒球场”的情况下,若采用上述语音识别装置,则可能得到对x棒球场执行路径检索功能的检索结果和对x棒球场执行音乐检索功能的检索结果,从而导致用户不想要的检索功能也被执行。另外,根据语音识别结果的评分,虽然能够抑制在执行检索功能时检索结果出错,但并不能用于决定应该执行哪一个检索功能。因此,本发明鉴于上述问题,目的在于提供一种能够抑制用户不想要的检索功能被误执行的技术。解决技术问题所采用的技术方案本发明所涉及的语音识别装置包括:获取语音的获取部;对获取部所获取的语音进行识别处理从而推测应当执行的检索功能的推测部;累计检索功能的执行频度的执行频度累计部;以及参照推测部推测出的检索功能即推测检索功能的执行频度来控制推测检索功能的执行的控制部。发明效果根据本发明,参照推测检索功能的执行频度来控制推测检索功能的执行。由此,能够抑制用户不想要的检索功能被误执行。本发明的目的、特征、方式以及优点通过以下详细的说明和附图来进一步阐明。附图说明图1是表示实施方式1所涉及的语音识别装置的结构的框图。图2是表示实施方式2所涉及的语音识别装置的结构的框图。图3是表示实施方式2所涉及的语音识别装置的处理的流程图。图4是表示实施方式3所涉及的语音识别装置的结构的框图。图5是表示实施方式3所涉及的语音识别装置的处理的流程图。图6是表示实施方式3所涉及的语音识别装置的处理的流程图。图7是表示实施方式4所涉及的语音识别装置的显示例的图。图8是表示实施方式4所涉及的语音识别装置的显示例的图。图9是表示实施方式4所涉及的语音识别装置的处理的流程图。图10是表示其它变形例所涉及的语音识别装置的硬件结构的框图。图11是表示其它变形例所涉及的语音识别装置的硬件结构的框图。图12是表示其它变形例所涉及的服务器的结构的框图。图13是表示其它变形例所涉及的通信终端的结构的框图。具体实施方式<实施方式1>图1是表示本发明的实施方式1所涉及的语音识别装置1的结构的框图。图1的语音识别装置1能够控制执行部18中检索功能的执行。执行部18可以设置在语音识别装置1的外部,也可以设置在语音识别装置1的内部。根据以下的说明可知,根据本实施方式1所涉及的语音识别装置1,能够抑制用户不想要的检索功能被执行部18误执行。所谓检索功能,是指针对预先设定的项目检索所指示的对象的功能。该检索功能使用例如检索到所指示的目的地的路径的路径检索功能、检索所指示的音乐的音乐检索功能、检索所指示的设施的设施检索功能、从网上检索所指示的项目的网络检索功能等。图1的语音识别装置1具备获取部11、推测部12、执行频度累计部13和控制部14。下面,对图1的语音识别装置1的各构成要素进行详细说明。获取部11获取语音。推测部12通过对获取部11所获取的语音进行识别处理,从预先设定的多个检索功能中推测出应当执行的检索功能。推测部12在获取部11所获取的语音的内容中从文字上没有包含检索功能的情况下,也可以进行根据该语音的内容推测用户想要的检索功能的意图推测处理。根据这样构成的推测部12,例如在获取部11所获取的语音的内容是“想去x棒球场”的情况下,可以推测出“路径检索功能”为应当执行的检索功能,并且推测出“x棒球场”是该路径检索功能所指示的目的地。执行频度累计部13对各检索功能的执行频度进行累计。即,执行频度累计部13学习各检索功能的执行频度。控制部14对于推测部12推测出的检索功能即推测检索功能,参照执行频度累计部13中累计的执行频度,对执行部18中推测检索功能的执行进行控制。<实施方式1的总结>根据以上实施方式1所涉及的语音识别装置1,例如能够进行如下的控制:在推测检索功能的执行频度较高的情况下,立即执行该推测检索功能,在推测检索功能的执行频度较低的情况下,不立即执行该推测检索功能。这里,执行频度较高的推测检索功能是用户想要的检索功能的可能性较高的检索功能,执行频度较低的推测检索功能是用户想要的检索功能的可能性较低的检索功能。因此,根据以上结构,能够抑制用户不想要的检索功能被执行部18执行。<实施方式2>图2是表示本发明的实施方式2所涉及的语音识别装置1的结构的框图。下面,对于本实施方式2中说明的构成要素中与实施方式1相同或类似的构成要素标注相同的参考标号,主要针对不同的构成要素进行说明。图2的语音识别装置1具备麦克风21、语音获取部22、语音识别及意图推测处理部23、使用频度学习部24、检索功能通知部25、检索功能决定部26、检索功能执行部27、通知控制部28和检索结果通知部29。麦克风21和语音获取部22对应于实施方式1中说明的图1的获取部11。语音识别及意图推测处理部23和使用频度学习部24分别对应于实施方式1中说明的图1的推测部12和执行频度累计部13。检索功能决定部26和通知控制部28对应于实施方式1中说明的图1的控制部14。检索功能执行部27对应于实施方式1中说明的图1的执行部18。下面,对图2的语音识别装置1的各构成要素进行详细说明。麦克风21接受用户的语音,并将该语音转换成语音信号。语音获取部22从麦克风21获取语音信号,并将该语音信号转换成语音数据。在语音信号是模拟信号的情况下,语音获取部22通过对语音信号进行a/d转换,获取作为数字数据的语音数据。此时,为了提高数字数据的转换处理、例如pcm(pulsecodemodulation:脉冲编码调制)格式等处理的精度,语音获取部22也可以进行降噪和波束成形等处理。语音识别及意图推测处理部23从语音获取部22获取的语音数据中检测出语音区间并提取特征量。语音识别及意图推测处理部23基于提取出的特征量进行语音识别处理,从而获取与语音数据对应的字符串数据等。语音识别及意图推测处理部23对所获取的字符串数据进行实施方式1中说明的意图推测处理,从而推测应当执行的检索功能。从而,语音识别及意图推测处理部23获取到推测检索功能。此时,语音识别及意图推测处理部23在进行语音识别处理和意图推测处理中的任意处理时,均获取推测检索功能的推测评分。推测评分是表示推测检索功能是用户想要的检索功能的可能性的评分。例如成为语音识别处理的对象的特征量与预先设定的特征量的一致性越高,则该推测评分就越高,或者,例如成为意图推测处理的对象的字符串数据与预先设定的字符串数据的一致性越高,则该推测评分也就越高。下面,在本实施方式2中,将语音识别及意图推测处理部23获取的推测检索功能作为多个推测检索功能中推测评分最高的一项推测检索功能来进行说明。本实施方式2中,语音识别处理和意图推测处理由语音识别及意图推测处理部23这单一的功能块来进行,但并不限于此。例如,语音识别处理和意图推测处理也可以在例如包括服务器和移动终端等在内的多个装置中分开进行。详细情况将在后文阐述,语音识别及意图推测处理部23所获取的推测检索功能有可能被检索功能执行部27执行,也有可能不执行。检索功能执行部27执行推测检索功能的情况下,得到由该推测检索功能检索到的检索结果。例如,在执行音乐检索功能27b的情况下,得到上述字符串数据中包含的乐曲名称、及与之相似的乐曲名称等作为检索结果。使用频度学习部24对各检索功能的执行频度进行累计。这里,使用频度学习部24基于通过执行推测检索功能而得到的检索结果是否被使用,来进行变更该推测检索功能的执行频度的学习。例如,使用频度学习部24在通过执行推测检索功能而得到的检索结果被用户选中且被使用的情况下,使该推测检索功能的执行频度增加,在通过执行推测检索功能而得到的检索结果没有被使用的情况下,使该推测检索功能的执行频度减少。在这样的本实施方式2的结构中,检索功能的执行频度可以被称为检索功能的使用频度、执行次数、使用次数。因此,在以下的说明中,无区别地使用执行频度、使用频度、执行次数和使用次数。检索功能通知部25在检索功能决定部26的控制下向用户通知各种信息。这里,检索功能通知部25向用户通知由语音识别及意图推测处理部23推测出的检索功能即推测检索功能。检索功能通知部25使用例如液晶显示装置等显示装置及扬声器等语音输出装置。在使用显示装置作为检索功能通知部25的情况下,通过显示装置的显示来进行检索功能通知部25的通知,在使用语音输出装置作为检索功能通知部25的情况下,通过语音输出装置的语音指导来进行检索功能通知部25的通知。检索功能决定部26参照使用频度学习部24中累计的使用频度中推测检索功能的使用频度,控制检索功能执行部27对推测检索功能的执行。这里,在本实施方式2中,检索功能的使用频度分为多个执行频度等级即多个使用频度等级。检索功能决定部26构成为参照推测检索功能的使用频度所属的使用频度等级,来控制推测检索功能的执行,并且控制检索功能通知部25使其通知推测检索功能。下面,以多个使用频度等级是由低频度等级、中频度等级、高频度等级构成的3个等级的结构为例来进行说明。该结构中,在推测检索功能的使用频度低于预先设定的第一阈值的情况下,对推测检索功能的使用频度分配第一等级即低频度等级。在推测检索功能的使用频度为预先设定的第一阈值以上且低于预先设定的第二阈值的情况下,对推测检索功能的使用频度分配第二等级即中频度等级。推测检索功能的使用频度为预先设定的第二阈值以上的情况下,对推测检索功能的使用频度分配第三等级即高频度等级。从而,属于低频度等级的使用频度比属于中频度等级的使用频度要低,属于中频度等级的使用频度比属于高频度等级的使用频度要低。多个使用频度等级并不限于上述例子,也可以是2个等级,还可以是4个以上的等级。检索功能决定部26基于使用频度等级进行的控制将在后文中详细说明。检索功能执行部27在检索功能决定部26的控制下执行推测检索功能。图2中,示出了能够执行设施检索功能27a、音乐检索功能27b、以及对除此以外的项目进行检索的xx检索功能27c作为推测检索功能的检索功能执行部27。例如,检索功能执行部27执行设施检索功能27a作为推测检索功能的情况下,得到对上述字符串数据中包含的设施等进行检索的检索结果。通知控制部28控制检索结果通知部29,使其通知由检索功能执行部27执行推测检索功能而得到的检索结果。检索结果通知部29在通知控制部28的控制下将上述检索结果通知给用户。检索结果通知部29使用例如液晶显示装置等显示装置及扬声器等语音输出装置。检索功能通知部25和检索结果通知部29可以共用一个装置,也可以分开使用多个装置。<动作>图3是表示本实施方式2所涉及的语音识别装置1的处理的流程图。步骤s1中,语音获取部22从麦克风21获取语音信号,并将其转换为语音数据。步骤s2中,语音识别及意图推测处理部23对来自语音获取部22的语音数据依次进行语音识别处理和意图推测处理,从而推测出检索功能。步骤s3中,检索功能决定部26从使用频度学习部24获取由语音识别及意图推测处理部23推测出的检索功能即推测检索功能的使用频度。步骤s4中,检索功能决定部26判定推测检索功能是否是经常使用的功能。这里,在推测检索功能的使用频度所属的使用频度等级为高频度等级的情况下,检索功能决定部26判定为推测检索功能是经常使用的功能,然后前往步骤s9的处理。另一方面,在推测检索功能的使用频度所属的使用频度等级不是高频度等级的情况下,检索功能决定部26判定为推测检索功能不是经常使用的功能,然后前往步骤s5的处理。步骤s5中,检索功能决定部26判定推测检索功能是否是基本不使用的功能。这里,在推测检索功能的使用频度所属的使用频度等级为中频度等级的情况下,检索功能决定部26判定为推测检索功能不是基本不使用的功能,然后前往步骤s6的处理。另一方面,在推测检索功能的使用频度所属的使用频度等级为低频度等级的情况下,检索功能决定部26判定为推测检索功能是基本不使用的功能,然后前往步骤s7的处理。步骤s6中,检索功能决定部26控制检索功能通知部25使其通知推测检索功能。从而,推测检索功能被检索功能通知部25进行通知。然后,前往步骤s9的处理。从步骤s5前往步骤s7的处理的情况下,检索功能决定部26控制检索功能通知部25,使其通知对于是否执行推测检索功能的确认、即推测检索功能的执行确认。从而,例如推测检索功能是设施检索功能27a的情况下,通过检索功能通知部25向用户通知“将执行设施检索。是否可以?”这一内容。步骤s7之后,在步骤s8中,检索功能决定部26判定来自外部的指示是否是执行在步骤s7中通知的推测检索功能的执行指示。来自外部的指示可以通过麦克风21另外接收用户的语音来进行,也可以通过未图示的输入装置另外接收用户的手动操作来进行。在来自外部的指示被判定为是执行指示的情况下,前往步骤s9的处理,在来自外部的指示被判定为是不执行推测检索功能的非执行指示的情况下,结束图3的处理。步骤s9中,检索功能决定部26控制推测检索功能的执行。通过该控制,检索功能执行部27执行推测检索功能。这里,对步骤s4~s9简单地进行概括,在使用频度等级为低频度等级的情况下,检索功能决定部26控制检索功能通知部25使其通知推测检索功能(步骤s7),并且根据来自外部的指示控制推测检索功能的执行。在使用频度等级为中频度等级的情况下,检索功能决定部26控制检索功能通知部25使其通知推测检索功能(步骤s6),并且控制推测检索功能的执行而与来自外部的指示无关。在使用频度等级为高频度等级的情况下,检索功能决定部26不进行使检索功能通知部25通知推测检索功能的控制,控制推测检索功能的执行而与来自外部的指示无关。步骤s9之后,在步骤s10中,通知控制部28使检索结果通知部29通知由检索功能执行部27执行推测检索功能而得到的检索结果的列表。步骤s11中,语音识别装置1接受用户对所通知的检索结果中的任一个进行的选择。该选择可以通过麦克风21另外接收用户的语音来进行,也可以通过未图示的输入装置另外接收用户的手动操作来进行。步骤s12中,使用频度学习部24基于用户所选择的检索结果是否被使用,进行变更在步骤s9中执行的推测检索功能的使用频度的学习。步骤s13中,与语音识别装置1相连的未图示的系统实施与步骤s11中选择的检索结果所对应的处理。例如,在步骤s11中从通过执行音乐检索功能27b而检索到的多首乐曲中选择了一首乐曲的情况下,系统播放所选择的一首乐曲。之后,结束图3的处理。<实施方式2的总结>根据以上本实施方式2所涉及的语音识别装置1,参照推测检索功能的使用频度所属的使用频度等级,控制推测检索功能的执行。从而,能够以恰当数量的等级来控制推测检索功能的执行。另外,根据本实施方式2,参照推测检索功能的使用频度所属的使用频度等级,来控制推测检索功能的执行,并且控制检索功能通知部25对推测检索功能进行通知。由此,能够进一步抑制用户不想要的检索功能被误执行。另外,根据本实施方式2,基于通过执行推测检索功能而得到的检索结果是否被使用,变更该推测检索功能的使用频度。从而,能够使检索功能决定部26所用的使用频度更加恰当。另外,使用频度学习部24对使用频度的学习并不限于此。例如,使用频度学习部24也可以基于检索功能执行部27是否执行推测检索功能,来变更该推测检索功能的使用频度。<实施方式2的变形例>实施方式2所涉及的语音识别装置1中,由使用频度学习部24进行累计的使用频度的初始值也可以由用户等预先登记。根据这样的结构,在使用频度学习部24中,可以不从通常的低频度等级开始学习所希望的检测功能的使用频度,而是从中频度等级或高频度等级开始进行学习。这一变形例也可以适用于后述的实施方式3及之后的实施方式。<实施方式3>图4是表示本发明的实施方式3所涉及的语音识别装置1的结构的框图。下面,对于本实施方式3中说明的构成要素中与实施方式2相同或类似的构成要素标注相同的参考标号,主要针对不同的构成要素进行说明。图4的语音识别装置1在图2的构成要素的基础上还具备检索功能切换部30。检索功能决定部26、通知控制部28和检索功能切换部30对应于实施方式1中说明的图1的控制部14。在通过语音识别及意图推测处理23的推测而得到多个推测检索功能的情况下,检索功能决定部26控制从多个推测检索功能中执行一个推测检索功能。从而,检索功能执行部27执行一个推测检索功能。本实施方式3中,一个推测检索功能的推测评分高于除这一个推测检索功能以外的多个推测检索功能的推测评分。即,本实施方式3中,检索功能执行部27从多个推测检索功能中,执行推测评分最高的一个推测检索功能。在以下的说明中,有时也将多个推测检索功能中推测评分最高的一个推测检索功能记为“最高评分检索功能”。检索功能切换部30在一个推测检索功能开始执行到结束执行的期间内,能够控制从一个推测检索功能的执行切换到其它推测检索功能的执行。本实施方式3所涉及的检索功能切换部30与检索功能决定部26联动,在上述期间中的一定期间内,控制检索功能通知部25使其通知一个以上的推测检索功能。然后,检索功能切换部30根据上述一定期间内来自外部的指示,控制从一个推测检索功能的执行切换到其它推测检索功能的执行。这样的结构可以适用以下的例1和例2的结构。例1的结构中,检索功能切换部30在一个推测检索功能执行过程中的一定期间内,控制检索功能通知部25使其按照使用频度的顺序依次通知除了这一个推测检索功能以外的多个推测检索功能。例如,检索功能切换部30在上述一定期间内,使检索功能通知部25通知多个推测检索功能中正在执行的一个推测检索功能。然后,在来自外部的指示是“不对”的指示的情况下,检索功能切换部30使检索功能通知部25通知除了一个推测检索功能以外的多个推测检索功能中使用频度最高的另一个推测检索功能,并且控制从一个推测检索功能的执行切换到这另一个推测检索功能的执行。例2的结构中,检索功能切换部30在一个推测检索功能正在执行过程中的一定期间内,使检索功能通知部25通知所有推测检索功能。然后,在来自外部的指示是“执行其它推测检索功能”的指示的情况下,检索功能切换部30控制从一个推测检索功能的执行切换到所指示的其它推测检索功能的执行。图4的例子中,来自外部的指示是通过麦克风21另外接收到的来自用户的语音,该语音的语音数据被输入至检索功能切换部30。但并不限于此,来自外部的指示也可以是通过未图示的输入装置另外接收到的来自用户的手动操作。<动作>图5和图6是表示本实施方式3所涉及的语音识别装置1的处理的流程图。具体而言,图5和图6中示出了上述例2的结构的处理。下面,在图5和图6的处理的说明中,主要针对与图3的处理不同的处理进行说明。图5的步骤s1~s5中,进行与实施方式2的图3的步骤s1~s5相同的处理。同样地,图5的步骤s7~s13中,进行与实施方式2的图3的步骤s7~s13相同的处理。图5的步骤s5中,语音识别及意图推测处理部23所获取的推测检索功能、即最高评分检索功能被判定为不是基本不使用的功能的情况下,前往图6的步骤s21的处理。步骤s21中,检索功能决定部26控制执行由语音识别及意图推测处理部23所获取的推测检索功能、即最高评分检索功能。通过该控制,检索功能执行部27执行最高评分检索功能。步骤s22中,检索功能切换部30使检索功能通知部25通知包括最高评分检索功能在内的多个推测检索功能。步骤s23中,检索功能切换部30判定来自外部的指示是否是多个推测检索功能中不同于最高评分检索功能的其它推测检索功能的执行指示。在来自外部的指示被判定为是其它推测检索功能的执行指示的情况下,前往步骤s24的处理,在来自外部的指示被判定为不是其它推测检索功能的执行指示的情况下,前往图5的步骤s10的处理。另外,在一直没有来自外部的指示而步骤s22的通知经过了一定期间的情况下,也前往图5的步骤s10的处理。步骤s24中,检索功能切换部30控制切换到执行所指示的其它推测检索功能。通过该控制,检索功能执行部27执行所指示的其它推测检索功能。然后,前往图5的步骤s10的处理。<实施方式3的总结>在语音识别及意图推测处理部23推测出多个推测检索功能的情况下,作为执行多个推测检索功能的方式,考虑依次逐个执行推测检索功能的方式和并行地执行多个推测检索功能的方式。但考虑到无论哪一种方式,在得到检索结果之前都要花费一定时间。而根据本实施方式3所涉及的语音识别装置1,在一个推测检索功能开始执行到结束执行的期间内,控制从一个推测检索功能的执行切换到其它推测检索功能的执行。根据这样的结构,用户能够在不想要的检索功能执行过程中切换至想要的检索功能的执行。从而能够缩短到想要的检索功能被执行而得到检索结果为止的时间。本实施方式3中,多个推测检索功能中最先被执行的一个推测检索功能使用的是推测评分最高的一个推测检索功能。从而,能够最先执行是用户想要的检索功能的可能性较高的检索功能。<实施方式4>本发明的实施方式4所涉及的语音识别装置1的功能框结构与实施方式3所涉及的语音识别装置1的功能框结构(图4)相同。下面,对于本实施方式4中说明的构成要素中与实施方式2、3相同或类似的构成要素标注相同的参考标号,主要针对不同的构成要素进行说明。在通过语音识别及意图推测处理23的推测而得到多个推测检索功能的情况下,检索功能决定部26控制多个推测检索功能并行地执行。从而,检索功能执行部27并行地执行多个推测检索功能。通知控制部28控制检索结果通知部29,使其针对每一个推测检索功能都通知通过上述执行而得到的多个推测检索功能的检索结果。图7和图8是表示作为检索结果通知部29的通知例的显示例的图。具体而言,图7和图8示出了多个推测检索功能中设施检索功能的使用频度最高且音乐检索功能的使用频度与设施检索功能的使用频度相比为次高的情况下的显示例。如图7所示,本实施方式4中,最先显示的是设施检索功能的检索结果即多个推测检索功能中使用频度最高的推测检索功能的检索结果。如图7和图8所示,检索结果通知部29中多个推测检索功能的检索结果的列表显示可以针对每个推测检索功能的标签29a、29b进行切换。即,若在如图7那样显示设施检索功能的检索结果时选择了标签29b,则图8那样切换到音乐检索功能的检索结果的显示,若在图8那样显示音乐检索功能的检索结果时选择了标签29a,则图7那样切换到设施检索功能的检索结果的显示。另外,使检索结果通知部29针对每一个推测检索功能通知多个推测检索功能的检索结果的方式不限于如图7和图8所示切换显示的方式。例如,也可以是在用方框等将多个推测检索功能的检索结果按照每一个推测检索功能加以划分的状态下在一个画面中进行显示的方式。<动作>图9是表示本实施方式4所涉及的语音识别装置1的处理的流程图。下面,在图9的处理的说明中,主要针对与图5的处理不同的处理进行说明。图9的步骤s4中,在最高评分检索功能被判定为是经常使用的功能的情况下,前往步骤s9a的处理。另一方面,在图9的步骤s4中最高评分检索功能被判定为不是经常使用的功能的情况下,进行与实施方式3所说明的图5的步骤s5及之后的处理相同的处理。步骤s9a中,检索功能决定部26控制多个推测检索功能并行地执行。从而,检索功能执行部27并行地执行多个推测检索功能。步骤s10a中,通知控制部28使检索结果通知部29针对每一个推测检索功能通知多个推测检索功能的检索结果。此时,检索结果通知部29在通知控制部28的控制下,最先通知使用频度最高的推测检索功能的检索结果。之后,在步骤s31中,语音识别装置1判定有没有切换到通知其它推测检索功能的检索结果的指示。在判定为用户等发出了切换指示的情况下,前往步骤s32的处理,在判定为没有切换指示的情况下,前往步骤s11的处理。步骤s32中,检索结果通知部29在通知控制部28的控制下,切换到通知步骤s31中指示的推测检索功能的检索结果。然后,返回步骤s31的处理。步骤s11中,语音识别装置1接受用户对所通知的检索结果中的任一个进行的选择。步骤s12中,使用频度学习部24基于用户所选择的检索结果是否被使用,进行变更在步骤s9a中执行的多个推测检索功能的使用频度的学习。例如,在经过步骤s32等后进行步骤s12的情况下,使用频度学习部24减少最高评分检索功能的使用频度,增加在步骤s31中指示的推测检索功能的使用频度。步骤s13中,与语音识别装置1相连的未图示的系统实施与步骤s11中选择的检索结果所对应的处理。之后,结束图9的处理。<实施方式4的总结>根据以上本实施方式4所涉及的语音识别装置1,在通过语音识别及意图推测处理部23的推测而得到多个推测检索功能的情况下,控制多个推测检索功能并行地执行,并使检索结果通知部29针对每一个推测检索功能通知经过上述执行而得到的检索结果。根据这样的结构,即使最先通知的推测检索功能不是用户想要的检索功能,也不需要再次进行语音输入、重新进行语音识别和意图推测处理等,因此能够立即使用用户想要的检索结果。<变形例>实施方式4所涉及的语音识别装置1中,在控制了多个推测检索功能并行地执行之后,通知控制部28也可以进行如下控制:在得到使用频度最高的推测检索功能的检索结果的时刻,使检索结果通知部29通知到该时刻为止所得到的多个推测检索功能的检索结果。而且,还可以在通过标签的选择等而从使用频度最高的推测检索功能的检索结果的通知切换到实际还没有完成检索的推测检索功能的检索结果的通知的情况下,通知正在检索中这一情况。根据这样的结构,在其它检索功能的执行没有完成的情况下,也能够通知使用频度最高的推测检索功能的检索结果。因而,能够缩短得到使用频度最高的推测检索功能执行的检索结果、即用户想要的可能性很高的检索功能执行的检索结果为止的时间。另外,实施方式4所涉及的语音识别装置1中,也可以由语音识别装置1的外部装置来执行多个推测检索功能中的一个以上推测检索功能。例如,可以由能够与语音识别装置1通信的服务器来执行多个推测检索功能中的几个推测检索功能,也可以由能与语音识别装置1通信的移动终端来执行剩下的推测检索功能中的至少一部分。根据这样的结构,多个推测检索功能分散地执行,因此,能够缩短得到多个推测检索功能的检索结果为止的时间。<其它变形例>以下,将上述语音识别装置1中的图1的获取部11、推测部12、执行频度累计部13和控制部14记为“获取部11等”。获取部11等由图10所示的处理电路81来实现。即,处理电路81包括:获取语音的获取部11;对获取部11所获取的语音进行识别处理从而推测应当执行的检索功能的推测部12;累计检索功能的执行频度的执行频度累计部13;以及参照推测部12推测出的检索功能即推测检索功能的执行频度来控制推测检索功能的执行的控制部14。处理电路81可以适用专用的硬件,也可以适用执行存储在存储器中的程序的处理器。处理器例如有中央处理装置、处理装置、运算装置、微处理器、微机以及dsp(digitalsignalprocessor:数字信号处理器)等。在处理电路81为专用硬件的情况下,处理电路81例如相当于单一电路、复合电路、编程处理器、并联编程处理器、asic(applicationspecificintegratedcircuit:专用集成电路)、fpga(fieldprogrammablegatearray:现场可编程门阵列)或它们的组合。获取部11等的各部的功能可以分别由使处理电路分散而得的电路来实现,也可以将各部的功能汇总而由一个处理电路来实现。处理电路81是处理器的情况下,获取部11等的功能通过与软件等的组合来实现。软件等例如有软件、固件或软件及固件。软件等以程序的形式来表述,并存储在存储器中。如图11所示,适用于处理电路81的处理器82读取存储在存储器83中的程序并执行,从而实现各部的功能。即,语音识别装置1具备用于存储程序的存储器83,该程序在由处理电路81执行时,最终执行的是如下步骤:获取语音的步骤;通过对所获取的语音进行识别处理来推测应当执行的检索功能的步骤;累计检索功能的执行频度的步骤;参照推测出的检索功能即推测检索功能的执行频度来控制推测检索功能的执行的步骤。换言之,也可以说该程序使计算机执行获取部11等的步骤、方法。这里,存储器83例如有ram(randomaccessmemory:随机存取存储器)、rom(readonlymemory:只读存储器)、闪存、eprom(erasableprogrammablereadonlymemory:电可擦除可编程只读存储器)、eeprom(electricallyerasableprogrammablereadonlymemory:电可擦可编程只读存储器)等非易失性或易失性的半导体存储器、以及hdd(harddiskdrive:硬盘驱动器)、磁盘、软盘、光盘、压缩磁盘、小型磁盘、dvd(digitalversatiledisc:数字通用盘)及其驱动装置等。以上对获取部11等的各功能由硬件以及软件等中的任一方来实现的结构进行了说明。但并不局限于此,也可以采用获取部11等的一部分由专用的硬件实现、其它部分由软件等来实现的结构。例如,可以是获取部11由作为专用硬件的处理电路来实现其功能,除此以外则由作为处理器82的处理电路81读取存储在存储器83中的程序并执行来实现其功能。如上所述,处理电路81可以利用硬件、软件等或它们的组合来实现上述各种功能。另外,以上说明的语音识别装置也可以将包含pnd(portablenavigationdevice:便携式导航装置)等导航装置、移动电话、智能手机及平板电脑等移动终端在内的通信终端、安装在这些通信终端上的应用程序的功能以及服务器适当地进行组合,从而适用于构建成系统的语音识别系统。该情况下,以上说明的语音识别装置的各功能或各结构要素可以分散配置在构建所述系统的各设备中,也可以集中配置在某台或某几台设备中。图12是表示本变形例所涉及的服务器51的结构的框图。图12的服务器51具备通信部51a、推测部51b、执行频度累计部51c、控制部51d,能够与车辆52的导航装置53进行无线通信。作为获取部的通信部51a通过与导航装置53进行无线通信,接受导航装置53所获取的语音。推测部51b、执行频度累计部51c和控制部51d通过服务器51的未图示的处理器等执行存储在服务器51的未图示的存储装置中的程序,从而具有与图1的推测部12、执行频度累计部13和控制部14相同的功能。即,控制部51d参照推测部51b推测出的检索功能即推测检索功能的执行频度,来控制推测检索功能的执行。然后,通信部51a将控制部51d的控制结果、或通过推测检索功能的执行而得到的检索结果等发送到导航装置53。根据这样构成的服务器51,能够得到与实施方式1中说明的语音识别装置1相同的效果。图13是表示本变形例所涉及的通信终端56的结构的框图。图13的通信终端56具备与图12的通信部51a、推测部51b、执行频度累计部51c和控制部51d相同的通信部56a、推测部56b、执行频度累计部56c和控制部56d,并能够与车辆57的导航装置58进行无线通信。通信终端56适用例如车辆57的驾驶员所携带的移动电话、智能手机和平板电脑等移动终端。根据这样构成的通信终端56,能够得到与实施方式1中说明的语音识别装置1相同的效果。另外,本发明可以在其发明范围内对各实施方式和各变形例进行自由组合,或者对各个实施方式和各变形例适当地进行变形、省略。本发明进行了详细的说明,但上述说明在所有方面均为示例,本发明并不限于此。未例示的无数变形例可解释为可在不脱离本发明的范围的情况下设想得到。标号说明1语音识别装置;11获取部;12推测部;13执行频度累计部;14控制部;25检索功能通知部;29检索结果通知部。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1