装置、方法、非暂态计算机可读介质及系统与流程

文档序号:11161277阅读:530来源:国知局
装置、方法、非暂态计算机可读介质及系统与制造工艺

本申请要求于2014年7月16日提交的日本优先权专利申请JP2014-145795的权益,其全部内容通过引用并入本文。

技术领域

本公开内容涉及信息处理装置、信息处理方法以及程序。



背景技术:

当使用语音识别功能时,语音识别功能正常停止以使得语音识别系统不会对周围的声音错误地做出反应并且当使用语音识别功能时通常给出启动语音识别的指令。例如,已知使用按键通话(push to talk)开关并且仅在开关被按下时启用语音识别的方法。例如,作为不使用开关的方法,专利文献1公开了仅在用户说出特定关键词之后的固定的时间段内识别语音的方法。除了上述方法以外,通过话语启用语音识别的方法例如包括通过说出预定关键词以在固定的时间段内启用语音识别的方法以及启用接在说出预定关键词之后的语音的语音识别的方法。在此之后,启用获取要在使用语音识别功能时识别的语音被称为“激活语音识别”。

引用列表

专利文献

专利文献1:JP 2006-215499A

专利文献2:JP 2004-29354A



技术实现要素:

技术问题

与开关操作相比,通过语音来激活语音识别预计将减少用户的负担。然而,如果配备有语音识别功能的多个设备存在于用户周围,如上所述,当语音识别被激活时多个设备可以同时作出反应。

因此,已知通过给予不同的名称(即,激活语音识别的关键词)来区分这些设备的方法。例如,名称“约翰”和“迈克”被提供给两个设备以使用这些名称作为关键词来激活这些设备中的每个设备。因此,当用户说出“约翰”时,仅名为“约翰”的设备将激活语音识别。然而,如果类似的名称被提供给设备,则除了其语音识别应被激活的设备以外的其他设备可能会被错误地启用以获取语音。

近些年随着移动终端和可穿戴终端的广泛使用,预计会增加语音识别功能的使用,并且因此,希望通过防止语音识别功能的故障在不引起任何问题的情况下可以由每个设备使用语音识别功能。

问题的解决方案

根据本公开内容的实施方式,提供了一种第一装置,其包括:通信单元,被配置成基于第一装置与第二装置之间的关系来发送允许第二装置对所存储的语音识别信息进行修改的信息。

根据本公开内容的另一实施方式,提供了一种方法,其包括:基于第一装置和第二装置之间的关系从第一装置向第二装置发送信息以允许第二装置修改所存储的语音识别信息。

根据本公开内容的又一实施方式,提供了一种其上包含有程序的非暂态计算机可读介质,其中,当由第一装置的处理器执行程序时使第一装置执行方法,该方法包括基于第一装置与第二装置之间的关系来发送允许第二装置对所存储的语音识别信息进行修改的信息。

根据本公开内容的再一实施方式,提供了一种系统,该系统包括第一装置和第二装置,其中,第一装置基于第一装置与第二装置之间的关系来发送允许第二装置对所存储的语音识别信息进行修改的信息。

本发明的有益效果

根据本公开内容的一个或更多个实施方式,如上所述,通过防止语音识别功能的故障在不引起任何问题的情况下可以由每个设备使用语音识别功能。

应注意,不一定限于上述效果,并且连同上述效果或者替代上述效果,可以呈现出在本说明书中期望被引入的任何效果或可以根据本说明书预期的其他效果。

附图说明

图1是示出用于语音识别的词典信息在配备有语音识别功能的设备之间的交换的概念图。

图2是示出根据本公开内容的第一实施方式的配备有语音识别功能的设备之间的关系的说明图。

图3是示出根据实施方式的信息处理装置的功能配置的功能框图。

图4是示出另外设备激活词词典DB的配置示例的说明图。

图5是示出根据实施方式的信息处理装置的网络监视过程的流程图。

图6是示出根据实施方式的激活词词典的检查过程的流程图。

图7是示出根据本公开内容的第二实施方式的信息处理装置的功能配置的功能框图。

图8是示出根据实施方式的通过语音识别设备的信息处理装置进行的激活词识别过程的流程图。

图9是示出根据本公开内容的第三实施方式的配备有语音识别功能的设备之间的关系的说明图。

图10是示出根据实施方式的通过语音识别设备中的连接到固定网络或者通过自组织通信连接的设备的激活词的交换过程的流程图。

图11是示出根据实施方式的通过语音识别设备中的连接到固定网络并且能够执行自组织通信的设备的激活词的交换过程的流程图。

图12是示出根据本公开内容的第四实施方式的通过语音识别设备进行的信息交换过程的说明图。

图13是示出本公开内容中的语音识别设备的硬件配置的示例的硬件配置图。

具体实施方式

在下文中,将参照附图来详细地描述本公开内容的实施方式。应注意,在本说明书和附图中,使用相同的附图标记来表示具有基本上相同的功能和结构的结构元素,并且省略对这些结构元素的重复说明。

将按下面的顺序来进行描述:

0.概述

1.第一实施方式(存在类似激活词时的过程)

1.1.概述

1.2.功能配置

1.3.处理流程

1.4.总结

2.第二实施方式(激活词的识别准确度提高)

2.1.功能配置

2.2.过程流程

3.第三实施方式(固定网络和自组织通信)

4.第四实施方式(除了激活词以外的关于语音识别的信息的交换)

5.硬件配置示例

<0.概述>

首先,基于图1来提供根据本公开内容的实施方式的信息处理装置的功能的概述。图1是示出用于语音识别的词典信息在配备有语音识别功能的设备之间的交换的概念图。

配备有语音识别功能的设备存储激活语音识别的激活词以及用于语音识别的词作为词典信息。基于词典信息,可以使得设备能够获取要识别的语音或者可以识别与用户说出的词对应的事情或过程。根据本公开内容的实施方式的信息处理装置根据配备有语音识别功能的设备之间的物理关系对语音识别的处理内容进行控制。因此,能够防止用于语音识别的其他设备对话语内容的错误识别,以及另外地,使得由用户针对语音识别功能设置的词可用于配备有语音识别功能的其他设备。

例如,如图1的上侧所示,假设存在配备有语音识别功能的设备A至设备D,并且设备A至设备D中的每个设备能够在通过虚线表示的相应范围内获取语音。在这种情况下,如果设备之间的距离大于相应预定距离,则设备A至设备D中的每个设备能够在不受到其他设备的影响的情况下使用语音识别功能。另一方面,如图1的下侧所示,例如,假设设备A和设备B移动至更加接近设备D,并且设备A与设备D之间以及设备B与设备D之间能够相互获取语音。在这种情况下,针对一个设备说出的词也可以被其他设备获取并且因此,其他设备可能会故障。

因此,当配备有语音识别功能的多个设备彼此更加接近时,根据本公开内容的实施方式的信息处理装置通过从其他设备接受包括用于语音识别的词的词典信息来实施控制以不执行错误处理。例如,如果相同或相似的词也被其他设备使用时,可以警告用户并且当设备处于近范围内时语音识别可以被禁用。此外,尽管设备A和设备B不在预定范围内,但是经由设备D可获取另外的词典信息。因此,能够获取更多设备的词典信息。

这样的信息处理装置可以设置在每个设备或服务器上。在此之后,将描述在每个实施方式中的信息处理装置的配置和处理。

<1.第一实施方式>

首先,将参照图2至图6来描述根据本公开内容的第一实施方式的通过信息处理装置的语音识别功能的控制过程。图2是示出配备有语音识别功能的设备之间的关系的说明图。图3是示出根据实施方式的信息处理装置的功能配置的功能框图。图4是示出另外设备激活词词典DB的配置示例的说明图。图5是示出根据实施方式的信息处理装置的网络监视过程的流程图。图6是示出根据实施方式的激活词词典的检查过程的流程图。

(1.1.概述)

在实施方式中,如图2所示,假设存在三个语音识别设备100A、100B、100M作为配备有语音识别功能的设备。语音识别设备100A、语音识别设备100B、语音识别设备100M是可以由用户携带的终端例如智能手机、眼镜型终端、头戴式显示器、吊坠型终端、手环型终端以及指环型终端。

语音识别设备100A、语音识别设备100B、语音识别设备100M发送激活语音识别的激活词。此外,语音识别设备100A、语音识别设备100B、语音识别设备100M能够获取至其他设备的距离。例如,假设蓝牙(注册商标)4.0用于语音识别设备100A、语音识别设备100B、语音识别设备100M的通信,并且关于激活词的信息被存储并通过广告包发送。例如,如果由语音识别设备100M发送的信息被语音识别设备100A、语音识别设备100B获取,则语音识别设备100A、语音识别设备100B能够知道语音识别设备100M的激活词以及至语音识别设备100M的距离。

在实施方式中,语音识别设备100A、语音识别设备100B、语音识别设备100M中的每个包括对关于语音识别的过程进行控制的信息处理装置。语音识别设备100A、语音识别设备100B、语音识别设备100M的信息处理装置基于从其他设备接收的用于激活语音识别的激活词以及至这样的设备的距离来控制关于语音识别的过程,使得语音识别功能在不引起任何问题的情况下可用于每个设备。

(1.2功能配置)

如图3所示,语音识别设备100A、语音识别设备100B、语音识别设备100M包括通信单元110、控制单元120、相似度确定单元130、麦克风140、激活词识别单元150、输出单元160、激活词词典DB 170以及另外设备激活词词典DB 180。在图3中,在每个语音识别设备100(100A、100B、100M)中仅示出用来执行与激活词的识别有关的过程的功能单元。除了图3中所示的那些功能单元以外,语音识别设备100可以包括其他功能单元。根据本公开内容的实施方式的信息处理装置包括图3中所示的功能单元中的至少控制单元120,并且在实施方式中,信息处理装置被设置在语音识别设备100中。

通信单元110是用于发送和接收信息的功能单元。例如,通信单元110可以由无线通信技术如蓝牙(注册商标)4.0配置。如果使用蓝牙(注册商标)4.0,则还能够获取至其他通信对象的距离。当另一语音识别设备比预定距离更近时,通信单元110与该另一语音识别设备交换信息。

控制单元120控制与语音识别设备的语音识别有关的过程。例如,控制单元120将由通信单元110获取的另一语音识别设备的激活词记录在另外设备激活词词典DB 180中,或者,在获取激活词之后,使相似度确定单元130确定该激活词与其他语音识别设备的激活词的相似度。控制单元120基于与其他语音识别设备的激活词的相似度来控制与语音识别有关的过程。

相似度确定单元130确定激活词与其他语音识别设备的激活词的相似度。当从另一语音识别设备接收到激活词时,相似度确定单元130根据控制单元120的指令通过参照激活词词典DB 170和另外设备激活词词典DB 180来计算激活词与预定范围内的语音识别设备的激活词的相似度。如果所计算的相似度等于预定值或更大,相似度确定单元130确定激活词相似或相同。由相似度确定单元130确定的相似度确定结果被输出到控制单元120。

麦克风140是用于获取语音的功能单元,并且获取用户说出的语音识别功能的激活词和要识别的语音。由麦克风140获取的语音被输出到激活词识别单元150。

激活词识别单元150识别任何激活词是否包含在由麦克风140获取的语音中。如果通过参照激活词词典DB 170识别到激活词被输入,则激活词识别单元150向控制单元120通知激活词被输入。

输出单元160是输出信息的功能单元并且例如是用于显示信息的显示器或输出声音的扬声器。例如,当激活词类似于预定范围内的另一语音识别设备的激活词时,输出单元160输出从控制单元120通知的警告。

激活词词典DB 170是存储激活语音识别的激活词的存储单元。激活词可以由用户设置或由设备预设定。存储在激活词词典DB 170中的激活词被经由通信单元110通知给其他语音识别设备。

另外设备激活词词典DB 180是存储经由通信单元110从其他语音识别设备获取的激活词的存储单元。例如,如图4所示,另外设备激活词词典DB 180可以存储语音识别设备的设备名称、标识信息和激活词以及被记录在另外设备激活词词典DB 180中的更新日期和时间。标识信息可以是能够唯一地标识设备等的信息,例如,序列号。在图4的示例中,另外设备激活词词典DB 180存储语音识别被激活词“乔伊”和“鲍比”激活的其他语音识别设备的存在。如图4所示,激活词可以被存储为字符串或注音符号。另外设备激活词词典DB 180在预定定时被更新。

(1.3.处理流程)

下面将描述根据实施方式的语音识别设备100的信息处理装置对与语音识别有关的处理的控制。在下文中,集中在语音识别设备100M上并且将描述存在其他语音识别设备100A、100B的情况。

(1)激活词监视过程

首先,基于图5描述激活语音识别的激活词的监视过程。语音识别设备100M通常防止接受要识别的语音并且通过输入激活词来激活语音识别。如果其他语音识别设备100A、100B处于预定范围内,则语音识别设备100M接收这些设备的各自的激活词以确定所述激活词是否与语音识别设备100M的激活词相同或相似。

如图5所示,语音识别设备100M确定是否检测到其他任何语音识别设备(S100)。在没有检测到另一语音识别设备时,重复步骤S100中的过程。当检测到另一语音识别设备时,语音识别设备100M确定在预定范围内是否存在所检测到的另一语音识别设备(S102)。

作为至另一语音识别设备的距离,例如,可以使用包含在蓝牙(注册商标)4.0等的通信信息中的距离信息或者通过GPS(全球定位系统)从位置信息获取的物理距离等。或者,语音识别设备100M可以基于设备间的通信无线电场强度、由麦克风140获取语音或从每个设备输出的声波的幅度、或者语音内容的接近度来估计在预定范围内存在另一语音识别设备。另外,语音识别设备100M可以通过获取信标信息来识别其他语音识别设备的位置。

如果在步骤S102中确定在预定范围内存在另一语音识别设备,则语音识别设备100M接受由另一语音识别设备发送的激活词(S104)。另一方面,如果在预定范围内不存在语音识别设备,则不接受激活词。然后,语音识别设备100M检查在另外设备激活词词典DB 180中存储的激活词中是否存在固定时间段内未被更新的任何旧激活词(S106)。如果存在这样的旧激活词,则语音识别设备100M从另外设备激活词词典DB 180中删除适用的激活词(S108)。

当另外设备激活词词典DB 180中存储的信息在步骤S104、S108中被更新之后,重复进行从步骤S100开始的过程。另外,当在步骤S108中确定不存在旧的激活词时,在语音识别设备100M激活的情况下通过返回到步骤S100中的过程来重复图5中的过程。

(2)相似度确定过程

另一方面,在语音识别设备100M激活的情况下,语音识别设备100M执行确定语音识别设备100M的激活词与另一语音识别设备的激活词之间的相似度的相似度确定过程。相似度确定过程是图6中所示的过程,并且在改变语音识别设备100M的激活词或者添加或修正另一语音识别设备的激活词并且更新另外设备激活词词典DB 180时确定相似度。例如,当执行图5中的步骤S104的过程时,确定相似度。

如图6所示,在相似度确定过程中,首先确定语音识别设备100M的激活词是否被改变(S110)。例如,如果激活词被用户改变,则过程行进至步骤S114以确定相似度。另一方面,如果语音识别设备100M的激活词未被改变,则确定是否另一语音识别设备的激活词被添加或修正并且另外设备激活词词典DB 180被更新(S112)。如果另外设备激活词词典DB 180未被更新,则重复图6中从步骤S110开始的过程。

另一方面,如果另外设备激活词词典DB 180被更新,则由相似度确定单元130通过比较语音识别设备100M的激活词和另外语音识别设备的激活词来计算相似度(S114)。通过使用公知技术来计算激活词之间的相似度。例如,激活词可以被转换成注音符号串以基于注音符号之间的编辑距离表示相似度。例如,关于激活词“Joe(乔)”和“Joey(乔伊)”,“Joe”的注音符号是“jo:”以及“Joey”的注音符号是“jo:i”,如果末端处的“i”被删除,则与“Joe”的发音相同,并且因此,获得编辑距离1。当编辑距离等于预定值或更小时,激活词可以被认为是相似或相同的。或者,如专利文献2所描述的,可以通过使用声学特征量来计算相似度。

在步骤S114中,当计算出激活词之间的相似度时,相似度确定单元130确定这些是否是相同或相似的(S116)。然后,如果在步骤S116中确定另一语音识别设备的激活词与语音识别设备100M的激活词相同或相似,则控制单元120经由输出单元160向用户发出警告(S118)。

例如,假设如图4中所示语音识别设备100M的激活词是“乔”并且存在激活词为“乔伊”的另一语音识别设备“智能手机01”。在这种情况下,控制单元120向输出单元160输出类似于“附近的设备‘智能手机01’名为‘乔伊’”的警告。接收到这样的警告的用户可以认识到存在由另一用户说出“乔伊”来激活语音识别设备100M的语音识别的可能性。

在实施方式中,通过显示消息向用户发出警告,但是本公开内容不限于这样的示例。例如,可以通过声音或振动来向用户发出警告。或者,可以经由除了语音识别设备以外的另一终端向用户发出警告。例如,如果语音识别设备100M是手环型终端,则可以从用户持有的智能手机通过消息、声音或振动发出警告。

鉴于此,语音识别设备100M的控制单元120可以执行预定过程,使得不在用户不希望的情况下激活语音识别。例如,当发出警告后,控制单元120可以停止语音识别设备100M的语音识别功能,并且即使说出了语音识别设备100M的激活词,也可以防止语音识别起作用。或者,当基于另一语音识别设备的激活词的注册或修正发出警告时,控制单元120可以在发出警告时提示暂时改变语音识别设备100M的激活词。在这种情况下,可以通过控制单元120呈现不与另一语音识别设备的激活词相同或相似的激活词,使得暂时使用所呈现的激活词。

当由于语音识别设备100M的激活词的改变而发出警告时,控制单元120可以在不接受语音识别设备100M的激活词的改变的情况下提示注册另一激活词。以此方式,当在语音识别设备100M的预定范围内存在被设置了相同或相似的激活词的另一语音识别设备时,可以通过由控制单元120执行的预定处理防止语音识别在用户不希望的情况下被激活。

然后,控制单元120确定另一语音识别设备现在是否位于语音识别设备100M的预定范围外(S120)。当被设置了相同或相似的激活词的另一语音识别设备处于语音识别设备100M的预定范围内时,在步骤S118中继续发出警告。然后,当另一语音识别设备位于语音识别设备100M的预定范围外时,控制单元120终止发出警告(S122)。因此,用户能够认识到消除了由另一用户的话语激活语音识别的可能性。鉴于此,如果当输出警告时存在由控制单元120执行的任何预定过程,则也终止该过程。在语音识别设备100M激活的情况下重复图6中的过程。

(1.4.总结)

前面描述了根据本公开内容的第一实施方式的语音识别设备中的与语音识别的激活有关的过程。根据实施方式,当在语音识别设备100M的预定范围内存在另一语音识别设备时,确定激活语音识别的激活词的相似度。当激活词被确定为相同或相似时,存在语音识别设备100M的语音识别被无意激活的可能性,因此,向语音识别设备100M的用户发出警告。因此,可以提示用户要小心。此外,当向用户发出警告时,控制单元120可以执行预定过程,使得语音识别设备100M的语音识别不会被无意激活。因此,通过在语音识别设备中包括根据本公开内容的实施方式的信息处理装置,能够抑制语音识别期间的故障。

<2.第二实施方式>

接下来,基于图7和图8来描述根据本公开内容的第二实施方式的包括信息处理装置的语音识别设备。根据实施方式的语音识别设备的信息处理装置与第一实施方式的不同之处在于:激活词识别单元150除了参照激活词词典DB 170以外还参照另外设备激活词词典DB 180。因此,能够改进激活词识别单元150的识别性能。

(2.1.功能配置)

图7示出了根据实施方式的语音识别设备100的功能配置。如图7所示,语音识别设备100包括通信单元110、控制单元120、相似度确定单元130、麦克风140、激活词识别单元150、输出单元160、激活词词典DB 170以及另外设备激活词词典DB 180。上述配置与图3中所示的根据第一实施方式的语音识别设备100的功能配置相同。因此,在此省略对每个功能单元的详细描述。

与第一实施方式的不同之处在于:激活词识别单元150还参照另外设备激活词词典DB 180。实施方式中的激活词识别单元150确定语音识别设备100M的激活词与被存储在另外设备激活词词典DB 180中的激活词有多接近。因此,减少激活词的识别错误。

例如,假设设置语音识别设备100M的激活词为“乔”。激活词“乔”被存储在激活词词典DB 170中。另一方面,假设激活词是“乔伊”的设备的存在被存储在另外设备激活词词典DB 180中。如果语音识别设备100M的用户说出“乔”,则激活词识别单元150通过参照激活词词典DB 170确定输入的语音是否与所设置的激活词相同或相似。此外,激活词识别单元150通过参照另外设备激活词词典DB 180来计算输入的语音与其他语音识别设备的激活词有多接近。

然后,激活词识别单元150确定输入的语音更接近语音识别设备100M的激活词和其他语音识别设备的激活词中的哪个。确定输入的语音更接近另一语音识别设备的激活语音,激活词识别单元150确定输入的语音很可能不是语音识别设备100M的激活词并且取消激活词的输入。因此,减少激活词的识别错误。

(2.2.过程流程)

下面将描述根据实施方式的语音识别设备100的信息处理装置的激活词识别过程。此外,在实施方式中,类似于第一实施方式,集中于语音识别设备100M,并且将描述存在其他语音识别设备100A、100B的情况。

激活词识别单元150监视以检查麦克风140是否已获取语音(S200)。激活词识别单元150重复步骤S200中的过程直到获取到语音。然后,当语音被获取时,激活词识别单元150将输入的语音与语音识别设备100M的被存储在激活词词典DB 170中的激活词进行匹配,以确定输入的语音是否是激活语音识别的激活词(骤S202)。匹配的结果被表示为与激活词的相似度。

然后,激活词识别单元150确定输入的语音是否接近语音识别设备100M的激活词(S204)。也就是说,激活词识别单元150确定输入的语音与语音识别设备100M的激活词的相似度是否等于预定值或更大。如果相似度小于预定值,则确定输入的语音不是语音识别设备100M的激活词并且重复从步骤S200开始的过程。另一方面,如果相似度等于预定值或更大,则激活词识别单元150还将输入的语音与另一语音识别设备的被存储在另外设备激活词词典DB 180中的激活词进行匹配(S206)。在步骤S206中,计算输入的语音与另一语音识别设备的激活词之间的相似度。当多个语音识别设备的激活词被输入另外设备激活词词典DB 180中时,针对每个语音设备的激活词计算相似度。

然后,激活词识别单元150确定输入的语音是否最接近语音识别设备100M的激活词而不是其他语音识别设备的激活词(S208)。在步骤S208中,激活词识别单元150确保在步骤S202中计算的与语音识别设备100M的相似度大于在步骤S206中计算的与另一语音识别设备的激活词的相似度。如果确定输入的语音最接近语音识别设备100M的激活词,则激活词识别单元150向控制单元120通知该激活词已被输入,以使得控制单元激活语音识别(S210)。另一方面,如果输入的语音更接近另一语音识别设备的激活词,则认为输入的语音不是该激活词并且重复从步骤S200开始的过程。在语音识别设备100M激活的情况下重复图8中的过程。

上面描述了根据本公开内容的第二实施方式的对语音识别功能的激活词进行识别的过程。根据实施方式,当由麦克风140获取到语音时,除了确定输入的语音是否是语音识别设备100M的激活词以外,确定输入的语音比其他语音识别设备的激活词更接近语音识别设备100M的激活词。因此,可以减少激活词的识别错误。

在实施方式中,输入的语音与语音识别设备100M的激活词的相似度的计算和输入的语音与其他语音识别设备的激活词的相似度的计算是分开进行的,但本发明不限于这样的示例。例如,可以计算输入的语音与语音识别设备100M和其他语音识别设备的激活词的相似度以基于最大相似度的激活词是否是语音识别设备100M的激活词来确定是否激活语音识别。

<3.第三实施方式>

接下来,基于图9至图11描述根据本公开内容的第三实施方式的包括信息处理装置的语音识别设备。在实施方式中,如图9所示,考虑下述情况:存在连接到网络的一个或更多个语音识别设备100A、100B,以及存在以自组织模式连接到这些识别设备中的语音识别设备100A的语音识别设备100M。可以基于Wi-Fi(注册商标)、蓝牙(注册商标)或者ZigBee(注册商标)的标准来执行自组织通信。

在实施方式中,当经由自组织通信连接到语音识别设备100A时,语音识别设备100M还可以经由语音识别设备100A获取语音识别设备100A连接到的网络中的语音识别设备100B的激活词。此外,语音识别设备100M的激活词经由语音识别设备100A发送到语音识别设备100B。也就是说,连接到固定网络并且接受自组织通信连接的语音识别设备100A用作网关以经由自组织通信和固定网络向其他语音识别设备发送每个语音识别设备的激活词。

因此,在实施方式中,通过简单地连接语音识别设备100A和语音识别设备100M,在语音识别设备100A、语音识别设备100B、语音识别设备100M之间共享各自的激活词。类似地,当网络中的语音识别设备增加或者通过自组织网络连接的语音识别设备增加时,可以共享激活词。

根据实施方式的语音识别设备100的功能配置可以与图3中所示的第一实施方式的功能配置相同或者与图7中所示的第二实施方式的功能配置相同。因此,在此省略对语音识别设备100的功能配置的描述。顺便地,通信单元110基于以太网(注册商标)、Wi-Fi(注册商标)、蓝牙(注册商标)4.0等来实现。

基于图10和图11来描述根据实施方式的语音识别设备100的激活词的交换过程。图10是示出通过根据实施方式的语音识别设备中的连接到固定网络或者通过自组织通信连接的设备(即,图9中的语音识别设备100B、语音识别设备100M)的激活词的交换过程的流程图。图11是示出根据实施方式的语音识别设备中的连接到固定网络并且能够执行自组织通信的设备(即,图9中的语音识别设备100A)的激活词的交换过程的流程图。

(1)语音识别设备100B、语音识别设备100M的激活词的交换过程

首先,如图10所示,描述由语音识别设备100B、语音识别设备100M进行的激活词的交换过程。语音识别设备100B、语音识别设备100M首先确定是否连接到网络(S300)。如果未连接到网络,则清除另外设备激活词词典DB 180中的信息(S302),并且重复从步骤S300开始的过程。另一方面,如果连接到网络,则是否在发送激活词之后经过固定时间(S304),并且重复从步骤S300开始的过程,直到经过固定时间。

如果在步骤S304中确定在激活词被发送之后经过固定时间,则控制单元120经由通信单元110向其他语音识别设备发送对语音识别设备100B、语音识别设备100M的激活词的添加(S306)。因此,例如,连接到固定网络的语音识别设备100A接收语音识别设备100B的激活词的添加请求并且将语音识别设备100B的激活词记录在语音识别设备100A的另外设备激活词词典DB 180中。另外,通过自组织通信连接的语音识别设备100A接收语音识别设备100M的激活词的添加请求并且将语音识别设备100M的激活词记录在语音识别设备100A的另外设备激活词词典DB 180中。

在语音识别设备100B、语音识别设备100M激活的情况下,重复图10中所示的激活词的交换过程。

(2)由语音识别设备100A进行的激活词的交换过程

接下来,描述由语音识别设备100A进行的激活词的交换过程。另外,在这种情况下,如图11所示,首先,语音识别设备100A确定是否连接到网络(S310)。如果未连接到网络,则清除另外设备激活词词典DB 180中的信息(S312),并且重复从步骤S310开始的过程。另一方面,如果连接到网络,则是否在激活词被发送之后经过固定时间(S314),并且重复从步骤S310开始的过程直到经过固定时间。

如果确定在激活词被发送之后经过固定时间,则控制单元120经由通信单元110发送语音识别设备100A的激活词和通过自组织通信连接到固定网络的语音识别设备100M的激活词的添加(S316)。因此,连接到固定网络的语音识别设备100B接收语音识别设备100A、语音识别设备100M的激活词并且将激活词记录在语音识别设备100B的另外设备激活词词典DB 180中。此外,控制单元120经由通信单元110向通过自组织通信连接的语音识别设备100M发送被记录在语音识别设备100A的激活词词典DB 170和另外设备激活词词典DB 180中的信息(S318)。在这种情况下,发送到语音识别设备100M的信息不包含作为信息的目的地的语音识别设备100M的激活词。语音识别设备100M将从语音识别设备100A接收的信息记录在语音识别设备100M的另外设备激活词词典DB 180中。

在语音识别设备100A激活的情况下,还重复图11中所示的激活词的交换过程。

前面描述了根据实施方式的语音识别设备之间的激活词的交换过程。根据实施方式,当存在通过固定网络连接的语音识别设备100A、语音识别设备100B以及语音识别设备100M时,如果语音识别设备100A、语音识别设备100M通过自组织通信连接,则语音识别设备100A向语音识别设备100M发送包括语音识别设备100B的信息的信息。也就是说,语音识别设备100A作为语音识别设备100B、语音识别设备100M的中介发送和接收信息。

例如,当通过能够粗略计算的蓝牙(注册商标)4.0连接自组织通信时,可以根据设备之间的距离交换关于语音识别的信息。例如,仅当语音识别设备100A、语音识别设备100M之间的距离等于预定距离或更小并且被确定为“接近”时可以交换信息。因此,仅当关于语音识别的信息成为必要时交换信息。

例如,还假设除了语音识别设备100A、语音识别设备100B以外,语音识别设备100C连接到图9所示的固定网络。语音识别设备100A、语音识别设备100B和语音识别设备100C在物理上分开。例如,语音识别设备100A、语音识别设备100B位于建筑物的第一层并且语音识别设备100C位于建筑物的第二层。在这种情况下,语音识别设备100A、语音识别设备100B可以被设置为第一组并且语音识别设备100C被设置为第二组,使得仅关于同一组的语音识别设备的语音识别的信息被发送到通过通信连接的其他设备。

例如,假设语音识别设备100A和语音识别设备100M通过自组织通信连接。在这种情况下,语音识别设备100A向语音识别设备100M发送包括关于属于同一组的语音识别设备100B的信息的信息,但是不发送关于属于不同组的语音识别设备100C的信息。例如,当语音识别设备100C、语音识别设备100M通过自组织通信连接时,交换关于语音识别设备100C的语音识别的信息。

此外,信标可以安装在用于测量语音识别设备之间的距离的空间中。例如,信标X和语音识别设备100A、语音识别设备100B预先关联为一组,并且当语音识别设备100M与信标点X之间的距离等于预定距离或更小时,语音识别设备100M获取并且使用语音识别设备100A、语音识别设备100B的语音识别信息。在这种情况下,信息可以通过语音识别设备100M与语音识别设备100A或语音识别设备100B之间的自组织通信在语音识别设备100M与语音识别设备100A、语音识别设备100B之间交换。或者,可以通过发送因特网上的存在关于语音识别的信息的位置的通知来交换信息。

<4.第四实施方式>

接下来,基于图12描述根据本公开内容的第四实施方式的语音识别设备之间的信息交换过程。在实施方式中,描述了在语音识别设备100之间交换激活词的情况,但是要交换的关于语音识别的信息可以是除了激活词以外的信息,并且例如可以是针对每个用户设置的并且可由语音识别来识别的词信息(下文中,也称为“用户词典”)。

作为示例,如图12所示,将考虑用户从自动售货机300购买饮品的情况。自动售货机300配备有语音识别功能并且可以通过例如用户说出所期望的饮品的名称来选择和购买饮品。另外,用户佩戴配备有语音识别功能的眼镜型终端200。眼镜型终端200和自动售货机300可以经由自组织通信或网络5进行通信。

这里假设用户位于自动售货机300的预定范围内(例如,从自动售货机300的前侧一米以内的范围内)。在这种情况下,自动售货机300可以从用户所佩戴的眼镜型终端200获取用户的用户词典。在用户词典被自动售货机300获取的情况下,用户可以使用由通过用户单独设置的语音识别所识别的词从自动售货机300购买商品。例如,如果在用户词典中“Ocha(茶)”和词“Ryokucha(绿茶)”相关联,则当用户说出“Ocha”时,自动售货机300通过参照用户词典选择绿茶。

当用户购买饮品并且从自动售货机300远离自动售货机300的预定范围时,自动售货机300删除用户的用户词典。或者,自动售货机300可以在用户购买饮品后经过预定时间的情况下删除用户的用户辞典。因此,自动售货机300能够暂时获取用户词典并且当词典变得不需要时删除词典。

在上述情况下,描述了从用户所佩戴的眼镜型终端200向自动售货机300提供用户词典并且由自动售货机300将用户的输入语音匹配到相应商品的示例,但是本技术不限于这样的示例。例如,当用户位于自动售货机300的预定范围内时,眼镜型终端200可以从自动售货机300获取商品信息。在这种情况下,通过眼镜型终端200将用户的输入语音匹配到相应商品并且眼镜型终端200基于匹配结果向自动售货机300通知用户想要的商品。接收到通知后,自动售货机300选择所通知的商品。在这种情况下,自动售货机300不需要配备语音识别功能,并且仅需要能够从眼镜型终端200接收信息和向眼镜型终端200发送信息。

或者,当经由网络5连接的服务器400拥有用户词典时,自动售货机300可以从服务器400获取用户词典以将用户的输入语音匹配到用户词典。例如,自动售货机300经由用户所佩戴的眼镜型终端200等获取位于预定范围内的用户的用户ID并且经由网络5向服务器400通知用户ID。服务器400向自动售货机300发送与用户ID对应的用户词典。具有所获取的用户词典的自动售货机300能够在接收到用户的输入语音后基于用户词典识别相应商品。顺便地,可以在服务器400侧进行用户的输入语音到相应商品的匹配。

除了自动售货机300以外,例如,当在公共电话中暂时提供电话簿信息时,可以使用这样的信息交换过程。

在上文中,描述了根据本公开内容的第四实施方式的语音识别设备之间的信息交换过程。根据实施方式,除了激活语音识别的激活词以外,通过基于语音识别设备之间的物理关系交换语音可识别词信息,使针对每个用户的设置能够暂时可用于其他设备。因此,用户能够以相同的方式使用任何设备的语音识别功能,提高了用户的便利性。此外,当设备彼此离开时,由设备彼此更接近形成的信息交换的路径消失并且信息也被删除。因此,不会继续积累不再使用的信息。

当语音识别设备是可穿戴式终端时,可以设置语音识别的特定于用户的参数。在这样的情况下,通过经由网络对可穿戴式终端拥有的语音识别参数如激活词或用户词典进行通信,可以进一步提高连接到固定网络的外围设备的固定词的识别性能。例如,可以发送用户的属性信息如语音识别设备的所有者的性别和年龄。

(5.硬件配置示例)

最后,描述根据实施方式的语音识别设备100的硬件配置示例。图13是示出根据实施方式的语音识别设备100的硬件配置的硬件配置图。

如上所述,语音识别设备100可以通过处理装置如计算机来实现。如图13所示,语音识别设备100包括中央处理单元(CPU)901、只读存储器(ROM)902、随机存取存储器(RAM)903以及主机总线904a。语音识别设备100还包括桥接器904、外部总线904b、接口905、输入设备906、输出设备907、存储设备(硬盘驱动器)908、驱动器909、连接端口911以及通信设备913。

CPU 901用作算术处理单元和控制单元,并且对根据各种程序控制语音识别设备100的总体操作。CPU 901也可以是微处理器。ROM 902中存储有由CPU 901使用的程序、操作参数等。RAM 903中暂时存储由CPU 901使用和执行的程序、在执行程序时适当变化的参数等。这些通过由CPU总线等构成的主机总线904a彼此连接。

主机总线904a通过桥接器904连接到外部总线904b如外围组件互连/接口(PCI)总线。应注意,主机总线904a、桥接器904和外部总线904b不必单独配置,这些的功能可以由单一总线来实现。

输入设备906包括:用于由用户输入信息的输入单元,如鼠标、键盘、触摸面板、按钮、麦克风、开关或控制杆;基于用户的输入来生成输入信号并且将信号输出到CPU 901的输入控制电路;等。输出设备907包括:显示设备如液晶显示器(LCD)设备、有机发光二极管(OLED)设备或者灯;以及音频输出设备如扬声器。

存储设备908是语音识别设备100的存储单元的示例,并且是用于存储数据的设备。存储设备908可以包括存储介质、将数据记录在存储介质中的记录器、从存储介质中读取数据的读取器、删除被记录在存储介质中的数据的删除设备等。存储设备908驱动硬盘并且存储各种数据和由CPU 901执行的程序。

驱动器909是读取器/写入器,并且内置或外部连接到语音识别设备100。驱动器909读取被记录在驱动器909中所加载的可移动记录介质如磁盘、光盘、磁光盘或半导体存储器中的信息,并且将信息输出到RAM 903。

连接端口911是连接到外部设备的接口,并且是与外部设备连接的能够通过其发送数据的端口,例如,通用串行总线(USB)。通信设备913是由用于连接到例如通信网络5的通信设备等构成的通信接口。通信设备913可以是支持无线局域网(LAN)的通信设备、支持无线USB的通信设备或者用于执行有线通信的有线通信设备。

本领域技术人员应理解,根据设计要求和其他因素,只要在所附权利要求或其等同的范围内,则可以进行各种修改、组合、子组合和替换。

在实施方式中,例如,语音识别设备例如是智能手机、眼镜型终端、头戴式显示器、吊坠型终端、手环型终端或指环型终端,但是本技术不限于这样的示例。例如,语音识别设备可以是例如电视机、游戏机、微波炉、音频设备、照明装置、扬声器、平板电脑终端、个人计算机、汽车、车载设备或医疗设备如内窥镜。

此外,本说明书中描述的效果仅是说明性的和示例性的,而不是限制性的。换言之,连同或替代基于本说明书的效果,根据本公开内容的技术可以显示对于本领域技术人员而言明显的其他效果。

(1)一种第一装置,包括:

通信单元,被配置成基于所述第一装置与第二装置之间的关系来发送允许所述第二装置对所存储的语音识别信息进行修改的信息。

(2)根据(1)所述的第一装置,其中,所述通信单元被配置成基于所述第一装置与所述第二装置之间的所述关系来提供或授权用于在所述第二装置处接收的第一语音识别信息作为所发送的信息。

(3)根据(1)或(2)所述的第一装置,其中,所述第一装置与所述第二装置之间的所述关系是所述第一装置与所述第二装置之间的距离的变化。

(4)根据(1)至(3)中任一项所述的第一装置,其中,所述第一装置与所述第二装置之间的所述关系是在所述第一装置与所述第二装置之间的通信之后所经过的时间。

(5)根据(1)至(4)中任一项所述的第一装置,其中,所述第一装置与所述第二装置之间的所述关系是所述第一装置与所述第二装置之间的通信无线电场强度的变化。

(6)根据(1)至(5)中任一项所述的第一装置,其中,所述语音识别信息包括至少一个语音激活词。

(7)根据(1)至(6)中任一项所述的第一装置,其中,所述语音识别信息是与所述第一设备相关联的特定于用户的词典,所述特定于用户的词典包括所述至少一个语音激活词或者不是语音激活词的至少一个语音识别词。

(8)根据(1)至(7)中任一项所述的第一装置,其中,所述第二装置的所存储的语音识别信息包括与所述第二设备相关联的第二语音识别信息。

(9)根据(1)至(8)中任一项所述的第一装置,其中,所述第二装置通过以下方式基于所述第一装置与所述第二装置之间的所述关系修改所存储的语音识别信息:更新所存储的语音识别信息以包括所述第一语音识别信息。

(10)根据(1)至(8)中任一项所述的第一装置,其中,所述第二装置通过以下方式基于所述第一装置与所述第二装置之间的所述关系修改所存储的语音识别信息:更新所述第二语音识别信息以包括所述第一语音识别信息。

(11)根据(1)至(10)中任一项所述的第一装置,其中,所述第二装置通过以下方式基于所述第一装置与所述第二装置之间的所述关系修改所述第一语音识别信息:更新所存储的语音识别信息以从所存储的语音识别信息中去除所述第一语音识别信息。

(12)根据(1)至(11)中任一项所述的第一装置,其中,所述第二装置将所述第一语音识别信息与所述第二语音识别信息进行比较。

(13)根据(1)至(12)中任一项所述的第一装置,其中,当所述第一语音识别信息与所述第二语音识别信息相同或相似时,所述第一装置或所述第二装置中至少之一使语音识别功能失活。

(14)根据(1)至(13)中任一项所述的第一装置,其中,所述第一语音识别信息和所述第二语音识别信息基于注音符号串分析而相同或相似。

(15)根据(1)至(14)中任一项所述的第一装置,其中,如果所述第一语音识别信息和所述第二语音识别信息是相同或相似的,则所述第一装置或所述第二装置中至少之一发出潜在语音识别冲突的警告。

(16)根据(1)至(15)中任一项所述的第一装置,其中,所述第一语音识别信息和所述第二语音识别信息基于注音符号串分析而相同或相似。

(17)根据(1)至(16)中任一项所述的第一装置,其中,所述第二装置从服务器接收所述第一语音识别信息。

(18)根据(1)至(17)中任一项所述的第一装置,其中,基于所述第二装置从所述第一装置接收所述第一装置的标识信息,所述第二装置从所述服务器接收所述第一语音识别信息。

(19)一种方法,包括:

基于第一装置和第二装置之间的关系从所述第一装置向所述第二装置发送信息以允许所述第二装置对所存储的语音识别信息进行修改。

(20)一种其上包含有程序的非暂态计算机可读介质,所述程序在被第一装置的处理器执行时使所述第一装置执行方法,所述方法包括:

基于所述第一装置与第二装置之间的关系来发送允许所述第二装置对所存储的语音识别信息进行修改的信息。

(21)一种系统,包括:

第一装置;以及

第二装置,

其中,所述第一装置基于所述第一装置与所述第二装置之间的关系来发送允许所述第二装置对所存储的语音识别信息进行修改的信息。

(22)一种信息处理装置,包括:

控制单元,被配置成基于具有语音识别功能的设备之间的关系改变与第一设备的语音识别有关的过程。

(23)根据(22)所述的信息处理装置,

其中,所述控制单元基于所述设备之间的距离来控制是否接受使所述第一设备执行与所述语音识别有关的所述过程的激活词。

(24)根据(23)所述的信息处理装置,

其中,所述控制单元接受位于所述第一设备的预定范围内的设备的所述激活词。

(25)根据(24)所述的信息处理装置,

其中,所述控制单元将从所述设备接受的所述激活词记录在激活词存储单元中。

(26)根据(22)至(25)中任一项所述的信息处理装置,

其中,所述控制单元基于所述设备之间的关系接受来自不是所述第一设备的设备的词典信息,所述词典信息包含由所述设备用于语音识别的至少一个激活词。

(27)根据(26)所述的信息处理装置,

其中,所述词典信息包含由所述设备接收的另一设备的激活词。

(28)根据(26)或(27)所述的信息处理装置,

其中,当所述词典信息存在于经由网络连接到所述第一设备的服务器上时,所述控制单元从所述设备接收指示所述词典信息在网络中的位置的信息,而不是接收所述词典信息。

(29)根据(26)至(28)中任一项所述的信息处理装置,

其中,所述控制单元从位于所述第一设备的预定范围内的设备接收所述词典信息。

(30)根据(26)至(29)中任一项所述的信息处理装置,

其中,所述控制单元使发送单元将所述第一设备的词典信息发送至位于所述第一设备的预定范围内的设备。

(31)根据(26)至(30)中任一项所述的信息处理装置,

其中,当位于所述第一设备的预定范围内的设备位于所述预定范围外时,所述控制单元删除所述设备的词典信息。

(32)根据(26)至(30)中任一项所述的信息处理装置,

其中,所述控制单元删除在预定时间段内未被更新的词典信息。

(33)根据(26)至(30)中任一项所述的信息处理装置,

其中,当接收到所述词典信息之后经过预定时间时,所述控制单元删除所述词典信息。

(34)根据(22)至(33)中任一项所述的信息处理装置,还包括:

相似度确定单元,被配置成确定词的相似度,其中,当所述相似度确定单元确定所述第一设备的激活词和不是所述第一设备的设备的激活词相同或相似时,所述控制单元向所述第一设备的用户发出警告。

(35)根据(22)至(34)中任一项所述的信息处理装置,还包括:

相似度确定单元,被配置成确定词的相似度,其中,当所述相似度确定单元确定所述第一设备的激活词和不是所述第一设备的设备的激活词相同或相似时,所述控制单元指示所述第一设备的用户暂时改变所述第一设备的激活词。

(36)根据(22)至(34)中任一项所述的信息处理装置,还包括:

相似度确定单元,被配置成确定词的相似度,其中,当所述相似度确定单元确定所述第一设备的激活词和不是所述第一设备的设备的激活词相同或相似时,所述控制单元在不是所述第一设备的设备位于所述第一设备的预定范围内的情况下阻止所述第一设备的所述语音识别功能起作用。

(37)根据(22)至(36)中任一项所述的信息处理装置,

其中,所述设备之间的关系是基于所述设备之间的通信无线电场强度确定的。

(38)一种信息处理方法,包括:

基于具有语音识别功能的设备之间的关系,通过信息处理装置改变与第一设备的语音识别有关的过程。

(39)一种程序,用于使计算机执行以下过程:

基于具有语音识别功能的设备之间的关系改变与第一设备的语音识别有关的过程。

附图标记列表

100 语音识别设备

110 通信单元

120 控制单元

130 相似度确定单元

140 麦克风

150 激活词识别单元

160 输出单元

170 激活词词典DB

180 另外设备激活词词典DB

200 眼镜型终端

300 自动售货机

400 服务器

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1