接近感知语音代理的制作方法

文档序号:17652076发布日期:2019-05-15 21:31阅读:153来源:国知局
接近感知语音代理的制作方法

本公开的各方面大体上涉及接近感知语音代理。



背景技术:

例如语音代理装置等个人助理装置正变得越来越流行。这些装置可包括语音控制的个人助理,其基于用户音频命令来实现人工智能。语音代理装置的一些示例可包括amazonecho,amazondot,googleathome等。这样的语音代理可使用语音命令作为与其处理器的主接口。可在装置内的传声器处接收音频命令。接着可以将音频命令发送到处理器来实施所述命令。



技术实现要素:

被配置为控制伴随装置的个人助理装置可以包括:存储器,被配置为维持伴随装置库,所述伴随装置库包括多个伴随装置,每个伴随装置与至少一个长名称,快捷名称和伴随装置房间位置相关联;以及处理器。处理器可以被配置为从传声器接收用户命令,从用户命令提取伴随装置名称和动作,确定伴随装置名称是否包括唯一名称,并响应于用户命令包括唯一名称,命令与所述唯一名称相关联的伴随装置来执行来自用户命令的动作。

被配置为控制伴随装置的个人助理装置可以包括:存储器,所述存储器被配置为维持伴随装置库,所述伴随装置库包括多个伴随装置,每个伴随装置与至少一个长名称,快捷名称和伴随装置房间位置相关联,传声器被配置为接收用户命令;以及处理器。处理器可以被配置为从传声器接收用户命令,从用户命令识别用户房间位置,从用户命令提取伴随装置名称,基于伴随装置库内的伴随装置名称来识别伴随装置房间位置,确定用户房间位置是否与伴随装置房间位置相同,并且响应于用户房间位置与伴随装置房间位置相同,向与伴随装置名称相关联的伴随装置提供至少一个命令。

一种方法可以包括接收用户命令并从用户命令提取伴随装置名称和动作。所述方法还可以包括:基于伴随装置名称来识别伴随装置房间位置;确定是否从与伴随装置房间位置相同的用户房间位置接收到用户命令;响应于用户房间位置与伴随装置房间位置相同,向与伴随装置名称相关联的伴随装置提供至少一个命令。

附图说明

本公开的实施例在所附权利要求中详细指出。然而,通过结合附图参考以下具体描述,各种实施例的其他特征将变得更显而易见,并且将得到最好的理解,在附图中:

图1示出了根据一个或多个实施例的包括示例智能个人助理装置的系统;

图2示出了示例伴随装置库;

图3示出了包括多个房间,个人助理装置和伴随装置的示例家庭;

图4示出了用于个人助理识别的示例数据库;以及

图5示出了个人助理装置识别房间并向其中一个伴随装置提供命令的示例过程。

具体实施方式

根据要求,本文中公开了本发明的详细实施例;但应理解,所公开的实施例仅示例性说明本发明,本发明可体现为不同和替代形式。附图不一定按比例绘制;一些特征可能会被放大或最小化以示出特定部件的细节。因此,本文中公开的具体结构细节和功能细节不应被解释为是限制性的,而是仅仅作为教导本领域技术人员以不同方式来利用本发明的代表性基础。

个人助理装置可以包括语音控制的个人助理,其基于用户音频命令来实现人工智能。语音代理装置的一些示例可包括amazonecho,amazondot,googleathome等。这样的语音代理可使用语音命令作为与其处理器的主接口。可在装置内的传声器处接收音频命令。接着可以将音频命令发送到处理器来实施所述命令。在一些示例中,音频命令可以在外部发射到基于云的处理器,例如由amazonecho,amazondot,googleathome等使用的处理器。

通常,单个家庭可包括一个以上个人助理装置。举例来说,家庭可以包括位于厨房,卧室,家庭办公室等中的每一个处的个人助理装置。个人助理装置也可以是便携式的,并且可以在家中从一个房间移动到另一个房间。个人助理装置的位置可以提供有价值的上下文,并使装置能够更好地定制其提供的信息,以及根据位置来控制其他装置。

在具有多个语音代理装置的家中,每个装置都能够控制其他伴随装置,例如扬声器,灯,报警系统等。在一个示例中,厨房和卧室中的每一个可具有通过个人助理装置经由音频命令来控制的灯。当用户在卧室并说“开灯”时,卧室灯可打开。但是,如果个人助理装置不知道装置的位置,那么个人助理装置可指示错误的灯打开,例如,指示厨房灯打开。用户可以将这样的灯标记为“卧室灯”。然而,这种加标签或群集可要求用户记住每个标签。此外,客人和儿童可能不知道与每个装置或每个房间相关的标签。此外,一个组或群集无法具有相同的名称,例如“灯”,而是要求每个组具有不同的名称,例如“厨房灯”。

本文公开了一种用于允许家庭中的多个伴随装置共享相同的快捷名称(例如“灯”)的系统。所述系统允许一个或多个个人助理装置控制家庭中共享相同快捷名称(例如“灯”)的多个伴随装置。在确定用户所在的房间或位置时,语音代理装置可接着执行若干检验。第一检验可以是确定是否辨识到伴随装置名称。举例来说,语音代理装置可以通过用户命令中给出的名称来确定它是否控制伴随装置。第二检验可以是确定伴随装置名称是否是唯一名称。也就是说,装置名称是与特定伴随装置或装置群组相关联的装置名称。举例来说,“厨房灯”将是唯一装置名称,而“灯”可能不是。第三检验可以包括确定由装置名称定义的伴随装置是否位于房间或位置内。

通过确定用户的位置并通过确定个人助理装置的位置,个人助理装置可以确定用户希望控制哪些伴随装置。如果用户说出包括不在用户的当前房间内的伴随装置的装置名称的命令,那么个人助理装置可以生成警报,并向用户指示所述警报。因此,要求用户方进行较少的学习和记忆,实现对伴随装置的更精确控制,并且欣赏总体上更灵活且更容易使用的系统。

图1示出了包括示例智能个人助理装置102的系统100。个人助理装置102通过传声器104或其他音频输入来接收音频,并且通过模/数(a/d)转换器106来传递音频,以由音频处理器108识别或以其他方式处理。音频处理器108还产生话音或其他音频输出,其可以传递经过数/模(d/a)转换器112和放大器114,以便由一个或多个扬声器116再现。个人助理装置102还包括控制器118,控制器118连接到音频处理器108,并且被配置为经由伴随装置库132管理各种伴随装置。

控制器118还与无线收发器124介接,以促进个人助理装置102与通信网络126的通信。在许多示例中,控制器118还连接到一个或多个人机界面(hmi)控件128以接收用户输入,以及显示屏130以提供视觉输出。应注意,所示出的系统100仅为实例,且可使用更多、更少和/或以不同方式定位的元件。

a/d转换器106从传声器104接收音频输入信号。a/d转换器106将接收到的信号从模拟格式转换为数字格式的数字信号,以供音频处理器108进一步处理。

虽然仅示出了一个,但是个人助理装置102中可以包括一个或多个音频处理器108。音频处理器108可以是能够处理音频和/或视频信号的一个或多个计算装置,例如计算机处理器,微处理器,数字信号处理器或任何其他装置,一系列装置或能够执行逻辑运算的其他机构。音频处理器108可以与存储器110相关联地操作以执行存储在存储器110中的指令。指令可以是软件,固件,计算机代码或其某种组合的形式,并且当由音频处理器108执行时,可以提供个人助理装置102的音频识别和音频生成功能。在接收到的音频的辨别处理之前,指令还可以提供音频清理(例如,降噪,滤波等)。存储器110可为任何形式的一个或多个数据存储装置,例如易失性存储器、非易失性存储器、电子存储器、磁性存储器、光学存储器,或任何其它形式的数据存储装置。除了指令之外,操作参数和数据还可以存储在存储器110中,例如用于从文本数据创建话音的音素词汇表。

d/a转换器112接收来自音频处理器108的数字输出信号,并将其从数字格式转换为模拟格式的输出信号。接着可使输出信号可供放大器114或其他模拟部件使用以进行进一步处理。

放大器114可为接收相对较小振幅的音频输入信号的任何电路或独立装置,并输出相对较大振幅的类似音频信号。音频输入信号可以由放大器114接收,并且在到扬声器116的一个或多个连接上输出。除了放大音频信号的振幅之外,放大器114还可以包括信号处理能力以使相位移位,调整频率均衡,调整延迟或执行音频信号的任何其他形式的操纵或调整以准备提供给扬声器116。举例来说,当装置102没有显示屏130或用户需要不涉及观看装置的交互时,扬声器116可以是主要的指令介质。信号处理功能可以附加地或替代地在音频处理器108的域内发生。而且,放大器114可以包括调整提供给扬声器116的音频信号的音量,平衡和/或衰减的能力。

在替代示例中,可以省略放大器114,例如当扬声器116是一组耳机的形式时,或者当音频输出信道用作另一音频装置(例如音频存储装置或另一个音频处理器装置)的输入时。在其他示例中,扬声器116可以包括放大器114,使得扬声器116是自供电的。

扬声器116可以具有各种尺寸,并且可以在各种频率范围内操作。每个扬声器116可以包括单个换能器,或者在其他情况下可以包括多个换能器。扬声器116还可以在不同的频率范围内操作,例如重低音扬声器,低音扬声器,中音和高音扬声器。个人助理装置102中可以包括多个扬声器116。

控制器118可以包括各种类型的计算装置,以支持执行这里描述的个人辅助装置102的功能。在示例中,控制器118可以包括被配置为执行计算机指令的一个或多个处理器120,以及可以在其上维持计算机可执行指令和/或数据的存储介质122(或存储装置122)。计算机可读存储介质(也称为处理器可读介质或存储装置122)包括任何非暂时性的(例如,有形的)参与提供数据的介质(例如,指令),其可以由计算机(例如,由处理器120)读取。通常,处理器120接收指令和/或数据,例如从存储装置122等到存储器,并使用所述数据来执行指令,从而执行一个或多个进程,包括这里描述的一个或多个进程。计算机可执行指令可从使用多种编程语言和/或技术创建的计算机程序编译或解译,所述编程语言和/或技术包含但不限于,且单独或组合,java、c、c++、c#、assembly、fortran、pascal、visualbasic、python、javascript、perl、pl/sql等。

虽然这里描述的进程和方法被描述为由处理器120执行,但是处理器120可以位于云,另一服务器,装置102中的另一个等中。

如图所示,控制器118可以包括无线收发器124或其他网络硬件,其被配置为促进控制器118与通信网络126上的其他连网装置之间的通信。作为一种可能性,无线收发器124可以是被配置为通过蜂窝电话网络传送数据的蜂窝网络收发器。作为另一种可能性,无线收发器124可以是wi-fi收发器,其被配置为连接到局域无线网络以接入通信网络126。

控制器118可以接收来自人机接口(hmi)控制器128的输入,以提供用户与个人助理装置102的交互。举例来说,控制器118可以与被配置为调用控制器118的功能的一个或多个按钮或其他hmi控制128介接。控制器118还可以驱动或以其他方式与被配置为向用户提供视觉输出的一个或多个显示器130通信,例如,借助于视频控制器。在一些情况下,显示器130(这里也称为显示屏130)可以是进一步被配置为经由视频控制器接收用户触摸输入的触摸屏,而在其他情况下,显示器130可以是仅显示器,而无需触摸输入能力。

伴随装置库132包括伴随装置的数据库,每个伴随装置由快捷方式名称,长名称和房间位置标识。房间位置可以是虚拟助理或伴随装置所在的房间。图2中示出了示例伴随装置库132。伴随装置库132可以存储在装置102,以及单独的服务器、基于云的计算系统等内。

参考图2,例如,伴随装置库132可包括多个快捷名称220,每个快捷名称220与长名称222和伴随装置房间位置224相关联。伴随装置房间位置224可以是伴随装置所在的房间。当装置102位于所述位置时,每个房间可以与应用于音频信号的某些音频设置相关联。也就是说,音频设置可以是每个位置特定的。举例来说,与室外空间相关联的起始音乐类型和音量可能比与家庭办公室相关联的音响类型和音量响。例如均衡,过滤等的其他音频处理属性可以是每个位置特定的,并且在所述位置的伴随装置库内定义。

快捷名称可以包括可适用于一个以上伴随装置的通用名称,例如“灯”或“电视”。长名称可以是标识特定装置并且不重复的唯一名称,例如,值得注意的是,一些快捷方式220名称可以与长名称222相同。实质上,为了控制例如灯或扬声器之类的某个伴随装置,可以通过名称来调用伴随装置。此名称可以包括快捷名称或长名称。数据库维持名称和位置,以便高效且准确地响应在装置102的传声器104处接收的用户命令。

用户的位置也可以与控制各种伴随装置240相关(例如,如图3所示,装置240-1、240-2、240-3、240-4、240-5等)。通过确定用户在哪个房间,处理器120可以更准确地控制伴随装置240。可以各种方式识别用户房间位置。

在一个示例中,用户房间位置可以由从个人助理装置的传声器104收集的房间样本来识别。可以在装置102启动后即刻收集房间样本。可以从扬声器116发射刺激噪声,并且随后可以记录房间样本。在一个示例中,房间样本可以包括唯一房间脉冲响应(rir)。这些脉冲响应对于每个房间可以是唯一的,因此当装置在各个位置之间移动时,用于识别房间。rir可包括振幅包络(即,随时间而变的振幅)。房间的rir可以根据装置102在房间内的确切位置而略微变化。但是,两个不同房间的rir可能会有很大差异。因此,房间样本所获取的rir可用于分类或识别装置102的房间或位置。举例来说,可以将房间样本的样本rir与所存储的rir进行比较。如果样本响应的一定数目的振幅和与已知房间相关联的所存储响应的振幅对准或匹配,那么可以基于所存储的响应来识别房间。这在本文中更详细地讨论。

图3示出了包括多个房间202的示例家庭200。房间202可包括例如卧室202-1,家庭办公室202-2,厨房202-3,起居室202-4和室外空间或庭院202-5。可了解和包括各种其他房间和位置。举例来说,家庭健身房,地下室等也可以包括在家庭200中。

多个个人助理装置102可以包括在整个家庭200中的房间中。在图3所示的示例中,第一装置102-1位于卧室202-1中。第二装置102-2位于家庭办公室202-2内。第三装置102-3位于起居室202-4中,依此类推。

除了包括个人助理装置102的每个房间之外,每个房间还可以包括各种伴随装置240。伴随装置240可以包括可以与个人助理装置102介接和通信的装置。个人助理装置102可以响应于用户命令向伴随装置240提供指令或命令。在一个示例中,伴随装置240可以是灯240-6,并且可以响应命令“打开厨房灯”。伴随装置的其他示例可以包括电视,扬声器,监视器,安全相机,插座,插座、恒温器等。伴随装置240可经由例如家庭网络等无线网络与个人助理装置102通信。伴随装置240可以在配置后即刻注册并与个人助理装置102配对,之后可以响应由辅助装置102提供的命令。

如上所述,每个房间202可以包括一个或多个伴随装置240。卧室202-1例如可以包括电视240-1,台灯240-2和顶灯240-3。办公室202-2可以包括灯240-4,电视240-5,另一个灯240-6等。每个伴随装置240可以与快捷名称和长名称相关联,如上文关于图2所解释的那样。当用户穿过家中时,用户可以发出口头命令,例如“打开hbo”。处理器120可以确定用户的位置,且接着基于用户的位置打开卧室电视240-1和办公室电视中的一个240-5。

图4示出了用于个人助理装置102识别的示例数据库400。此数据库400或图表可以是伴随装置库132的一部分。可以确定每个装置102在某个房间202中。这样,数据库400可以存储个人助理装置102与房间位置之间的关系。每个装置102可以与唯一标识相关联。一旦如由其唯一标识识别的装置102被确定为在某个房间内,其关联就被保存在数据库400中。

图5示出了用于个人助理装置102识别房间202并向伴随装置240之一提供命令的示例过程500。如上所述,用户可以在他或她的家中具有多个装置102。每个装置102可以接收各种命令。在一些情况下,一个以上装置102可以接收单个命令。过程500通过允许用户控制各种装置而不需要记忆装置名称来允许更好的用户体验。可以剖析和分析来自用户的口头命令以基于用户的位置来控制期望的装置。

通常,处理器120可以基于接收到的语音命令来识别房间。这可以包括通过剖析语音命令来分析语音命令,以从命令中提取各种命令信息。一些语音命令可以包括包含要控制的装置的长名称的短语,例如“书房灯”。其他命令仅包括例如“灯”等快捷名称。举例来说,如果短语是“打开书房灯”或“将书房灯打开”,那么装置名称可以是与“书房”相关联的装置,动作可以是“打开”,并且房间位置可以是书房。因此,此短语包括长名称“书房灯”,并且通过使用长名称来识别装置和房间位置。

在另一示例中,语音命令可以包括装置的快捷名称。在示例短语“将灯打开”中。在此短语中,装置名称可以是“灯”,动作可以是“打开”,并且将需要确定房间位置。可以通过除了从短语中剖析出房间名称之外的机制来确定房间位置。一种这样的机制可以包括使用rir,如上所述。一旦基于rir识别房间,就可包括rir作为个人助理装置id420的一部分。因此,当房间不包括在语音命令中时,可使用rir来查找房间位置。

过程500示出了用于基于语音命令来识别房间位置的示例过程。

过程500开始于框502。在框502处,处理器120从传声器104接收语音命令。如上所述,语音命令可以包括来自用户的用以控制各种伴随装置240的口头指令,例如“开灯”或“将电视调到频道7”。

在框504处,处理器120可以剖析接收到的语音命令,以便提取例如伴随装置名称,动作,房间位置等命令信息。举例来说,如果短语是“打开书房灯”或“将书房灯打开”,那么装置名称可以是“书房灯”,动作可以是“打开”,且房间位置可以是书房。因此,此短语包括长名称“书房灯”,并且通过使用长名称来识别装置和房间位置。在另一示例中,短语可以是“将灯打开”。在此短语中,装置名称可以是“灯”,动作可以是“打开”。因为使用了快捷名称,所以房间位置不可从所剖析的命令信息中获得。

在框506处,处理器120可以确定是否辨识出装置名称。处理器120可以将在框504中获取的经剖析名称与存储在伴随装置库132中的装置名称220、222的列表进行比较。处理器120可以将经剖析的装置名称与快捷名称220以及长名称222进行比较。如果处理器120将经剖析的装置名称与名称220、222中的一个匹配,那么过程500进行到框508。如果否,那么过程500进行到框510。

在框508处,处理器120可以确定经剖析的装置名称是否是长名称222。如果经剖析的装置名称包含长名称,例如“书房灯”,那么经剖析的装置名称将被视为唯一名称,因为所述装置(例如,“书房灯”)是专门识别而不是一般识别的(例如,“灯”)。如果经剖析的装置名称是长名称222,那么过程500进行到框512。如果否,那么过程500进行到框514。

在框510处,响应于经剖析的装置名称未能与伴随装置库132内的任何名称220、222匹配,处理器可以指令扬声器116输出装置错误消息。装置错误消息可指示无法定位具有经剖析的装置名称的伴随装置。举例来说,如果经剖析的装置名称是“书房灯”,那么装置错误消息可包括可听命令,例如“对不起,我找不到名为书房灯的装置或群组”。在另一个示例中,错误消息可特别询问装置名称,例如“对不起,我找不到名为书房灯的装置或群组,请问您可以重复装置的名称吗?”

在框512处,处理器120可以识别用户房间位置或用户当前所在的房间。这可以通过查看rir并确定当前用户房间位置来确定。rir可以指示用户当前在哪个房间。房间位置还可以由哪一个人助理装置102接收到命令,或者哪一装置102接收到最高质量的命令,指示用户最接近哪一装置102来确定。

在框513处,处理器120可以确定与长名称222相关联的伴随装置240是否在用户的当前房间中。换句话说,伴随装置房间位置是否与用户房间位置相同。在上面的示例中,处理器120可以确定用户是否在书房中。如果处理器120确定用户与命令中所识别的伴随装置240在同一房间中,那么过程500进行到框516。如果否,那么过程500进行到框518。

在框514处,处理器120可以确定用户的当前房间,类似于框512。如上所述,这可以通过使用rir来完成,或者通过在框502中确定哪一装置102接收到语音命令来完成。

在框515,处理器120可以确定具有经剖析的装置名称的伴随装置240是否与当前房间相关联。举例来说,如果快捷名称为“书房”,并且用户当前在书房或主卧室中,那么将辨识快捷名称。但是,由于车库内没有名称为“灯”的装置,因此无法辨识装置名称。如果装置名称与当前房间内的伴随装置名称相关联,那么过程进行到框516。如果否,那么过程500可以进行到框522。

在框516处,处理器120可以将经剖析的动作应用于与经剖析或识别的房间中的经剖析的装置名称相关联的伴随装置240。举例来说,伴随装置可以是可打开的书房灯。

在框518处,响应于确定用户和与经剖析的装置名称相关联的伴随装置不在同一房间中,处理器120可以发出房间警告或消息。此消息可以通过经剖析的装置名称警告用户装置存在,但不在用户当前所在的房间内。举例来说,处理器120可以指令扬声器116发出“该名称的装置不在本房间内,您是否还想控制该装置?”

在框520处,处理器120可以确定传声器104是否已经接收到对在框518处发射的查询的肯定用户回答。举例来说,用户可以对他或她是否想要控制不在与用户相同的房间内的装置的问题作出“是”响应。如果是,那么过程进行到框516。如果没有接收到肯定响应,例如如果用户作出“否”响应,那么过程500可以结束。

在框522处,响应于处理器120根据经剖析名称未在当前房间内定位到装置,处理器120可以指令扬声器116发出装置和房间错误消息。举例来说,扬声器116可能发出“对不起,但我在这个房间里找不到该名称的装置。”

尽管未示出为过程500的一部分,但可以了解其他步骤和过程。在一个示例中,用户语音命令可以提供潜在装置的查询。举例来说,用户命令可以是“该房间中有哪些装置”?响应于此查询,处理器120可以使用rir、表达标识或其他机制来确定房间位置,并且可以扫描伴随装置库132以确定哪些装置与当前房间相关联。一旦确定,处理器120就可以指令扬声器116发出伴随装置240的列表,以及与其相关联的快捷名称,例如“该房间中的装置是可以被称为光的书房灯以及可以被称为电视的书房电视”。

系统还可以推断出房间位置。举例来说,客卧可以包括三个伴随装置,客卧灯,客卧电视和客卧台灯。使用长名称给出的命令会将当前房间识别为客卧。在使用长名称接收到若干命令之后,处理器120可以指令扬声器116发出例如“看起来我们在客卧中,这是正确的吗?”的命令。来自用户的正面或肯定的响应将允许服务器将“客卧”作为装置的房间位置添加在数据库中。附加地或替代地,在设置期间以及在将伴随装置添加到数据库期间,处理器120可以基于所有三个装置在其长名称中都具有“客卧”来确定所有三个装置都在客房内。因此,处理器120可以在初始设置的配置期间推断出房间位置。

此外,虽然本文所示的大多数示例涉及家庭或房屋,但是本公开还可以涉及各种其他建筑物,情况,环境等。在一个示例中,此系统可以有益于在医疗行业中使用,尤其在有多个房间的医院中使用。当患者,医生,护士等从一个房间移动到另一个房间时,每个人都可以发出例如“开灯”或“打开电视”等命令。无需知道装置的具体名称,用户发出命令可以控制各种伴随装置。这是由于处理器120确定用户的位置并基于所述位置来控制伴随装置。这还可以通过仅允许用户控制与用户在同一房间内的装置来增加安全性并避免不必要的中断。

虽然上述系统和方法被描述为由个人助理装置102的处理器120执行,但是这些过程可以由另一装置或在云计算系统内携带。处理器120可以不必与伴随装置一起位于房间内,并且通常可以移出房屋。

因此,可以通过虚拟助理装置控制的伴随装置可以由不熟悉与伴随装置相关联的特定装置长名称的用户容易地命令。例如“灯”之类的快捷名称可足以控制在用户近处的灯,例如,与用户在同一个房间内的灯。一旦确定了用户的位置,个人助理装置就可以对用户命令做出反应,以高效,容易且准确地控制伴随装置。

虽然上文描述了示例性实施例,但不希望这些实施例描述本发明的所有可能形式。而是,本说明书中所使用的词语是描述性而非限制性词语,并且应理解,可在不脱离本发明的精神和范围的情况下做出各种改变。此外,可将各种实现实施例的特征组合,以形成本发明的另外的实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1