用于相关设备之间通信的语音命令的制作方法

文档序号：18456859发布日期：2019-08-17 01:41阅读：180来源：国知局

本专利申请要求于2016年12月29日递交的序列号为15/394,037的美国实用专利申请的优先权。序列号为15/394,037的专利申请的全部内容通过引用并入本文中。

背景技术：

用户具有多种电信设备，诸如蜂窝电话、平板电脑、笔记本电脑和其他设备。每个设备可以具有其自己的通信地址(诸如电话号码)，并且可以接收针对与服务账户相关联的任何通信地址的通信。

在(ip)多媒体子系统(ims)中，可以通过隐式注册集(irs)来实现呼叫分叉。利用irs，当注册与通信地址相关联的任何一个网络身份(例如，ip多媒体公共标识符(impu))时，还注册与该网络身份相同的服务账户相关联的其他网络身份。当接收到通信并将通信引导到注册集的任何一个网络身份时，可以将其发送到该注册集的所有网络身份。

由rfc3265(“会话发起协议(s1p)-特定事件通知”，2002年6月)扩展的会话发起协议(sip)利用订阅方法，从远程节点请求当前状态以及状态更新。开放移动联盟(oma)在线simple(用于即时消息和在线利用扩展的sip)的规范定义了利用sip执行即时消息传递和其他功能的机制。富通信服务(rcs)是gsm协会(gsma)程序，其提供ip多媒体子系统(ims)内的互操作性。rcs的一个特征是能够发现联系人的能力。rcs利用omasimple实现各种特征，包括订阅在线服务器，以获取联系人列表的能力信息。

附图说明

参考附图阐述详细描述。在附图中，附图标记的最左边的一个或多个数字标识首次出现附图标记的图。在不同附图中使用相同的附图标记表示相似或相同的条目或特征。

图1示出了用于相关设备之间的设备间通信的示例性环境。

图2示出了用于启用用于相关设备之间的设备间通信的语音命令的示例性系统。

图3示出了图2的系统的示例性操作过程。

图4示出了图2的系统的另一示例性操作过程。

详细描述

在本公开的示例中，语音命令被启用以用于设备间通信，例如，在相关设备之间传送分组数据会话。一组相关设备包括与同一订户账户相关联、共享相同蜂窝电话线等的设备。共享相同账户的设备通常与国际移动订户身份(imsi)相关联。共享相同电话线的设备可以被配置为使用共享标识符、通信地址等发送、接收和发起蜂窝通信，例如电话号码、msisdn(有时称为“移动站国际订户目录号码”)、ip多媒体公共标识符(impu)等。在本文的公开中，“设备”可以是物理设备或可以是“虚拟”设备。因此，在一些示例中，设备基于它们与相同的“账户”(例如，与imsi相关联)相关联、与相同的“线路”(例如，与相同的电话号码相关联)相关联，与相同的硬件系统相关联等等而相关联。例如，与设备相关的可以是共享相同电话号码的多个设备和/或具有多个号码的一个物理设备(即，多个“虚拟”设备)。相关设备包括这样的设备：用一个设备发起的分组数据会话(例如，呼叫、实时消息或下载多媒体文件)可以转移到另一个设备，以继续和/或完成分组数据会话。此外，设备不限于传统观念中的移动终端或计算设备，并且可以包括能够进行设备间通信的任何设备。例如，“设备”可以包括智能家庭/连接的家庭设备，如连接的器具。设备间通信包括相关设备之间的任何通信。例如，设备间通信包括但不限于在相关两个设备之间/三个以上设备之间传送分组数据会话，以及在两个设备之间/三个以上设备之间共享分组数据会话。又例如，设备间通信可以包括升级和/或改变两个相关设备之间/多个相关设备之间的分组数据会话的格式。例如，设备间通信可以将在一个设备上进行的语音呼叫升级到在另一个相关设备上进行的视频呼叫。

下面参考附图描述本公开的各种示例。

图1示出了相关设备102的环境100，其中，可以发生设备间通信，例如，在相关计算设备(“设备”)102之间传送分组数据会话(仅为了说明而示为设备102a-d)，并且其中，可以使用一个或多个语音命令。作为说明性示例，相关设备102a可以操作与外部源的正在进行的分组数据会话，例如经由蜂窝网络104上的单播、广播或组播源、互联网106、来自另一设备108(例如，不与设备102a共享线路和/或订户账户的移动设备)，或者来自某些其他外部源(例如，内容网站)的移动设备。如本文所使用的，“外部源”是除相关设备102a-d之外的任何源/设备。相关设备102a能够将正在进行的分组数据会话传送到其他相关设备102，例如，如图所示，设备102b-d。

存在实现设备间通信的各种方法，例如，两个相关设备102之间/三个以上相关设备102传送正在进行的分组数据会话，并且每个并且所有分组数据会话都包括在本公开中。在示例中，可以通过服务器110来实现设备间通信。服务器110可以是sip服务器，并且相关设备102a可以被配置为利用oma在线simple来获得关于一个或多个相关设备的在线信息，例如，相关设备102b和102c。在一些示例中，相关设备102a-d被配置为向呈现服务器110提供它们的在线信息。在一些实施例中，相关设备102a-d可以被配置为提供可用性(能力)信息。可用性信息可以指示接收正在进行的分组数据会话的传输的可用性。在其他示例中，相关设备102a-d可以获得彼此的在线信息和以其他方式接收传输的能力，例如通过静态配置、对等连接等。

蜂窝网络104可以负责将分组数据会话(例如语音呼叫)路由到外部网络，例如互联网106。例如，蜂窝网络可以包括网关gprs支持节点(ggsn)114或分组数据网络网关(pdngw)115或另一个等效节点。用户装置(ue)(例如，相关设备102a-d和其他设备108)可以包括智能电话、个人数字助理、上网本、膝上型计算机、智能器具和/或另一电子设备中的一个或多个，另一电子设备能够经由蜂窝网络104、互联网106(例如，通过wi-fi网络)或其他接入网络116，来操作分组数据会话(例如，语音或多媒体数据)。

计算设备(诸如相关设备102a-d、以及设备108)可以包括订户身份模块(sim)卡118，其上存储有国际移动用户身份(imsi)。imsi是唯一的64位数字。在gsm网络内，imsi与msisdn相关联，有时称为“移动台国际订户目录号码”，或更常见的是电话号码。msisdn是唯一的号码，其用于标识gsm网络上的订阅，并且也是可用于向gsm电话发出呼叫的号码。msisdn不必存储在sim卡118或电话上，并且msisdn不与imsi永久关联。例如，如果订阅改变，则msisdn可能会改变。

作为相关设备102的说明性非限制性示例，多个ue可以用公共号码(例如，msisdn、impu、impi等)注册，并且可以与公共订户账户(例如，imsi)相关联，因此是这里使用的“相关设备”。例如，所有相关设备102a-d可以将它们自己的唯一imsi编程到它们各自的sim卡中，并且与特定电话号码(msisdn)相关联，该特定电话号码对于每个相关设备102a-d也可以是唯一的。但是imsi和msisdn对可以在网络中与“别名号”相关联，以允许共享线路和/或共享账户，从而使它们成为相关设备。例如，相关设备102a-d的imsi和msisdn关联存储在数据库120中。相关设备102a与imsia和msisdna相关联。相关设备102b与imsib和msisdnb相关联，但也与别名msisdna和别名imsia相关联。因此，相关设备102b与相关设备102a相同的账户和相同的线路相关联。相关设备102c与imsic和msisdnc相关联，但也与别名imsia相关联。因此，相关设备102c与相关设备102a共享账户(imsia)，但不共享电话线。可能无法通过蜂窝网络104的基站连接的一些相关设备(例如，相关设备102d)也可以通过互联网106(或者诸如蓝牙、近场通信(nfc)等其他短程通信技术)、使用唯一标识符(例如impi或impu，全局可路由用户代理uri(gruu)或其他)，向蜂窝网络104注册。这些标识符可以采用电话号码的形式(例如，它们可以类似于msisdn)。蜂窝网络104将呼叫和消息转发到相关设备102d，并且可以使相关设备102d能够以与相关设备102a-c相同或相似的方式发送或接收共享内容。如图1中的数据库120中所示，相关设备102d与impud相关联，并且还与别名impua相关联。因此，相关设备102d与相关设备a和b以及与相关设备a、b和c的账户共享电话线。

服务器110可以检索关联数据，关联数据对应于来自数据库120的相关数据102a-d的imsi、impu/impi。该数据可以包括规定相关设备号(例如，msisdn、impi、impu等)的信息，针对该信息，相关设备102a-d能够用于发起、转移和接收设备间通信事件，例如，转移一个或多个分组数据会话。在一些实施例中，相关设备102可以从服务器110请求相关设备102a-d的列表。

图2示出了被配置为支持用于设备间通信的语音命令的示例性系统200，包括例如在三个以上相关设备102之间/两个相关设备之间传送分组数据会话。系统200的一些或所有组件可以包括在相关设备102中和/或服务器110或两者，其都具有一个或多个功能性协调，并且所有可能性都包括在本公开中。如图2所示，系统200可以包括一个或多个处理器202和存储器204。语音识别设备206可以通信地耦合到系统200(其还包括语音识别设备206包括在系统200中的配置)。语音识别设备206可以物理地包括在设备102中，或者可以是通信地耦合到设备102以与系统200一起工作的单独设备。系统200还可以包括显示单元208、射频(rf)单元210和用户界面(iu)212。

系统200可以包括语音命令注册模块220和语音命令执行模块250。语音命令注册模块220可以包括语音命令接收单元225、语音命令处理单元230、关联单元235、注册单元240、保存单元245和用户接口单元247。语音命令执行模块250可以包括语音命令接收单元255，其包括语音命令界面接口单元257和语音命令标识单元259、检索单元260、分析单元265、包括可用性检查单元272的执行单元270和用户接口单元280。语音命令注册模块220和语音命令执行模块250可以共享或者每个均分别包括用户界面单元247，280。

语音识别设备206可以包括能够感测语音的任何现在和/或将来开发的设备。任何和所有可能性都包括在本公开中，并且没有限制本公开的范围。

在操作中，语音命令注册模块220被配置为训练设备102和/或服务器110以获得用户的语音命令。由于可以处理语音命令以训练系统而不是实际执行，为了便于说明，可以使用“训练语音命令”来指代由语音命令登记模块220处理的语音命令。

具体地，语音命令接收单元225被配置成用于通过语音识别设备206接收用户的训练语音命令。训练语音命令可以包括用户为相关设备102之间的设备间通信事件指定的内容。对于说明性示例，语音内容可以是“转移到设备102b”。应当理解，训练语音命令可以包括用于多于一个通信间事件的内容，例如，“转移到设备102b并升级到视频呼叫”。

语音命令处理单元230被配置成处理接收到的训练语音命令，以生成语音命令签名。在示例中，处理可以标识训练语音命令的内容特征和声音特征，两者都包括在所生成的语音命令签名中。在示例中，语音的内容特征和声音特征都可以被数字化。内容特征和声音特征的分离可以实现两个特征的区别对待。例如，声音特征对用户是个性化的并且是唯一的，其可以用作用户的生物标识符。因此，在示例中，可以使用更多信息安全措施来处理和存储训练语音命令的声音特征部分。此外，该处理还可以包括标记化过程，其中，随机生成的标记被附加到数字化内容特征和/或声音特征。随机生成的令牌的示例可以包括安全密钥、一次性密码或其他动态生成的令牌形式。应当理解，语音命令处理可以在本地(在单个设备102或服务器110内)实现，或者可以通过例如云计算，以分布式计算方式实现。

关联单元235被配置为将语音命令签名与三个以上相关设备102之间/两个相关设备之间的设备间通信的可执行命令相关联，例如，设备102a和设备102b。该关联可以以各种方式实现，并且全部包括在本公开中。可执行命令是用户喜欢在训练时通过语音命令激活和/或执行的命令。为了说明性示例，示例性训练语音命令“转移到设备102e”可以与可执行命令相关联，以将正在进行的分组数据会话从相关设备102转移到相关设备102b。在示例中，可以通过关联单元235与用户界面单元247协调来实现关联，使得可以采用用户的输入来实现关联。例如，用户可以从可执行命令列表中选择可执行命令，以与语音命令签名相关联。

注册单元240被配置为将语音命令签名注册为与可执行命令相关联。注册可以与设备间通信的服务器(例如，服务器110或其他服务器)一起执行，或者可以与其他相关设备102一起执行。由于相关设备102可以通过服务器110链接，因此与服务器110的注册可以使得语音命令签名与可用于到其他相关设备102的可执行命令相关联(例如，可访问/可检索)。

保存单元245被配置为使得以这样的方式保存语音命令签名：使得保存的语音命令签名被配置为在设备间通信事件中被检索。在一个示例中，如果关联的可执行命令旨在由特定的相关设备102(例如，当前设备102a接收训练语音命令)执行，则语音命令签名可以本地保存在特定的相关设备102上。如果关联的可执行命令旨在由多个相关设备102执行，例如，用户可能更喜欢所有相关设备102都可以执行训练的“转移到设备102b”语音命令，语音命令签名可以保存在可由所有相关设备102访问的服务器中(例如，服务器110)。

语音命令执行模块250被配置为在设备间通信事件中处理候选语音命令。如果基于与保存的语音命令签名相关的候选语音命令的分析，将候选语音命令认证为有效语音命令，则将使候选语音命令执行。“候选”用于表示语音命令可能需要在执行前进行身份验证。

具体地，语音命令接收单元255被配置为通过语音识别设备206接收候选语音命令。所接收的候选语音命令可以是各种数字化格式，并且所有这些都包括在本公开中。在示例中，接收的候选语音命令可以与语音命令接收单元225接收的训练语音命令的格式相同。在示例中，语音命令接收单元255可以共享相同的一个或者多个硬件和/或软件元件，作为语音命令接收单元225。

语音命令界面激活单元257被配置成用于激活接收候选语音命令的界面。可以在接收候选语音命令的不同阶段中激活界面。在一个示例中，语音命令界面激活单元257被配置为在接收语音命令之前激活界面，并且界面可以用于暂停相关的正在进行的分组数据会话(例如语音呼叫)，并切换到功能和/或环境，以接收候选语音命令。在另一示例中，语音命令界面激活单元257被配置为在检测到用于接收的候选语音命令之后激活界面。例如，可以从后台检测候选语音命令，如正在进行的语音对话(分组数据会话)，并且可以激活界面和/或对话，以供用户确认检测到的候选语音命令是用户打算输入的语音命令。

语音命令标识单元259被配置为在相关设备102上操作的正在进行的分组数据会话上标识候选语音命令。可以使用各种方法来标识正在进行的分组数据会话上的语音命令，并且任何和所有都包括在公开内容中。例如，语音命令标识单元259可以将候选语音命令标识为前台任务或后台任务。正在进行的分组数据会话可以暂停或可以继续。如本文所述，在标识/检测到候选语音命令之后，可以激活用户界面，以供用户确认候选语音命令。

检索单元260被配置为检索保存的语音命令签名。在示例中，检索可以包括将语音命令签名转换为适合于关于所接收的候选语音命令的分析的格式。

分析单元265被配置为分析与所检索的语音命令签名相关的所接收的候选语音命令，以确定对应关系。存在各种方法来确定所接收的候选语音命令与所检索的语音命令签名之间的对应关系，并且所有方法都包括在本公开中。在示例中，分析单元265可以处理所接收的候选语音命令，以标识候选内容特征和候选声音特征。然后，可以将候选内容特征和候选声音特征分别与语音命令签名的内容特征和声音特征进行比较，以确定每个的对应关系。

在现实世界中，用户的候选语音命令可能偏离同一用户的保存的语音命令签名。在示例中，分析单元265可以在确定对应关系时应用一个或多个容差范围。可以基于机器学习或实验数据确定一个或多个容差范围。在示例中，应用于候选内容特征和候选声音特征的容差范围可以变化。语音命令签名的声音特征与输入和保存语音命令签名的用户的生物标识有关，使得可以针对要被确定为对应关系的候选声音特征设置更严格的容差。另一方面，对于候选内容特征，容差范围可能相对宽松。例如，代替说出保存的“转移到设备102b”，候选语音命令可以包括“转移通话到设备102b”或“到设备102b”，这可被接收为内容特征中的对应关系。

执行单元270被配置为在确定所接收的候选语音命令对应于所检索的语音命令签名时，使得执行与语音命令签名相关联的可执行命令。在示例中，执行单元270可以包括可用性检查单元272，其被配置为例如通过服务器110检查其他相关设备102参与设备间通信事件的可用性。例如，在说明性示例性语音命令“转移到设备102b”中，可用性检查单元272可以检查相关设备102b是否可用于接收转移。

应了解，系统200的一些或所有单元/组件可驻留在相关设备102上和/或可驻留在服务器110上，或其任何组合。此外，任何或所有单元/组件的功能可以通过相关设备102和服务器110之间的交互来实现，例如，通过安装在设备102中用于设备间通信的应用程序。在示例中，设备102可以包括用于直接用户交互的单元，包括语音命令接收单元225/255和用户界面单元247/280的部分，并且可以关于接收到的语音命令(训练语音命令和/或候选语音命令)与服务器110通信，并且可关于与语音命令注册模块220和语音命令执行模块250的其他单元的功能相互作用。

图3示出了系统200的语音签名注册模块220的示例过程300。在示例操作310中，语音接收单元225可以通过通信地耦合到相关设备102的语音识别设备206(为了说明性示例，设备102a)，来接收用户的训练语音命令。训练语音命令可以包括由用户指定的、用于相关设备102之间的设备间通信事件的内容。对于说明性示例，语音内容可以是“转移到设备102b”。

在示例性操作320中，语音命令处理单元230可以处理所接收的训练语音命令，以生成语音命令签名。在示例中，处理可以标识训练语音命令的内容特征和声音特征。在一个例子中，内容特征和声音特征二者可以包括在语音命令签名中。在示例中，可以使用更多信息安全措施来处理和存储语音命令签名的声音特征部分。训练语音命令的内容特征和声音特征二者都可以被数字化。此外，该处理还可以包括标记化过程，其中，随机生成的令牌被附加到数字化内容特征和/或声音特征。随机生成的令牌的示例可以包括安全密钥、一次性密码或其他动态生成的标记形式。

在一个示例中，用户可能已经用其他训练语音命令训练系统200，并且用户的声音特征可能已经存储在系统200中。当前训练语音命令的当前声音特征可以用于更新/协调现有的声音特征。应当理解，训练语音命令处理可以在相关设备102a内本地实现，或者例如通过云计算可以由服务器110实现，或本地和基于云的处理的某种组合。

在示例操作330中，关联单元235可以将语音命令签名与两个相关设备102之间/三个以上相关设备之间的设备间通信的可执行命令相关联，例如，设备102a和设备102b。该关联可以以各种方式实现，并且全部包括在本公开中。在示例中，关联可以由关联单元235与用户接口单元247协调来执行，使得用户的输入被用于实现关联。例如，用户可以从可执行命令列表中选择与语音命令签名相关联的可执行命令。

在示例操作340中，注册单元240可以将与可执行命令相关联的语音签名注册到设备间通信的服务器(例如，服务器110或其他服务器)，或者通过对等地连接注册到其他相关设备102。在示例中，注册还可以包括或涉及可以在其中验证用户身份的认证过程。所有身份验证方法都是可能的，并且所有方法都包括在本公开中。在示例中，如果用户的声音特征已经被认证并且存储在系统200中，则可以通过将当前训练语音签名的声音特征与存储的声音特征进行比较，来自动完成认证。

在示例操作350中，可以使得保存单元245以这样的方式保存语音命令签名，使得保存的语音命令签名被配置为在设备间通信事件中被检索到。在示例中，如果关联的可执行命令旨在由特定的相关设备102(例如，接收训练语音命令的当前设备102a)执行，则可以在特定的相关设备102上本地保存语音签名。如果相关联的可执行命令旨在由多个相关设备102执行，例如，用户可能更喜欢除了相关设备102b之外的所有相关设备102都可以执行“转移到设备102e”命令，则语音命令签名可以保存在可由所有相关设备102访问的服务器中。在一个示例中，如果用户的声音特征已经存储在系统200中，则可能不需要再次保存当前语音签名的声音特征，并且已经保存的用户的声音特征可以与保存中的当前内容特征相链接。

图4示出了系统200的语音命令执行模块250的示例性过程400。在示例操作410中，语音命令接收单元255可以通过通信地耦合到相关设备102(这里例如是设备102a)的语音识别设备206接收候选语音命令。

示例性操作410可以包括示例子操作412，其中，语音命令界面激活单元257可以激活用户界面。用户界面可以被配置为提供各种功能。例如，用户界面可以为候选语音命令输入提供环境，可以从后台分组数据会话确认检测到的语音命令，和/或可以用作与用户的一个或多个对话窗口。可以在接收训练语音命令的不同阶段中激活用户界面。在示例中，语音命令界面激活单元257可以在接收候选语音命令之前激活界面，并且界面可以用于暂停相关分组数据会话(例如，语音呼叫)，并切换到环境以接收语音命令。在另一示例中，语音命令界面激活单元257可以在检测到用于接收的候选语音命令之后激活界面。例如，可以从后台检测候选语音命令，例如正在进行的语音对话(分组数据会话)，并且可以通过语音命令界面激活单元257激活界面，以便用户确认检测到的语音命令是用户想要输入的候选语音命令。

在示例子操作414中，语音命令标识单元259可以标识在相关设备102a上操作的正在进行的分组数据会话上的候选语音命令。可以使用用于在正在进行的分组数据会话上标识候选语音命令的各种方法，并且任何和所有方法都包括在本公开中。例如，语音命令标识单元259可以将候选语音命令标识为前台任务或后台任务。正在进行的分组数据会话可以暂停，或者可以保持活动并继续。如本文所述，在识别/检测到语音命令之后，用户界面可以由语音命令界面激活单元257激活，在示例子操作412中，供用户用于确认语音命令。

在示例操作420中，检索单元260可以检索保存的语音命令签名。在示例中，检索可以包括将保存的语音命令签名转换为适合于关于接收的候选语音命令的分析的格式。

在示例操作430中，分析单元265可以分析与所检索的语音命令签名相关的所接收的候选语音命令，以确定对应关系。存在各种方法来确定所接收的候选语音命令与所检索的语音命令签名之间的对应关系，并且所有方法都包括在本公开中。在示例中，分析单元265可以处理所接收的候选语音命令，以识别候选内容特征和候选声音特征。然后，可以将候选内容特征和候选声音特征分别与语音命令签名的内容特征和声音特征进行比较，以确定每个的对应关系。

在一个示例中，分析单元265可以在确定对应关系时应用一个或多个容差范围。在示例中，应用于候选内容特征和候选声音特征的容差范围可以变化。可以为候选声音特征设置更严格的容差，以被确定为对应的。对于候选内容特征，可以将容差范围设置为相对宽松。

在示例操作440中，当确定所接收的候选语音命令对应于所检索的语音命令签名时，执行单元270可以使得执行与语音命令签名相关联的可执行命令。在示例中，可用性检查单元272可以例如通过服务器110检查其他相关设备102参与设备间通信事件的可用性。例如，在说明性示例性语音命令“转移到设备102b”中，可用性检查单元272可以检查相关设备102b是否可用于接收转移。

以上结合图3-4描述的过程可以用硬件、软件或其组合来实现。在软件的上下文中，操作表示存储在一个或多个计算机可读存储介质上的计算机可执行指令，当指令由一个或多个处理器执行时，执行所述操作。通常，计算机可执行指令包括执行特定功能或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。在其他实施例中，硬件组件执行一个或多个操作。这样的硬件组件可以包括或并入处理器、专用集成电路(asic)、可编程电路(例如现场可编程门阵列(fpga))或以其他方式。描述操作的顺序不旨在被解释为限制性的，并且可以以任何顺序和/或并行地组合任何数量的所描述的操作以实现该过程。

尽管用结构特征和/或方法动作专用的语言描述了本主题，但应理解，所附权利要求书中定义的主题不必限于所描述的具体特征或动作。而是，具体特征和动作被公开为实现权利要求的示例性形式。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Y·卡里姆里;刚加·尼巴维卡
技术所有人：T移动美国公司
我是此专利的发明人

上一篇：适配用于终端用户自由视点监控的分布式音频录制的制作方法
上一篇：内窥镜的制作方法