用于启用网络的设备上的语音识别输入的方法和系统的制作方法

文档序号：9291753阅读：401来源：国知局

用于启用网络的设备上的语音识别输入的方法和系统的制作方法
【专利说明】用于启用网络的设备上的语音识别输入的方法和系统
[0001] 相关申请的交叉引用
[0002] 本申请要求2013年3月8日提出的标题为"METHOD AND SYSTEM FOR VOICE RECOGNITION INPUT ON NETWORK-ENABLED DEVICES" 的美国专利申请系列 No. 13/790, 426 的优先权。该申请的全部内容以引用的方式并入本文中。本申请全文引用了 2010年12月 30 提出的标题为 "DEVICE REGISTRATION PROCESS FROM SECOND DISPLAY" 的美国专利申请系列No. 12/982, 463,后者要求2010年11月10提出的标题为"DEVICE REGISTRATION PROCESS FROM 2ndDISPLAY"的美国临时专利申请No. 61/412, 312的优先权；本申请还全文引用了 2010年7月27日提出的标题为"CONTROL OF IPTV USING SECOND DEVICE"的美国专利申请系列No. 12/844, 205,所有的这些申请都由本发明的受让人拥有。
【背景技术】
[0003] 因特网向IPTV递送数字内容持续增加，就像IPTV本身的流行度持续增加那样。至于许多数字设备，特别是网络上的那些，IPTV的设备注册会给用户带来许多好处。IPTV的注册的关键好处是与允许对各种服务进行访问的用户帐户的关联。然而，IPTV设备的用户注册是不方便的。用户需要离开起居室来访问PC-一这是不方便的，或者直接在IPTV上执行注册，IPTV -般具有差的输入界面。例如，在一些系统中，使用遥控器向设备上的web浏览器输入注册码。尽管用户不必离开设备的位置，但是，大多数遥控器未被设计为用于输入大量的数据。
[0004] 补救该情况的一个成功的尝试是通过允许用户使用第二显示器，例如蜂窝电话或平板计算机，以通过在对用户更加友好的设备上输入数据来辅助注册的执行。尽管在许多情况下十分方便，但是，技术不太灵光的用户仍可能在执行注册IPTV的必要的功能（例如，下载应用、利用他们的设备配置第二显示器等等）时遭到困难。
[0005] 研究表明，IPTV及其他启用网络的（network-enabled)设备（例如，Blu-ray回放器）的很高百分比的用户不注册他们的设备。不仅用户遗漏掉注册的好处，而且网络提供商也遗漏掉接收关于这样的用户的商业信息，可以使用这些商业信息来改善服务以及向消费者做广告。相应地，需要使诸如IPTV之类的设备的注册过程更方便，并由此使用户能够更方便地得到这样注册的好处。此外，还需要改善向这样的设备输入数据的总体用户体验。

【发明内容】

[0006] 在系统和方法的实现中，用户可以使用语音命令而并非使用麻烦的设备或必须导航到单独的注册网站，方便地注册并管理内容回放设备，例如IPTV。如此，可以更方便地实现注册。在注册之后，可以实现额外的跟进特征，诸如直接选择用于浏览的设备，与用户帐户相关联的其他设备的注册信息或配置的继承。
[0007] 系统和方法的实现可以使用web表单和与设备和浏览器兼容的web技术来接受用户输入以及服务器侧脚本语言。可以在各种位置处使用话音（speech)引擎来将语音输入转换为文本或数值数据以注册IPTV，或实际上任何启用网络的设备。话音引擎可以以各种方式接收语音输入，例如从USB或指定的硬件端口，从耦合到遥控器、IPTV或其他设备、第二显示器等等或嵌入在它们内的麦克风。所识别的文本可以向用户显示在内容回放设备上，以确保准确的转录。接着，可以将所识别的文本（例如注册信息）自动地或人工地提交到网络提供商。
[0008] 在操作方法的一个示例中，当内容回放设备被打开并可以与网络进行通信（例如，要么以有线方式要么以无线方式）时，如有必要提示用户输入网络密码，并接着被自动地定向到注册门户。如果用户在注册门户中没有用户帐户，则可以提示他们创建一个。在用户登录到注册门户之后，提示用户添加内容回放设备的注册码或其他可标识的代码，诸如MAC地址。接着，用户向音频输入设备说出代码，逐个字符地或者一次性地全部说出。与注册（或其他管理）门户的交互可以完全通过语音或可以通过语音和使用遥控器的人工输入的组合来进行。一经成功注册，设备就可以准备好用于浏览和内容选择。用户还可以使用先前的配置来填充新内容回放设备的注册信息，例如，从先前的配置继承信息，只需要添加新设备的注册码。
[0009] 启用网络的内容回放设备可以呈现许多形式，多个内容回放设备可以耦合到给定局域网，并可以在给定局域网内被选择。示例性内容回放设备可包括IPTV、DTV、数字音频系统、Blu-ray?播放器、或适当地被配置以便连接的更传统的视频和音频系统。在视频系统中，内容回放设备包括控制视频显示器以在其上呈现内容的处理器。
[0010] -方面，本发明涉及向启用网络的设备输入数据的方法，包括：将启用网络的设备配置为处于接收音频数据的状态，所述数据与附属于所述启用网络的设备的服务、与所述启用网络的设备相关联的服务器、或所述启用网络的设备的用户界面的操作相关联；接收音频数据；将所接收到的音频数据转换为文本数据；以及导致所述启用网络的设备基于所述文本数据来执行动作，所述文本数据表示所述服务或所述服务器上的功能，或者表示所述启用网络的设备的用户界面上的操作。
[0011] 本发明的实现可包括以下中的一项或多项。接收到的音频数据可以是注册数据，该方法还可以包括将文本数据与用户帐户相关联，从而，启用网络的设备被注册到该用户帐户。该方法还可以包括基于注册数据创建用户帐户。接收到的音频数据可以是用户名或密码或者这两者，服务上的功能可以是登录到服务上的用户帐户。接收到的音频数据可以是导航命令，在用户界面上执行操作可包括执行该导航命令。该方法还可以包括传输导致启用网络的设备显示文本数据的信号。在接收音频数据并将其转换为对应于字符的文本数据之后，所述字符的文本版本可以显示在所述启用网络的设备上。该方法还可以包括提示用户确认所述文本数据。该方法还可以包括存储接收到的音频数据，并且如果跟在显示提示之后是用户修改所述文本数据，则该方法还可以包括将已修改的文本数据与接收到的音频数据相关联。该方法还可以包括：从接收到的音频数据检测语言类型；如果检测到的语言类型不对应于所述启用网络的设备的支持语言中的一个，那么：执行转换步骤，使得文本数据是对应于检测到的语言类型的形式；创建文本数据的镜像文件；以及将所述图像文件传输到所述启用网络的设备，供显示。该方法还可以包括：从接收到的音频数据检测语言类型；如果检测到的语言类型不对应于所述启用网络的设备的支持语言中的一个，那么：执行转换步骤，使得文本数据是对应于检测到的语言类型的形式；以及将所述文本数据传输到所述启用网络的设备，供显示。该方法还可以包括：从接收到的音频数据检测语言类型；如果检测到的语言类型不对应于所述启用网络的设备的支持语言中的一个，那么，将对应于检测到的语言类型的语言模块下载到所述启用网络的设备。该方法还可以包括：提示用户输入语言类型，并且一经输入语言类型，就将对应于所输入的语言类型的语言模块下载到所述启用网络的设备。
[0012] 在另一方面，本发明涉及非暂态计算机可读介质，包括用于导致计算设备实现上面的方法的指令。
[0013] 在另一方面，本发明涉及用于启用网络的设备输入数据的方法，包括：将启用网络的设备配置为处于接收音频数据的状态；接收音频数据；将接收到的音频数据转换为文本数据；以及导致所述启用网络的设备基于使用所述文本数据的请求来执行动作。
[0014] 本发明的各实现可包括以下中的一项或多项。请求数据的输入可包括显示表单以及提示输入数据，该方法还可以包括利用文本数据来填充表单并且显示经填充的表单。该表单可以提示输入注册码，该方法还可以包括将文本数据传输到服务器以执行注册，并且一经从服务器接收到指示成功注册的信号，就显示成功注册的指示。请求数据的输入可包括接受导航命令的输入。接收音频数据可包括使用启用网络的设备上的输入端口来接收音频数据。将接收到的音频数据转换为文本数据可以在启用网络的设备上执行。该方法还可以包括：在转换之前，确定接收到的音频数据是使用不被支持的语言；以及，下载对应于接收到的音频数据的语言的语言模块。输入端口可以被配置成接受来自移动电话、平板计算机、膝上型计算机、麦克风的音频数据或音频流，或者可以是USB端口。加密狗可以耦合到 USB端口，接收音频数据可以由耦合到加密狗的麦克风执行。将接收到的音频数据转换为文本数据可以在加密狗中执行。接收音频数据可包括从遥控器接收音频数据。将接收到的音频数据转换为文本数据可以在遥控器上

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：T·熊;C·迈考伊;
技术所有人：索尼公司;索尼网络娱乐国际有限责任公司;
我是此专利的发明人