用于启用网络的设备上的语音识别输入的方法和系统的制作方法

文档序号:9291753阅读:401来源:国知局
用于启用网络的设备上的语音识别输入的方法和系统的制作方法
【专利说明】用于启用网络的设备上的语音识别输入的方法和系统
[0001] 相关申请的交叉引用
[0002] 本申请要求2013年3月8日提出的标题为"METHOD AND SYSTEM FOR VOICE RECOGNITION INPUT ON NETWORK-ENABLED DEVICES" 的美国专利申请系列 No. 13/790, 426 的优先权。该申请的全部内容以引用的方式并入本文中。本申请全文引用了 2010年12月 30 提出的标题为 "DEVICE REGISTRATION PROCESS FROM SECOND DISPLAY" 的美国专利申 请系列No. 12/982, 463,后者要求2010年11月10提出的标题为"DEVICE REGISTRATION PROCESS FROM 2ndDISPLAY"的美国临时专利申请No. 61/412, 312的优先权;本申请还全文 引用了 2010年7月27日提出的标题为"CONTROL OF IPTV USING SECOND DEVICE"的美国 专利申请系列No. 12/844, 205,所有的这些申请都由本发明的受让人拥有。
【背景技术】
[0003] 因特网向IPTV递送数字内容持续增加,就像IPTV本身的流行度持续增加那样。至 于许多数字设备,特别是网络上的那些,IPTV的设备注册会给用户带来许多好处。IPTV的 注册的关键好处是与允许对各种服务进行访问的用户帐户的关联。然而,IPTV设备的用户 注册是不方便的。用户需要离开起居室来访问PC-一这是不方便的,或者直接在IPTV上执 行注册,IPTV -般具有差的输入界面。例如,在一些系统中,使用遥控器向设备上的web浏 览器输入注册码。尽管用户不必离开设备的位置,但是,大多数遥控器未被设计为用于输入 大量的数据。
[0004] 补救该情况的一个成功的尝试是通过允许用户使用第二显示器,例如蜂窝电话或 平板计算机,以通过在对用户更加友好的设备上输入数据来辅助注册的执行。尽管在许多 情况下十分方便,但是,技术不太灵光的用户仍可能在执行注册IPTV的必要的功能(例如, 下载应用、利用他们的设备配置第二显示器等等)时遭到困难。
[0005] 研究表明,IPTV及其他启用网络的(network-enabled)设备(例如,Blu-ray回放 器)的很高百分比的用户不注册他们的设备。不仅用户遗漏掉注册的好处,而且网络提供 商也遗漏掉接收关于这样的用户的商业信息,可以使用这些商业信息来改善服务以及向消 费者做广告。相应地,需要使诸如IPTV之类的设备的注册过程更方便,并由此使用户能够 更方便地得到这样注册的好处。此外,还需要改善向这样的设备输入数据的总体用户体验。

【发明内容】

[0006] 在系统和方法的实现中,用户可以使用语音命令而并非使用麻烦的设备或必须导 航到单独的注册网站,方便地注册并管理内容回放设备,例如IPTV。如此,可以更方便地实 现注册。在注册之后,可以实现额外的跟进特征,诸如直接选择用于浏览的设备,与用户帐 户相关联的其他设备的注册信息或配置的继承。
[0007] 系统和方法的实现可以使用web表单和与设备和浏览器兼容的web技术来接受用 户输入以及服务器侧脚本语言。可以在各种位置处使用话音(speech)引擎来将语音输入 转换为文本或数值数据以注册IPTV,或实际上任何启用网络的设备。话音引擎可以以各种 方式接收语音输入,例如从USB或指定的硬件端口,从耦合到遥控器、IPTV或其他设备、第 二显示器等等或嵌入在它们内的麦克风。所识别的文本可以向用户显示在内容回放设备 上,以确保准确的转录。接着,可以将所识别的文本(例如注册信息)自动地或人工地提交 到网络提供商。
[0008] 在操作方法的一个示例中,当内容回放设备被打开并可以与网络进行通信(例 如,要么以有线方式要么以无线方式)时,如有必要提示用户输入网络密码,并接着被自动 地定向到注册门户。如果用户在注册门户中没有用户帐户,则可以提示他们创建一个。在 用户登录到注册门户之后,提示用户添加内容回放设备的注册码或其他可标识的代码,诸 如MAC地址。接着,用户向音频输入设备说出代码,逐个字符地或者一次性地全部说出。与 注册(或其他管理)门户的交互可以完全通过语音或可以通过语音和使用遥控器的人工输 入的组合来进行。一经成功注册,设备就可以准备好用于浏览和内容选择。用户还可以使 用先前的配置来填充新内容回放设备的注册信息,例如,从先前的配置继承信息,只需要添 加新设备的注册码。
[0009] 启用网络的内容回放设备可以呈现许多形式,多个内容回放设备可以耦合到给定 局域网,并可以在给定局域网内被选择。示例性内容回放设备可包括IPTV、DTV、数字音频 系统、Blu-ray?播放器、或适当地被配置以便连接的更传统的视频和音频系统。在视频 系统中,内容回放设备包括控制视频显示器以在其上呈现内容的处理器。
[0010] -方面,本发明涉及向启用网络的设备输入数据的方法,包括:将启用网络的设备 配置为处于接收音频数据的状态,所述数据与附属于所述启用网络的设备的服务、与所述 启用网络的设备相关联的服务器、或所述启用网络的设备的用户界面的操作相关联;接收 音频数据;将所接收到的音频数据转换为文本数据;以及导致所述启用网络的设备基于所 述文本数据来执行动作,所述文本数据表示所述服务或所述服务器上的功能,或者表示所 述启用网络的设备的用户界面上的操作。
[0011] 本发明的实现可包括以下中的一项或多项。接收到的音频数据可以是注册数据, 该方法还可以包括将文本数据与用户帐户相关联,从而,启用网络的设备被注册到该用户 帐户。该方法还可以包括基于注册数据创建用户帐户。接收到的音频数据可以是用户名或 密码或者这两者,服务上的功能可以是登录到服务上的用户帐户。接收到的音频数据可以 是导航命令,在用户界面上执行操作可包括执行该导航命令。该方法还可以包括传输导致 启用网络的设备显示文本数据的信号。在接收音频数据并将其转换为对应于字符的文本 数据之后,所述字符的文本版本可以显示在所述启用网络的设备上。该方法还可以包括提 示用户确认所述文本数据。该方法还可以包括存储接收到的音频数据,并且如果跟在显示 提示之后是用户修改所述文本数据,则该方法还可以包括将已修改的文本数据与接收到的 音频数据相关联。该方法还可以包括:从接收到的音频数据检测语言类型;如果检测到的 语言类型不对应于所述启用网络的设备的支持语言中的一个,那么:执行转换步骤,使得文 本数据是对应于检测到的语言类型的形式;创建文本数据的镜像文件;以及将所述图像文 件传输到所述启用网络的设备,供显示。该方法还可以包括:从接收到的音频数据检测语 言类型;如果检测到的语言类型不对应于所述启用网络的设备的支持语言中的一个,那么: 执行转换步骤,使得文本数据是对应于检测到的语言类型的形式;以及将所述文本数据传 输到所述启用网络的设备,供显示。该方法还可以包括:从接收到的音频数据检测语言类 型;如果检测到的语言类型不对应于所述启用网络的设备的支持语言中的一个,那么,将对 应于检测到的语言类型的语言模块下载到所述启用网络的设备。该方法还可以包括:提示 用户输入语言类型,并且一经输入语言类型,就将对应于所输入的语言类型的语言模块下 载到所述启用网络的设备。
[0012] 在另一方面,本发明涉及非暂态计算机可读介质,包括用于导致计算设备实现上 面的方法的指令。
[0013] 在另一方面,本发明涉及用于启用网络的设备输入数据的方法,包括:将启用网络 的设备配置为处于接收音频数据的状态;接收音频数据;将接收到的音频数据转换为文本 数据;以及导致所述启用网络的设备基于使用所述文本数据的请求来执行动作。
[0014] 本发明的各实现可包括以下中的一项或多项。请求数据的输入可包括显示表单以 及提示输入数据,该方法还可以包括利用文本数据来填充表单并且显示经填充的表单。该 表单可以提示输入注册码,该方法还可以包括将文本数据传输到服务器以执行注册,并且 一经从服务器接收到指示成功注册的信号,就显示成功注册的指示。请求数据的输入可包 括接受导航命令的输入。接收音频数据可包括使用启用网络的设备上的输入端口来接收音 频数据。将接收到的音频数据转换为文本数据可以在启用网络的设备上执行。该方法还可 以包括:在转换之前,确定接收到的音频数据是使用不被支持的语言;以及,下载对应于接 收到的音频数据的语言的语言模块。输入端口可以被配置成接受来自移动电话、平板计算 机、膝上型计算机、麦克风的音频数据或音频流,或者可以是USB端口。加密狗可以耦合到 USB端口,接收音频数据可以由耦合到加密狗的麦克风执行。将接收到的音频数据转换为文 本数据可以在加密狗中执行。接收音频数据可包括从遥控器接收音频数据。将接收到的音 频数据转换为文本数据可以在遥控器上
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1