一种语音信息交互方法以及智能电器与流程

文档序号:16636373发布日期:2019-01-16 07:03阅读:126来源:国知局
一种语音信息交互方法以及智能电器与流程

本申请涉及智能控制领域,特别的,涉及一种语音信息交互方法。此外,本申请还涉及一种实现了该种语音信息交互方法的智能电器。



背景技术:

目前,随着远场语音识别技术的进步,人工智能(artificialintelligence,简称ai)的快速发展,以及自动语言识别技术(automaticspeechrecognition,简称asr)、自然语言处理(naturallanguageprocessing,简称nlp)等的应用,家用智能设备(例如智能电视)对语音、语义的识别和理解有了较大的提升,因此一种新的交互方式出现在智能电视、ip机顶盒上。用户可以坐在电视机前,直接通过语音完成调节音量、搜索影片、开机关机等指令,从而在一些场景下摆脱了传统摇控器的束缚,非常方便。

目前市面上已经出现了许多支持远场语音的智能电视或者机顶盒,但是这些智能电器主要还是以摇控器输入为主,没有做到完全凭借输入的语音与电视界面交互,即没有做到真正意义上的免摇控控制。

其中的主要原因在于,用户不知道该如何通过说话进行交互,特别在一些比较复杂的界面,比如一个视频的详情页面上充满了功能按钮,用户并不知道如何通过语音触发它们,而即使发出语音信息,由于智能电器不能将接收到语音信息完整地解析成语义指令,从而也不能触发相应的功能,从而降低了用户体验。

公开于本申请背景技术部分的信息仅仅旨在加深对本申请的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。



技术实现要素:

本申请的主要目的在于提供一种语音信息交互方法,以解决用户在面对智能设备的交互界面而不知道如何准确的下达交互指令的技术问题。

为了解决上述问题,本申请涉及一种语音信息交互方法,该包括:将交互界面上的指令文本的显示效果与普通文本的显示效果进行区分,其中,所述指令文本对应至少一种指令;接收用户的语音信息,并且将所述语音信息识别为语音文本;如果所述语音文本与所述指令文本相应,则执行所述指令文本所对应的至少一种指令。

进一步的,所述将交互界面上的指令文本的显示效果与普通文本的显示效果进行区分包括:将所述指令文本进行高亮显示,从而使该指令文本的显示效果与普通文本的显示效果区分开。

进一步的,所述指令文本包括在所述普通文本中,或者所述指令文本独立于所述普通文本。

进一步的,所述交互界面上还显示有多个提示指令文本,所述提示指令文本中的每一个对应至少一种指令;其中,所述多个提示指令文本至少包括一个所述指令文本。

更进一步的,所述交互界面还包括:至少一个子交互界面,在所述子交互界面上显示有编码指令文本,其中,所述编码指令文本对应至少一种指令;当从用户的语音信息中识别出的语音文本包括序号文本时,则判断所述序号文本与所述编码指令文本是否相应;如果是,则执行所述编码指令文本对应的至少一种指令。

更进一步的,所述提示指令文本包括所述序号文本。

进一步的,所述指令文本在所述交互界面的上部显示,所述提示指令文本在所述交互界面的下部显示。

本申请还涉及一种智能电器,其包括用于显示交互界面的显示器或者能够将交互界面显示在其它设备的显示器上,该智能电器还包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上面所述的语音信息交互方法。

进一步的,所述智能电器可以包括:智能电视或者机顶盒。

本申请的有益效果是:通过采用本申请的技术方案,在交互界面中展示出可用语言控制的指令文本,用户可以凭借眼睛所看到的交互界面,本能的知道如何下达指令来与智能电器进行交互,从而解决了用户在面对目前市面上支持语音识别服务的智能电器的当前交互界面而不知道如何准确的下达交互指令的问题,从而从提高了用户体验和市场竞争力。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的语音信息交互方法的流程图;

图2是根据本申请实施例的语音信息交互方法的又一流程图;以及

图3是根据本申请实施例的交互界面的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

此外,术语“安装”、“设置”、“设有”、“连接”、“配置为”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1所示,图1为本申请实施例的语音信息交互方法的流程图。该种语音信息交互方法包括步骤s1至步骤s3,其中,在步骤s1,本申请将交互界面上的指令文本的显示效果进行特殊展示,以与同样显示在交互界面上普通文本的显示效果进行区分,优选地,可以将所述指令文本显示在交互界面的上部并且进行高亮显示,从而使该指令文本的显示效果与普通文本的显示效果区分开。这里,每一个指令文本均可以对应于至少一种指令,该指令用于实现相应的功能,例如翻页功能、选择功能或者声音调节功能等。

之后,在步骤s2,本发明中的asr服务器开始响应用户的开启指令或者一直保持开启状态,以用于接收用户的语音信息并且将所述语音信息识别为语音文本。这里,本申请中的asr服务器可以设置在用户的本地智能电器中(例如,智能电视或者机顶盒),或者设置在云端服务器中。

在步骤s3,如果识别出的语音文本与所述指令文本相应,则执行所述指令文本所对应的指令,以实现该指令所对应的功能。在这里,语音文本与所述指令文本相应指的是,语音文本与指令文本中的文字可以是完全匹配,也可以是部分匹配(例如,指令文本包含在语音文本中或者语音文本包含在指令文本中),也可以是模糊匹配,例如解析出的语音文本为“第一个”,而显示的指令文本为“第一页”,则可以认为语音文本与所述指令文本相应。具体的模糊匹配程度和匹配阈值可以根据需求自行设定,本发明并不做出具体限定。

特别的,本发明的指令文本可以包含在所述普通文本中,也可以独立于所述普通文本,即不包含在普通文本中而独立的显示,以更加明显地区别于普通文本。进一步的,本发明在交互界面的下部还显示有多个用于为用户提供提示性信息的提示指令文本,同样地,每一个提示指令文本也对应至少一种指令。这里的指令可以与上述的指令不同或者相同。在这些提示指令文本包括有上述指令文本的情况下,与指令文本对应的提示指令文本所对应的指令自然与该指令文本所对应的指令相同。

如图2所示,所述交互界面还显示有多个子交互界面,在这些子交互界面上均显示有编码指令文本,例如,编码文本可以为“1、2、3、4…”。同样地,所述编码指令文本也对应至少一种指令。在步骤s11,当从用户的语音信息中识别出的语音文本包括序号文本时,则判断所述序号文本与所述编码指令文本是否相应。在这里,序号文本是包含在语音文本中的一种特殊语音文本,其至少具有表征有序号信息的关键字,例如:1、2、3、4或者第一、第二、第三、第四等等。而判断所述序号文本与所述编码指令文本是否相应,可以是序号文本与指令文本中的文字完全匹配,也可以是序号文本与指令文本中的文字不完全匹配,例如,“1”与“第1”,还可以是序号文本与指令文本中的文字模糊匹配,例如,“1”与“第一”。最后,在步骤s12,如果所述序号文本与所述编码指令文本相应,则执行所述编码指令文本对应的至少一种指令。

此外,本申请还涉及一种智能电器,其包括用于显示交互界面的显示器,例如,智能电视,或者能够将交互界面显示在其它设备的显示器上,例如机顶盒,该智能电器还包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上面所述的语音信息交互方法。

本申请所涉及的计算机软件程序可以存储于计算机可读存储介质中,所述计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体装置、虚拟装置、优盘、移动硬盘、磁碟、光盘、计算机存储器、只读计算机存储器(read-onlymemory,rom)、随机存取计算机存储器(randomaccessmemory,ram)、电载波信号、电信信号以及其他软件分发介质等。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

实施例

如图3所示,图3是根据本申请的一个实施例的交互界面的示意图,该交互界面实现了本申请中的语音信息交互方法并且展示了一个典型的智能电视中浏览多个影片的场景,在该界面中,将应用当前界面所支持的指令文本(如图3中的“指令1”和“指令2”)以特殊形式展示,例如采用高亮颜色的形式展示,以区别非功能性的普通文本(例如,该图3中的“普通文本”),给用户养成一种看到此种指令文本就知道喊出其中的文字而发出相应命令(例如收看体育节目或者收藏影片等)的习惯。此外,在交互界面的下部添加指令提示栏,提示当前交互界面中所支持的提示指令(例如,图3中的“下一页”、“第2个”、“指令1”以及“其他指令”)。该提示栏中的提示指令文本可以与交互界面上部的指令文本样式相一致。此外,在该图3中,当交互界面中存在多个子交互界面时,即内容列表存在多个内容时,可以通过语音指令“第一个、第二个”等来直接命中所对应的交互子界面。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1