在语音识别系统中控制显示装置的显示装置和方法与流程

文档序号:16896032发布日期:2019-02-15 23:39阅读:179来源:国知局
在语音识别系统中控制显示装置的显示装置和方法与流程

本公开涉及一种在语音识别系统中控制显示装置的显示装置和方法。更具体地,示例性实施例涉及根据用户语音来控制显示装置的功能的显示装置以及在语音识别系统中控制显示装置的方法。



背景技术:

一般而言,能够识别语音的显示装置被划分为嵌入式装置和交互式装置。

根据嵌入式方案的显示装置只能识别有限数目的用户的语音。具体地,根据嵌入式方案的显示装置只有在输入与预存命令相对应的用户的语音时才能执行与用户的语音相对应的功能。根据嵌入式方案的显示装置具有快速地执行与输入的用户的语音相对应的功能的优点;然而,该装置具有识别用户的语音的能力有限的缺点,因为该装置只识别与预存命令相对应的用户的语音。

根据交互式方案的显示装置通过经由外部交互式服务器识别各种用户的语音来识别用户的意图,并且执行适合于所识别的用户的意图的操作。当输入用户的语音时,根据交互式方案的显示装置从交互式服务器接收与用户的语音相对应的控制信息或响应信息(例如,内容搜索信息),并且基于该控制信息或响应信息来执行与用户的语音相对应的功能。与根据嵌入式方案的显示装置相比,根据交互式方案的显示装置具有会识别各种种类的用户的言语并执行与所识别的用户的言语相对应的操作的优点,然而,它与根据嵌入式方案的显示装置相比,具有响应速度较慢的缺点,因为根据交互式方案的显示装置通过使用交互式服务器来执行与用户的语音相对应的功能。

具体地,已开发使用这两种方案的显示装置。然而,即使使用了两种方案,但如果用户没有说出嵌入在显示装置中的命令,而是说出与所嵌入的命令类似的命令,该显示装置也还是基于交互式方案来识别用户的语音并且执行与用户的语音相对应的功能。例如,响应于被嵌入来执行显示装置的增加音量功能的命令为“增加音量”,但用户说出“请增加音量”,该显示装置将使用具有较低响应速度的交互式方案,而不是具有较快响应速度的嵌入式方案,来执行“增加音量”功能。

换言之,当用户不知道两种识别方案中的哪种允许语音识别更迅速地被执行时,显示装置的工作量被不必要地增加并且对用户的语音的响应变慢。



技术实现要素:

技术问题

本发明提供一种向用户提供语音指引信息从而快速地响应于被输入的用户的语音来控制显示装置的功能的显示装置;一种控制该显示装置的方法以及控制语音识别系统的方法。

解决问题的方案

根据示例性实施例的一方面,提供一种控制显示装置的方法。该方法可以包括:接收用于控制显示装置的用户的语音;确定用户的语音是否为预存在显示装置中的命令并且向交互式服务器发送用户的语音;以及当在用户的语音不是在显示装置中预存的命令的情况下从交互式服务器发送与用户的语音相对应的控制信息和第一指引信息时,基于从交互式服务器发送的控制信息来执行显示装置的功能并显示第一指引信息,第一指引信息指引能够执行与用户的语音相同的功能的预存命令。

交互式服务器可以搜索与用户的语音相对应的控制信息;在搜索与用户的语音相对应的控制信息的时候,确定是否存在能够执行与控制信息相同的功能的、在显示装置中预存的命令;以及当存在能够执行与控制信息相同的功能的、在显示装置中的预存的命令时,生成指引该预存的命令第一指引信息,并且将该指引信息与控制信息一起发送给显示装置。

该方法还可以包括:当用户的语音为预存的命令时,搜索与预存的命令相对应的控制信息;以及优先地基于所搜索的控制信息来执行显示装置的功能。

该方法还可以包括:当用户的语音为预存的命令并且用户的语音为用于控制具有多个层次结构的显示装置的功能的命令时,显示第二指引信息,其指引能够执行与用户的语音相同的功能的交互式命令。

交互式服务器可以包括将用户的语音转换成文本信息的第一交互式服务器;以及基于文本信息生成控制信息和第一指引信息的第二交互式服务器。

根据示例性实施例的一方面,在此提供了一种显示装置。该装置可以包括:语音输入部,被配置为接收用于控制显示装置的用户的语音;通信器,被配置为执行与交互式服务器的通信;存储装置,被配置为使命令和控制信息相匹配以存储它们;显示器;以及控制器,被配置为当确定经由用户输入进行输入的用户的语音是否为在存储装置中预存的命令的时候,经由通信器向交互式服务器发送用户的语音,并且在用户的语音不是在存储装置中预存的命令的情况下,并且当从交互式服务器发送与用户的语音相对应的控制信息和能够执行与用户的语音相同的功能的预存命令的第一指引信息时,控制器被配置为基于从交互式服务器发送的控制信息来执行显示装置的功能,并控制显示器以便显示第一指引信息。

交互式服务器可以搜索与用户的语音相对应的控制信息;在搜索与用户的语音相对应的控制信息的时候,确定是否存在能够执行与控制信息相同的功能的、预存在显示装置中的命令;以及当存在能够执行与控制信息相同的功能的、在显示装置中的预存的命令时,生成指引该预存的命令的第一指引信息,并且将该指引信息与控制信息一起发送给显示装置。

控制器可以在用户的语音为存储装置中的预存命令时,搜索存储装置中预存的、与用户的语音相对应的控制信息;以及优先地基于所搜索的控制信息来执行显示装置的功能。

当用户的语音为预存的命令并且用户的语音为控制具有多个层次结构的显示装置的功能的命令时,控制器可以控制显示器显示第二指引信息,其指引能够执行与用户的语音相同的功能的交互式命令。

交互式服务器可以包括将用户的语音转换成文本信息的第一交互式服务器;以及基于文本信息生成控制信息和第一指引信息的第二交互式服务器,并且控制器可以向第一交互式服务器发送用户的语音,并且控制通信器向第二交互式服务器发送已从第一交互式服务器发送的文本信息。

根据示例性实施例的一方面,在此提供一种控制包括交互式服务器和显示装置的语音识别系统的方法。该方法可以包括:由显示装置接收用户的语音;当确定经由用户输入进行输入的用户的语音是否为预存在存储装置中的命令的时候,由显示装置经由通信器向交互式服务器发送用户的语音;由交互式服务器通过生成与用户的语音相对应的控制信息和第一指引信息中的至少一个来向显示装置发送信息,第一指引信息指引能够执行与控制信息相同的功能的、预存在显示装置中的命令;以及当用户的语音不是预存在显示装置中的命令时,由显示装置基于从交互式服务器发送的控制信息来执行显示装置的功能并显示第一指引信息。

该方法还可以包括:当用户的语音是预存在显示装置中的命令时,由显示装置搜索与用户的语音相对应的控制信息,并基于所搜索的控制信息来执行显示装置的功能。

该方法还可以包括:当用户的语音为预存的命令并且用户的语音为用于控制具有多个层次结构的显示装置的功能的命令时,由显示装置显示第二指引信息,其指引能够执行与用户的语音相同的功能的交互式命令。

交互式服务器可以包括将用户的语音转换成文本信息的第一交互式服务器;以及基于文本信息生成控制信息和第一指引信息的第二交互式服务器,并且发送用户的语音可以包括:由显示装置将用户的语音转换成数字信号;由显示装置向第一交互式服务器发送数字信号;由第一交互式服务器生成对应于数字信号的文本信息并向显示装置发送该信息;以及显示装置向第二交互式服务器发送文本信息。

发送信息还可以包括:当用户的语音不是预存在交互式服务器中的对话模式(dialogpattern)时,由交互式服务器执行与用户的语音相同的功能,生成第三指引信息并发送该信息到显示装置,第三指引信息根据存储在交互式服务器中的对话模式来指引用户的语音;并且由显示装置显示第三指引信息。

发送信息还可以包括:当用户的语音是交互式服务器不能响应的交互式语音时,由交互式服务器通过从用户的语音提取关键词来生成第四指引信息,并且向显示装置发送该信息,第四指引信息指引与关键词相关的信息;以及由显示装置显示第四指引信息。

示例性实施例的一方面可以提供一种显示装置,包括:通信器,被配置为与交互式服务器通信;存储装置,被配置为使命令和控制信息相匹配以便存储它们;以及控制器,被配置为当确定经由用户输入进行输入的用户的语音是否为预存的命令的时候,经由通信器向交互式服务器发送用户的语音,当用户的语音不是预存的命令时并且当从交互式服务器发送与用户的语音相对应的控制信息和第一指引信息时,第一指引信息指引能够执行与用户的语音相同的功能的预存命令,控制器被配置为基于从交互式服务器发送的控制信息来执行显示装置的功能,并被配置为控制第一指引信息的显示。

语音输入部可以被提供以接收要用于控制显示装置的用户的语音。

显示器可以被提供以显示第一指引信息。另外,控制器可以在用户的语音为存储装置中预存的命令时,搜索存储装置中的预存的、与用户的语音相对应的控制信息;以及基于所搜索的控制信息来执行显示装置的功能。

根据本公开的示例性实施例的一方面提供了一种显示装置,包括:语音输入部;通信器,被配置为与交互式服务器通信;存储装置;显示器;以及控制器,被配置为:经由所述用户输入部接收用于控制所述显示装置的用户的语音,经由所述通信器将所述用户的语音发送到所述交互式服务器而不管用户的语音是否与存储在存储装置中的命令相对应,响应于确定所述用户的语音与所述命令相对应,根据所存储的命令执行显示装置的功能,响应于确定所述用户的语音不与所存储的命令相对应,执行显示装置的与经由通信器从交互式服务器接收的控制信息相对应的功能,并控制显示器显示指引用户使用所存储的经由通信器从交互式服务器接收的命令的第一指引信息。

根据本公开的示例性实施例的一方面提供了一种控制显示装置的方法,所述方法包括:经由用户输入部接收用于控制所述显示装置的用户的语音;将所述用户的语音发送到所述交互式服务器而不管用户的语音是否与存储在显示装置的存储装置中的命令相对应,响应于确定所述用户的语音与所述命令相对应,根据所存储的命令执行显示装置的功能,响应于确定所述用户的语音不与所存储的命令相对应,执行显示装置的与从交互式服务器接收的控制信息相对应的功能,并显示指引用户使用所存储的从交互式服务器接收的命令的第一指引信息。

根据本公开的示例性实施例的一方面提供了一种控制包括交互式服务器和显示装置的语音识别系统的方法,所述方法包括:由显示装置接收用于控制所述显示装置的用户的语音;由所述显示装置将所述用户的语音发送到所述交互式服务器而不管用户的语音是否与存储在显示装置的存储装置中的命令相对应,响应于确定所述用户的语音与所述命令相对应,由所述显示装置根据所存储的命令执行显示装置的功能,响应于确定所述用户的语音不与所存储的命令相对应,由所述交互式服务器搜索与用户的语音相对应的控制信息以及由所述交互式服务器生成指引所述预存命令的第一指引信息并且将控制信息和第一指引信息发送给所述显示装置,由所述显示装置执行显示装置的与从交互式服务器接收的控制信息相对应的功能,并由所述显示装置显示指引用户使用所存储的从交互式服务器接收的命令的第一指引信息。

本公开的额外方面和效用一部分将在接下来的描述中记载,一部分将从描述中变得明显,或者可通过实践示例性实施例来获知。

发明的有益效果

如上所述,根据示例性实施例,示例性实施例提供了向用户指引更有效且迅速的语音识别方法的指引信息,从而用户能够更有效地且迅速地控制显示装置。

附图说明

从接下来结合附图的实施例的描述中,本公开的这些和/或其他方面和效用将变得清楚且更容易理解,附图中:

图1是根据示例性实施例的语音识别系统的视图;

图2是根据示例性实施例的显示装置的框图;

图3是根据示例性实施例的语音输入部的框图;

图4至图7是根据各种示例性实施例的示出指引信息的视图;

图8是根据示例性实施例的交互式服务器的框图;

图9是根据示例性实施例的说明控制显示装置的方法的流程图;

图10是根据示例性实施例的说明控制语音识别系统的显示装置的方法的序列图;并且

图11是根据另一示例性实施例的语音识别系统的视图。

具体实施方式

现将详细参照示例性实施例,实施例的示例在附图中图示出,附图中同样的参考标记始终指代同样的元素。下面通过参考附图来描述示范性实施例以便说明本公开。

图1是根据示例性实施例的语音识别系统的视图。如图1中所述,语音识别系统10包括显示装置100和交互式服务器200。显示装置可以被实现为智能tv,但这仅仅是示例。显示装置可以被实现为各种电子设备,诸如智能电话、桌面pc、平板型pc、膝上型pc和导航设备。

显示装置100可以识别用户的语音,并且可以基于对用户的语音的识别来执行显示装置100的功能。具体地,显示装置100可以通过使用嵌入式方案和交互式方案、根据用户的语音来执行显示装置100的功能。

具体地,显示装置100识别用户的语音,并将用于执行显示装置100的功能的命令匹配到控制信息并且存储它们。例如,显示装置100可以将命令“增加音量”匹配到控制信息“将音频音量等级增加到预定等级”,并且可以存储它们。

响应于被输入到显示装置100的用户的语音,显示装置100可以将用户的语音发送到外部交互式服务器200,并且可以同时确定该用户的语音是否为显示装置100中的预存命令。

交互式服务器200可以基于数据库来搜索与从显示装置100接收到的用户的语音相对应的控制信息。例如,响应于所接收的用户的语音为“请增加音量”,交互式服务器200可以基于关键词“音量”和“增加”来搜索控制信息“将从显示装置100输出的音频的音量等级增加到预定等级(如等级3)”。

交互式服务器200可以在搜索与用户的语音相对应的控制信息的时候,确定是否存在能够执行与控制信息相同功能的、在显示装置中的预存命令。响应于存在能够执行与控制信息相同功能的、在显示装置中的预存命令,交互式服务器200可以生成指引显示装置100中的预存命令的第一指引信息并且将第一指引信息和控制信息一起发送给显示装置100。例如,交互式服务器200可以搜索能够执行与所接收的用户的语音“请增加音量”相同功能的、显示装置中的预存命令,并且可以生成向用户指引所搜索的命令“增加音量”的第一指引信息。交互式服务器200可以发送第一指引信息和控制信息以将显示装置100的音频音量等级增加到预定等级。显示装置100通过第一指引信息诱导用户说出显示装置100中的预存命令,从而显示装置100可以更即时地响应用户的语音。

响应于用户的语音不是显示装置100中的预存命令,显示装置100可以基于从交互式服务器200发送的控制信息来执行显示装置100的功能。例如,响应于预存的命令为“增加音量”但用户说的是“请增加音量”,显示装置100可以基于从交互式服务器200发送的控制信息来执行将从显示装置100输出的音频的音量等级增加到预定等级的功能。显示装置100可以显示从交互式服务器200发送的第一指引信息。

响应于用户的语音为在显示装置100中的预存命令,显示装置100可以搜索与预存的命令相对应的控制信息,而不管从交互式服务器200发送的控制信息。显示装置100可以基于该控制信息来执行显示装置100的功能。例如,响应于陈述了“增加音量”的用户的语音(其为显示装置100中的预存命令)被输入,显示装置100搜索对应于该预存的命令的控制信息,并且可以基于所搜索的控制信息来执行将显示装置100的音频等级增加到预定等级的功能。

具体地,响应于用户的语音为显示装置100中的预存命令,但它是用于执行具有多个层次结构的显示装置的功能的命令,显示装置100可以显示指引能够执行与用户的语音相同的功能的交互式命令的第二指引信息。这是为了更简单地通过单个交互式命令来控制显示装置的功能,因为响应于基于预存的命令而执行的、具有多个层次结构的显示装置的功能,需要输入用户的语音若干次。

如上,交互式服务器向用户提供了指引更有效且迅速的语音识别方法的指引信息,从而用户能够更有效地且迅速地控制显示装置100。

在以上实施例中,已说明了无论用户的语音是否为预存的命令,用户的语音都被发送到交互式服务器200。然而,这仅仅是一个示例,并且用户的语音可以只响应于用户的语音不是预存的命令而被发送到交互式服务器200。

在下文中,将参照图2至图7来更详细地说明显示装置100。图2是根据示例性实施例的显示装置100的框图。显示装置100包括语音输入单元110、通信器120、存储装置130、显示器140和控制器150。

图2是通过建议其中显示装置100包括诸如语音识别功能、通信功能和显示功能的各种功能的示例的显示装置100的各种构成元件的总体视图。因此,依赖于示例性实施例,图2中的构成元件中的一些可以被省略或改变,或者其他构成元件可以被添加,如本领域普通技术人员将理解的那样。

语音输入部110接收包括用户的语音的音频信号、处理该音频信号并生成用户的语音信号。语音输入部110可以被形成在显示装置100的主体中,但这仅仅是一个示例。语音输入部110可以被形成在主体的外部(如遥控器或单独的麦克风)。响应于被提供在主体的外部的语音输入部110,语音输入部单元110可以经由无线/有线接口(如wifi、等)将所生成的用户的语音信号发送到显示装置100的主体。

将参照图3来说明语音输入部110如何接收包括用户的语音的音频信号并生成用户的语音信号。图3是根据示例性实施例的语音输入部的框图。如图3中所述,语音输入部110包括麦克风111、模拟-数字转换器(adc)112、能量测定仪113、噪声去除器114以及语音信号生成器115。

麦克风111接收包括用户的语音的模拟音频信号。

adc112将从麦克风输入的多通道模拟信号转换成数字信号。

能量测定仪113计算所转换的数字信号的能量,并且确定该数字信号的能量是否大于或等于预定值。响应于数字信号的能量大于或等于预定值,能量测定仪113将输入的数字信号发送到噪声去除器114,并且响应于数字信号的能量小于预定值,能量测定仪113不向外部输出所输入的数字信号,而是等待其他输入。因此,由于全部音频处理不会由不是语音信号的声音来激活,因此可以防止不必要的电力消耗。

响应于数字信号被输入到噪声去除器114,噪声去除器114从包括噪声分量和用户的语音分量的数字信号中去除噪声分量。噪声分量是不可预知的噪声,其可能是例如在家庭环境下产生的,并可能是空调的声音,吸尘器的声音或音乐的声音。噪声去除器114将去除了噪声分量的数字信号输出到语音信号生成器115。

语音信号生成器115使用定位/说话人(speaker)跟踪模块基于语音输入部110来追踪360°范围之内的用户说话位置,并且获得用户的语音的方向信息。语音信号生成器115可以通过目标说话声音提取模块、通过使用去除了噪声的数字信号以及用户的语音的方向信息、基于语音输入单元110来提出360°范围之内的目标声音源,并可以生成语言信号。

如以上所说明的,这仅仅是通过去除不必要的周边噪声来生成语言信号的示例性实施例。本公开的技术理念还可以被应用于通过确定关键词是否出现在用户的语音中来生成语音信号的示例性实施例。

返回参照图2,通信器120执行与交互式服务器200的通信。具体地,通信器120向交互式服务器200发送从语音输入部110生成的用户的语音信号,并且可以接收来自交互式服务器200的控制信息和指引信息中的至少一个。通信器120可以被实现为以太网、无线lan和wifi,但这不应被认为是限制性的。

存储装置130在其中存储各种驱动显示装置100的程序和数据。具体地,存储装置130可以包括语音识别数据库,其中命令被匹配到控制信息并且被存储。

显示器130在控制器150的控制下显示图像数据。具体地,显示器130可以显示预存的指引信息和从交互式服务器200接收到的指引信息中的一个。

控制器150根据用户的命令来控制显示装置100的全部操作。具体地,控制器150可以根据经由语音输入部110输入的用户的语音来控制显示装置100的全部操作。

具体地,控制器150确定经由语音输入部110输入的用户的语音是否为存储装置130中的预存命令。同时,控制器150可以经由通信器120将用户的语音发送到交互式服务器200。例如,响应于用户的语音“请增加音量”被经由音频输入110输入,控制器150确定输入的语音“请增加音量”是否为预存的命令。控制器150可以控制通信器120发送“请增加音量”到外部的交互式服务器200。

具体地,响应于用户的语音不是存储装置中的预存命令并且当从交互式服务器200发送与用户的语音相对应的控制信息以及用于指引能够执行与用户的语音相同的功能的预存的命令的第一指引信息时,控制器150根据所发送的控制信息来执行显示装置100的功能,并且可以控制显示器120显示第一指引信息。例如,响应于用户的语音为“请增加音量”并且当从交互式服务器200接收到控制信息“将音频音量等级增加到预定等级”和用于指引能够执行与“请增加音量”相同的功能的、预存在存储装置130中的命令“增加音量”的第一指引信息时,控制器150可以执行将音频音量等级增加到预定等级的功能,并且可以控制显示器120显示包括文本信息“下次,请说增加音量”的第一指引信息410,如图4中所述。

然而,响应于用户的语音为在存储装置130中的预存命令,控制器150搜索存储装置130中对应于该命令的控制信息,并且可以根据所搜索的控制信息来执行显示装置的功能。例如,响应于经由语音输入部110输入的用户的语音为“增加音量”,控制器150搜索与所输入的用户的语音“增加音量”相对应的控制信息“将音频音量等级增加到预定等级”,并且可以根据所搜索的控制信息来执行将音频音量等级增加到预定等级的功能。即使控制信息是从外部的交互式服务器200接收到的,控制器150也可以优先根据嵌入的命令来执行显示装置100的功能。

此外,响应于经由语音输入部110输入的用户的语音为存储在存储装置130中的命令,并且用户的语音为用于控制具有多个层次结构的显示装置的功能的命令,控制器150可以控制显示器120以显示指引能够执行与用户的语音相同的功能的交互式命令的第二指引信息。例如,响应于第一步的用户的语音“设置睡眠”被从用户输入以便使用预存的命令来设置显示装置100的睡眠功能,控制器150显示用于设置睡眠的菜单,并且响应于第二步的用户的语音“30分钟”被从用户输入,控制器150可以执行在30分钟之后关闭控制器150的电源的功能。换言之,响应于使用预存的命令来执行具有多个层次结构的显示装置的功能,用户会有输入语音多次的不便。然而,响应于以交互式形式输入的用户的语音“30分钟之后叫醒我”,控制器150可以使用交互式服务器200来执行与多个用户的语音的输入相同的功能。即,响应于具有多个层次结构的显示装置的功能被执行,控制器150可以控制显示器120显示指引如图5中所描绘的交互式命令的第二指引信息510,从而显示装置100的功能可以通过单个用户的语音来执行。

此外,响应于经由语音输入部110输入的用户的语音不是存储在交互式服务器200中的对话模式,并且当从交互式服务器200接收到第三指引信息(该第三指引信息指引执行与用户的语音相同的功能的根据存储在交互式服务器200中的对话模式的用户的语音)时,控制器150可以控制显示器120以便显示第三指引信息。例如,响应于用户的语音“改变频道”被输入,并且当从交互式服务器200发送了指引用户的语音“请将频道改变为abc”的第三指引信息(该第三指引信息为具有存储在交互式服务器200中的对话模式的命令)时,控制器150可以控制显示器120显示第三指引信息610,如图6中所述。

或者,响应于经由语音输入部110输入的用户的语音为交互式服务器200不能响应的交互式语言,并且当从交互式服务器200发送了指引与用户的语音中包括的关键词相关的信息的第四指引信息时,控制器150可以控制显示器120显示第四指引信息。例如,响应于用户的语音“刘在石怎么样”被经由语音输入部110输入,交互式服务器200不能经由所输入的用户的语音生成响应信息,因此交互式服务器200可提取关键词“刘在石”,生成指引与所提取的关键词相关的信息(例如,他的工作和他的作品)的第四指引信息,并将该第四指引信息发送到显示装置100。响应于从交互式服务器200发送了第四指引信息,控制器150可以控制显示器120显示如图7中的第四指引信息710。作为另一示例,响应于用户的语音“我们去一家美味的餐馆吧”被经由语音输入部110输入,交互式服务器200不能通过所输入的用户的语音生成响应信息,因此交互式服务器200可提取关键词“美味的餐馆”,生成用于指引与所提取的关键词相关的信息(例如,今日推荐餐厅)的第四指引信息,并将该第四指引信息发送到显示装置100。

第四指引信息710可以包括要求输入新的用户的语音的消息以及与关键词相关的信息。

由于如以上所说明的显示装置100,用户能够基于语音识别更有效地且迅速地控制显示装置100。

图8是根据示例性实施例的交互式服务器200的框图。如图8中所述,交互式服务器200包括通信器210、数据库220和控制器230。

通信器210执行与显示装置100的通信。具体地,通信器210从显示装置100接收用户的语音信号,并且可以发送控制信息和指引信息中的至少一个到显示装置100。通信器210可以根据诸如以太网、无线lan和wifi的通信方案来执行与显示装置100的通信。

数据库220存储各种数据以使用交互式语音或搜索内容来控制显示装置100的功能。具体地,数据库220可以存储诸如用户的语音的历史信息和epg信息的信息。此外,数据库220可以将用户的语音匹配到控制信息并存储它们。

此外,数据库220可以存储与显示装置100中预存的命令类似的命令,从而交互式服务器200能够提供第一指引信息,如表1中那样。

表1

[表1]

控制器230控制交互式服务器200的全部操作。

具体地,响应于从显示装置100接收到用户的语音,控制器230搜索与用户的语音相对应的控制信息。具体地,控制器230将用户的语音转换成文本信息,并且可以对用户的语音的说话要素(speakingelement)分类。控制器230基于说话要素确定用户的语音是用于控制显示装置100的功能的还是用于搜索内容的。响应于用户的语音被用于控制显示装置100的功能,控制器230可以基于数据库220来搜索与用户的语音相对应的控制信息。

控制器230在搜索与用户的语音相对应的控制信息时,确定是否存在能够执行与控制信息相同的功能的、显示装置100中的预存命令。响应于存在能够执行与控制信息相同的功能的、在显示装置中的预存命令,控制器230可以生成指引预存的命令的第一指引信息,并且可以控制通信器210将该第一指引信息和控制信息一起发送给显示装置100。例如,响应于用户的语音为“使音量升高”,控制器230可以搜索能够执行与“使音量升高”相同的功能的、显示装置100中的预存命令,并且可以生成指引执行与“使音量升高”相同的功能的、预存在装置100中的命令“增加音量”的第一指引信息。

此外,响应于从显示装置100发送的用户的语音不是存储在交互式服务器200中的对话模式,控制器230可以控制通信器210生成第三指引信息并发送该信息到显示装置,其中该第三指引信息根据执行与用户的语音相同的功能的、存储在交互式服务器200中的对话模式来指引用户的语音。例如,响应于用户的语音“改变频道”被输入,控制器230确定用户的语音不是存储在数据库220中的模式。控制器230可以生成指引用户的语音“请将频道改变为abc”的第三指引信息,从而诱导用户依据存储在数据库220中的对话模式来说话。

响应于从显示装置100发送的用户的语音为交互式服务器200不能响应的交互式语音,控制器230可以从交互式的用户的语音中提取关键词,生成指引与关键词相关的信息的第四指引信息并控制通信器210将该信息发送到显示装置100。

例如,响应于从显示装置100发送了用户的语音“刘在石怎么样”,控制器230不能经由所输入的用户的语音生成响应信息,因此控制器230可以从用户的语音中提取关键词“刘在石”,生成用于指引与所提取的关键词相关的信息(例如,他的工作和他的作品)的第四指引信息,并且将该第四指引信息发送到显示装置100。作为另一示例,响应于从显示装置100发送用户的语音“我们去一家餐馆吧”,控制器230不能经由所输入的用户的语音生成响应信息,因此控制器230可以从用户的语音中提取关键词“餐馆”,生成指引与所提取的关键词相关的信息(例如,今日推荐餐厅)的第四指引信息以及将该第四指引信息发送到显示装置100。

如以上所说明的,交互式服务器200提供了各种类型的指引信息,从而用户能够更有效地且迅速地使用语音识别来控制显示装置100的功能。

图9是根据示例性实施例的说明控制显示装置100的方法的流程图。

显示装置接收用户的语音(s910)。用户的语音可以是控制显示装置100的功能的命令,诸如音量控制、频道控制和电力控制。

显示装置100发送用户的语音到交互式服务器200(s920)。

显示装置100确定用户的语音是否为预存的命令(s930)。s920和s930可以同时执行。

响应于用户的语音为预存的命令(s930-是),显示装置100根据预存的命令来执行显示装置100的功能(s940)。

响应于用户的语音不是预存的命令(s930-否),显示装置100从交互式服务器200接收控制信息和第一指引信息(s950)。第一指引信息可以指引执行与用户的语音相同的功能的、显示装置100中的预存命令。

显示装置100根据所接收的控制信息来执行显示装置的功能并显示第一指引信息(s960)。

响应于显示装置100的功能被根据预存的命令来执行,显示装置100确定该功能是否为具有多个层次结构的显示装置100的功能(s970)。

响应于该功能为具有多个层次结构的显示装置100的功能(s970-是),显示装置100显示第二指引信息(s980)。第二指引信息可以指引执行与用户的语音相同的功能的交互式命令并可以使用交互式服务器200。

图10是根据示例性实施例的说明控制语音识别系统的显示装置的方法的序列图。

显示装置100接收用户的语音(s1010)。

显示装置100发送用户的语音到交互式服务器(s1020)。显示装置100确定用户的语音是否为预存的命令(s1030)。

交互式服务器200生成与用户的语音相对应的控制信息和指引信息(s1040)。具体地,交互式服务器200可以通过分析用户的语音的说话要素来生成与用户的语音相对应的控制信息,并且可以根据用户的语音的类型来生成各种种类的指引信息。例如,响应于用户的语音不是显示装置100中的预存命令,交互式服务器200可以生成指引能够执行与用户的语音相同的功能的、显示装置中的预存命令的第一指引信息。或者,响应于用户的语音不是交互式服务器200中存储的模式,交互式服务器200可以生成第三指引信息,所述第三指引信息指引执行与用户的语音相同的功能并遵循交互式服务器中存储的对话模式的用户的语音。响应于用户的语音为交互式服务器200不能响应的交互式语音,交互式服务器200可以从用户的语音中提取关键词,并可以生成与该关键词相关的第四指引信息。

交互式服务器200发送控制信息和指引信息到显示装置100(s1050)。

显示装置100根据用户的语音来执行显示装置的功能并显示指引信息(s1060)。具体地,显示装置100可以使用依赖于用户的语音是否为预存的命令而不同的控制信息来执行显示装置100的功能。响应于用户的语音为预存的命令,显示装置100可以搜索与预存的命令相对应的控制信息,并可以根据所搜索的控制信息来执行显示装置100的功能。然而,响应于用户的语音不是预存的命令,显示装置100可以根据从交互式服务器200发送的控制信息来执行显示装置100的功能。此外,显示装置100可以显示如图4至图7中所说明的指引信息410、510、610、710,从而用户能够更有效地且迅速地执行语音识别。

如上所记载地,本公开提供了提供有效的语音识别的指引信息,从而用户能够更有效地且迅速地执行显示装置的功能。

在以上示例性实施例中,已经说明了交互式服务器200被实现为单个服务器。然而,这仅仅是示例性实施例,并且交互式服务器可以被实现为多个服务器。例如,交互式服务器200可以包含将用户语音转换成文本信息的第一交互式服务器200-1;以及基于所述文本信息生成控制信息和第一指引信息的第二交互式服务器200-2,如图11中所述。显示装置100可以发送用户的语音到第一交互式服务器200-1,并且可以发送从第一交互式服务器200-1发送的文本信息到第二交互式服务器200-2。第二交互式服务器200-2可以基于所发送的文本信息来生成控制信息和指引信息中的至少一个,如图8中所说明的。

用于执行根据各种实施例的控制方法的程序代码可以被存储在非暂态计算机可读存储介质中。非暂态计算机可读介质是指半持久性地存储数据的介质,而不是诸如寄存器、缓存或存储器那样的很短时间地存储数据的介质,并且非暂态计算机可读介质可被装置读取。具体而言,上述各种应用或程序可以被存储在非暂态计算机可读介质中,诸如光盘(cd)、数字多功能盘(dvd)、硬盘、通用串行总线(usb)存储棒、存储卡,和只读存储器(rom),并且各种应用或程序可以被提供。

显示ui的前述方法可实现为包括可在计算机中执行的算法的程序,并且该程序可通过存储在非暂态计算机可读存储介质中来提供。

虽然已示出并描述了本公开的几个实施例,但本领域技术人员将会明白,在不脱离本发明的原理和精神的情况下,可在这些示范性实施例中作出改变,本发明的范围在所附权利要求及其等同物中定义。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1