用于登记用户命令的显示装置和方法_2

文档序号：9870882阅读：来源：国知局

所说语音，显示装置100分析输入所说语音的语音信号，以确定相应的语音信号是否是用于使显示装置100进入语音识别模式的触发命令。作为确定结果，响应于相应语音信号是在语音识别模式下操作显示装置100的命令，显示装置100进入语音识别模式。这样，在显示装置100进入语音识别模式的状态中，响应于将附加的用户所说语音输入到显示装置100中，显示装置100内部地将附加的所说语音转换为文本。然而，本公开不限于此。例如，在显示装置100进入语音识别模式的状态中，响应于通过输入装置200来输入用户所说语音，或不可能进行针对用户所说语音的语音识别，显示装置100可以通过语音识别装置300来接收用户所说语音的文本。
[0054]这里，语音识别装置300可以是执行与显示装置100的数据通信41以执行针对来自显示装置100的用户所说语音的语音识别并向显示装置100发送识别出的语音识别结果的
目.0
[0055]此后，显示装置100可以基于用户所说语音的文本来控制显示装置100的操作，或从网络服务器(未示出)接收并显示与用户所说语音相对应的响应信息。
[0056]这里，网络服务器(未示出)是提供内容相关信息的服务器。例如，如果从用户输入“请检索〇〇〇”的语句，则通信单元160可以从网络服务器(未示出)接收与“〇〇〇”相关联的检索到的结果。
[0057]同时，可以由用户登记并设置关于用户所说语音的控制显示装置100的操作的执行命令。以下，意在由用户登记并设置的执行命令被称为用户命令。具体地，用户可以通过输入装置200输入意在由他或她自己登记并设置的用户命令。如果向显示装置100输入了上述用户命令，则输入装置200向显示装置100发送包括文本类型的用户命令的用户命令登记请求信息。然而，本公开不限于此。例如，在用户命令登记模式下设置显示装置100的状态中，显示装置100可以通过麦克风接收用户命令的所说语音。响应于向显示装置100输入上述用户命令的所说语音，显示装置100可以向语音识别装置300发送输入所说语音，并可以从语音识别装置300接收转换为文本类型的用户命令。
[0058]响应于从输入装置200或语音识别装置300接收上述文本类型的用户命令，显示装置100生成文本类型的用户命令的音标。此后，显示装置100通过预定的合适性确定条件来分析用户命令的音标，以确定用户请求的用户命令的登记合适性。这里，合适性确定条件可以是以下各项中的至少一个:音标的总数、音标的元音和辅音是否是连续的、音标的配置形式、每个单词的音标的数量以及是否包括预定义的弱音标。
[0059]因此，显示装置100通过上述合适性确定条件来分析用户命令的音标，以确定用户命令的登记合适性，并向用户界面(UI)和音频设备中的至少一个输出确定结果。在确定用户命令的登记不合适的情况下，用户可以重新输入可登记用户命令，并且显示装置100可以重新执行上述操作，以重新执行针对重新输入的用户命令的登记合适性确定。同时，在确定用户命令的登记合适的情况下，显示装置100根据相应用户命令的登记请求来登记用户命令。因此，用户可以使用由他或她自己设置的用户命令来控制显示装置100的操作。
[0060]以上，已经示意性地描述了根据本公开的语音识别系统的相应配置。以下，将具体描述上述显示装置100的各配置。
[0061]图2是根据本公开的示例实施例的显示装置的框图，以及图3是示出根据本公开的示例实施例的显示装置的详细框图。
[0062]如图2所示，显示装置100包括输入单元110、输出单元120和处理器140。附加地，如图3所示，除输入单元110、输出单元120和处理器140的配置以外，显示装置100还可以包括语音处理单元150、通信单元160和存储单元170。
[0063]可以将输入单元110实现为输入面板，输入单元110是用于接收各种用户操作并向处理器140发送各种用户操作的输入。这里输入面板可以用包括各种功能键、数字键、特殊键、字母键等的触摸面板、或按键面板或触摸屏类型来形成。此外，输入单元170可以接收从遥控装置200(例如遥控器或控制显示装置100的操作的键盘)发送的控制命令。此外，输入单元110可以通过麦克风(未示出)来接收用户所说语音。上述输入单元110可以从遥控装置220接收文本类型的用户命令或者可以通过麦克风(未示出)来接收用户命令的所说语音。这里，用户命令可以是用于使显示装置100进入语音识别模式的触发命令和用于控制显示装置100的操作的控制命令中的至少一个，用户命令是由用户定义来控制显示装置100的操作的执行命令。
[0064]输出单元120输出针对通过输入单元110的用户命令输入的登记合适性确定结果。如图3所示，上述输出单元120可以包括显示单元121和音频输出单元123。因此，输出单元120可以通过显示单元121和音频输出单元123中的至少一个输出针对用户命令的登记合适性确定结果。
[0065]同时，处理器140是通常负责对装置的控制的配置，可以与中央处理单元、微处理器、控制单元等互换地使用。此外，可以将要控制装置的一般操作的处理器140实现为片上系统(SOC)或具有其他功能单元的片上系统(SoC)。
[0066]这种处理器140通常控制构成显示装置100的所有配置的操作。具体地，处理器140可以根据用户命令将在存储单元170中预存储的音标生成相关程序复制到随机存取存储器(RAM)中用于用户命令登记，并可以使用在RAM中复制的音标生成相关程序来生成文本类型的用户命令的音标。
[0067]更具体地，处理器140可以基于预定义的音标集来生成文本类型的用户命令的音标。这里，预定义的音标集可以包括以下各项中的至少一个:元音、双元音、辅音、破擦音、口音和符号。如果生成了用户命令的这种音标，则处理器140基于预定的合适性确定条件来分析预生成的音标，以确定用户命令的登记合适性。此后，处理器140控制输出单元120输出针对用户命令的登记合适性确定结果。
[0068]具体地，如果通过输入单元110输入由用户定义的用户命令的登记请求信息，则处理器140进入用户命令的登记执行模式。这里，登记请求信息可以是用于登记与进入语音识别模式的触发命令相关联的用户命令的请求信息，或用于登记与控制显示装置100的操作的控制命令相关联的用户命令的请求信息。响应于与在输入这种登记请求信息之后通过输入单元110输入与用户的登记请求相对应的用户命令，处理器140以音标形式生成输入用户命令。根据示例实施例，响应于通过输入单元110输入与从麦克风(未示出)输出的用户命令相关联的所说语音，处理器140执行控制以使得语音处理单元150执行针对用户所说语音的语音识别。根据这种控制命令，语音处理单元150可以使用语音到文本(STT)算法将用户所说语音转换为文本。
[0069]根据示例实施例，响应于通过输入单元110输入与从麦克风(未示出)输出的用户命令相关联的所说语音，处理器140向语音识别装置300发送与用户命令相关联的所说语音。因此，语音识别装置300针对接收到的所说语音进行语音识别，并向显示装置100发送文本类型的语音识别结果。在这种情况下，语音识别装置300可以向显示装置100发送关于用户所说语音的文本类型的至少一个语音识别结果。因此，在从语音识别装置300接收针对用户所说语音的多个文本的情况下，处理器140控制输出单元120显示多个文本的列表。因此，输出单元120通过显示单元121显示多个文本的列表。在显示这种列表的状态中，响应于输入针对一个文本的选择命令，处理器140可以确定与输入选择命令相对应的文本作为用户所说语音的文本。
[0070]根据示例实施例，处理器140可以根据是否可以通过通信单元160执行与语音识别装置300的数据通信来确定执行针对用户所说语音的语音识别的主体。也就是说，如果可以执行与语音识别装置300的数据通信，则处理器140可以从语音识别装置300接收针对用户所说语音的语音识别结果，并且如果不能执行与语音识别装置300的数据通信，则处理器140可以通过语音处理单元150执行针对用户所说语音的语音识别。
[0071]这里，通信单元160执行与语音识别装置300的数据通信，并从语音识别装置300接收针对用户所说语音的语音识别结果。此外，通信单元160可以执行与输入装置200的数据通信，并可以接收用于控制显示装置100的操作的用户命令和用户所说语音中的至少一个。附加地，通信单元160可以执行与网络服务器(未示出)的数据通信，并可以接收与用户所说语音相对应的响应信息。
[0072]这种通信单元160可以包括各种通信模块，例如局域无线通信模块(未示出)、无线通信模块(未示出)等。这里，局域无线通信模块(未示出)可以是例如蓝牙、Zigbee等，局域无线通信模块是执行与位于局域的输入装置200和网络服务器(未示出)的至少一个的无线通信的通信模块。无线通信模块(未示出)是根据无线通信协议(例如WiF1、IEEE等)与外部网络连接以执行通信的模块。无线通信模块还可以包括根据各种移动通信标准(例如第三代(3G)、第三代合作伙伴计划(3GPP)、长期演进(LTE)等)与移动通信网连接以执行通信的移动通信模块。
[0073]同时，如果根据上述各示例实施例将与用户命令相关联的所说语音转换为文本类型或从语音识别装置300接收与用户命令相关联的所说语音，则处理器140基于预定义的音标集来生成文本类型的用户命令的音标。例如，响应于输入被称为“kangazi”的文本类型的用户命令，处理器140可以根据被称为“kangazi”的文本类型的用户命令来生成音标[k:ang_a:_z i]。
[0074]如果生成了这种音标，则处理器140基于预定的合适性确定条件来分析生成的音标，以确定用户命令的登记合适性。作为确定结果，如果确定用户命令的登记是合适的，则处理器140在存储单元170中登记并存储由用户定义的用户命令。此后，响应于输入存储单元170中登记并存储的用户命令的语句，处理器140可以基于与输入语句相关联的用户命令来控制显示装置100的操作。图4是示出根据本公开的实施例的确定合适性的模块的视图。
[0075]如图4所示，确定登记合适性的模块410可以包括以下的至少一个:分析音标总数的模块411、分析配置音标的元音和辅音配置的模块413、分析音标配置形式的模块415、分析配置用户命令的每个单词的音标的模块417和检测弱音标的模块

完整全部详细技术资料下载

当前第2页1 2 3 4 5