语音助手控制方法、装置、存储介质及智能电视与流程

文档序号:30597118发布日期:2022-07-01 20:54阅读:184来源:国知局
语音助手控制方法、装置、存储介质及智能电视与流程

1.本发明涉及通信技术领域,尤其涉及一种语音助手控制方法、存储介质及智能电视。


背景技术:

2.当前语音交互在智能设备(比如,智能电视)上已经越来越普及化,甚至是不可或缺,与此同时,智能语音助手类的产品也越来越多样化,如google assistant谷歌助理、google home谷歌家庭、alexa亚马逊等;对不同的语音助手类产品来说,不一样的基本都集中在语音识别、语义解析、云端交互、意图封装等逻辑;在完成这些环节之后,最终都需要智能设备来处理具体的行为,而这一部分逻辑对不同的语音助手来说是一致的。
3.然而,现有技术中,对于如不同的语音助手类产品来说,智能设备在处理具体的行为时,存在一部分逻辑是一致的,因此对于重复的逻辑,既浪费了系统资源,同时也不易于功能的扩展。
4.因此,现有技术有待于改进和发展。


技术实现要素:

5.本发明要解决的技术问题在于,针对现有技术的不足,提供一种语音助手控制方法、存储介质及智能电视,旨在解决智能设备在处理具体的行为时,不同的语音助手存在重复的逻辑,进而导致系统资源浪费的问题。
6.为了达到上述目的,本发明采取了以下技术方案:
7.第一方面,本发明实施例提供了一种语音助手控制方法,应用于包括底层常驻服务和上层业务分发模块的智能电视,方法包括:
8.当接收到语音助手的语音指令时,通过底层常驻服务获取语音助手对应的目标特征值;
9.根据目标特征值将语音指令发给对应的语音服务器,以使得语音服务器解析出语音指令对应的操作指令;
10.接收操作指令,通过上层业务分发模块将操作指令发送给共用的响应模块。
11.第二方面,本发明实施例提供了一种语音助手控制装置,包括:
12.获取模块,用于当接收到语音助手的语音指令时,通过底层常驻服务获取语音助手对应的目标特征值;
13.解析模块,用于根据目标特征值将语音指令发给对应的语音服务器,以使得语音服务器解析出语音指令对应的操作指令;
14.发送模块,用于接收操作指令,通过上层业务分发模块将操作指令发送给共用的响应模块。
15.第三方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有语音助手控制程序,语音助手控制程序被处理器执行,以实现如上任意一项的语音
助手控制方法中的步骤。
16.第四方面,本发明实施例提供了一种智能电视,智能电视包括:处理器和存储器及通信总线;存储器上存储有可被处理器执行的计算机可读程序;
17.通信总线实现处理器和存储器之间的通信连接;
18.处理器执行计算机可读程序时实现如上任意一项的语音助手控制方法中的步骤。
19.有益效果:与现有技术相比,本发明提供了一种语音助手控制方法、装置、存储介质及智能电视,方法应用于智能电视,智能电视包括底层常驻服务和上层业务分发模块,方法包括:当接收到语音助手的语音指令时,通过底层常驻服务获取语音助手对应的目标特征值;根据目标特征值将语音指令发给对应的语音服务器,以使得语音服务器解析出语音指令对应的操作指令;接收操作指令,通过上层业务分发模块将操作指令发送给共用的响应模块。本发明电视在集成多种语音助手时,不同的语音助手可以共用一套响应模块的逻辑资源,这样不仅解决了资源占用大的问题,而且降低了人力成本。
附图说明
20.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1为本发明提供的语音助手控制方法的流程图;
22.图2为本发明提供的语音助手控制方法的结构原理图;
23.图3为本发明提供的语音助手控制装置的结构示意图;
24.图4为本发明提供的智能电视的结构原理图。
具体实施方式
25.本发明提供一种语音助手控制方法、装置、存储介质及智能电视,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
26.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
27.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
28.下面结合附图,通过对实施例的描述,对发明内容作进一步说明。
29.本实施例提供了一种语音助手控制方法,应用于包括底层常驻服务和上层业务分发模块的智能电视,如图1和图2所示,方法包括:
30.s100、当智能电视接收到语音助手的语音指令时,通过底层常驻服务获取语音助手对应的目标特征值。
31.本实施例中,语音助手指的是亚马逊语音、谷歌语音、谷歌家庭等语音助手,目前市面的智能电视一般都集成有多种语音助手,且不同的语音助手各自处理各自的逻辑,互不影响。但是,对不同的语音助手类产品来说,不一样的基本都集中在语音识别、语义解析、云端交互、意图封装等逻辑;在完成这些环节之后,最终都需要智能设备来处理具体的行为,而这一部分逻辑对不同的语音助手来说是一致的。因此,本发明实施例通过一套统一的语音接口层,所有的语音助手根据关键字自动识别,分开将实际的意图(即实际的操作指令,如频道切换、信源切换、播放视频等)发送给语音统一接口层,由它来处理后续的行为,以达到节约资源、易于扩展的目的。
32.本实施例中,当智能电视开机后,会自动启动底层常驻服务,因此,当接收到语音助手的语音指令之前还包括如下步骤:
33.当接收到开机广播后,自动启动底层常驻服务;或者
34.将底层常驻服务注册为系统核心服务。
35.具体来说,可采用语音助手应用收到开机广播后启动服务的方式,当电视开机完成后,语音应用会收到开机广播,收到开机广播之后就可以启动底层服务;又或者,采用将服务注册为系统核心服务的方式,这样,将服务注册为系统核心服务后,系统启动的过程中servicemanager模块会自动将底层常驻服务当作系统的必要服务一并启动。
36.进一步地,本实施例中,当接收到语音助手的语音指令之前,还包括:
37.s10、预先为不同语音助手设置对应的特征值;
38.s20、根据不同语音助手对应的特征值建立语音助手与特征值之间的映射关系。
39.具体来说,本发明实施例中首先会约定好不同的语音助手的特征值,比如亚马逊的为1,谷歌google的为2,在实际应用中,一个语音助手的特征值可能会是一串经过加密的很长的字符串,当亚马逊的服务器收到语音指令时,该语音指令携带了亚马逊对应的特征值,可以理解的,当谷歌等其他软件助手的服务器都接收到语音指令时,那么该语音指令同样会携带有谷歌对应的特征值。需要说明的是,本发明实施例中预先定义好的不同语音助手的特征值以一定区间的形式定义在底层服务当中,这是由于同一种语音助手可能对应多个特征值,这样当语音助手的特征值处于这个区间,即说明这些语音助手属于同一类型。
40.因此,当接收到语音助手的语音指令时,通过底层常驻服务获取语音助手对应的目标特征值具体包括:当接收到语音助手的语音指令时,通过底层常驻服务根据映射关系获取语音助手对应的目标特征值。也就是说,可以根据语音助手的特征值是否在预先定义好的区间中来识别是否为对应的语音助手类型,即可以区分语音指令到底来至于哪种语音助手,比如来自亚马逊的语音指令,需要识别为亚马逊助手,而不能识别为谷歌助手。因为不同的语音助手后续的处理流程有可能会不一样,为了避免指令处理错误,需要准确识别对应的特征值。
41.s200、智能电视根据目标特征值将语音指令发给对应的语音服务器,以使得语音
服务器解析出语音指令对应的操作指令。
42.本实施例中,根据不同语音助手的工作方式,分别启动不同的子线程连接各自的语音服务器,语音服务器即云端的服务器,它的作用是语义识别,即将用户所说的话解析成实际的指令,并保持长连接;之所以要保持长连接,是因为用户任何时刻都有可能有语音需求,当用户说话时,就需要服务器将用户所说的话解析成指令并反馈给智能电视;如果是短连接,则有可能出现,当用户说话时,没有办法即时解析用户的语言。需要说明的是,本发明实施例对于需要局域网内设备发现的语音助手,还需再启动一个子线程,不断检测和发现局域网内的设备并进行连接,如对于homekit(是苹果2014年发布的智能家居平台)来说,智能电视需要和手机连接,用户对着手机讲话,最终的指令会发送到电视端处理。
43.s300、智能电视接收操作指令,通过上层业务分发模块将操作指令发送给共用的响应模块。
44.本实施例中,接收操作指令,通过上层业务分发模块将操作指令发送给共用的响应模块,包括:
45.s301、接收操作指令,调用消息转发接口,将操作指令转发至上层业务分发模块;
46.s302、通过上层业务分发模块将操作指令以及目标特征值发送给共用的响应模块。
47.具体来说,当底层常驻服务收到来自各语音服务器的消息时,根据特征值已经能对应到该指令来自于哪种语音助手,如来自于亚马逊,底层常驻服务则会调用亚马逊的操作指令解析方法,解析出该操作指令的关键字,如关键动作为切换频道,频道名字为cctv1;如解析失败,则提示用户not responding(没有反应)。最后调用底层常驻服务的消息转发接口,转发至上层业务分发模块,然后上层业务分发模块收到来自于底层常驻服务的操作指令时,则会对该指令进行实际的转发或处理,如频道切换,则会处理真正的频道切换。
48.相应的,通过上层业务分发模块将操作指令以及目标特征值发送给共用的响应模块,包括:
49.确定操作指令与响应模块中对应的子模块;
50.通过上层业务分发模块将操作指令以及目标特征值转发给子模块,以使子模块根据目标特征值响应操作指令。
51.具体来说,如图2所示,子模块包括直播应用、信源应用、设置应用、媒体应用以及搜索应用中的一种,其中,各子模块的定义如下所示:
52.livetv(直播应用),指的是电视上观看到的具体节目,如cctv1,深圳卫视等,是由该应用播放出来的;
53.input(信源应用),电视上的信源,如hdmi1,hdmi2,tv等,都是由该应用提供的;
54.settings(设置应用),电视上的设置菜单,如调节背光,调节亮度等,都是由该应用提供的;
55.media(媒体应用),电视上的本地媒体播放,如播放u盘上的mp4文件,由该应用提供;
56.search:(搜索应用),电视上的搜索,如搜索某个视频名字,由该应用提供搜索功能并展示。
57.由此可见,对于如不同的语音助手类产品来说,智能电视所配置的响应模块是一
致的,也就是说,响应模块内的逻辑对于不同的语音助手是一致的,这样可以使得不同的语音助手来共用响应模块,以使得响应模块来处理不同语音助手的控制指令时,达到节约系统资源的目的,同时也利于电视功能的进一步扩展,降低人力成本。例如,以操作指令为频道切换为例,上层业务分发模块在接收到频道切换指令时,将该频道切换指令发送给直播应用子模块,然后由直播应用子模块实现频道的切换。但是,由于不同的语音助手具体的处理流程有可能存在不同,因此子模块在接收到具体的操作指令时,还要确定目标特征值,也就要要知道具体的语音助手,这样子模块才能更准确的执行控制指令。
58.综上,与现有技术相比,本发明实施例具有以下优点:
59.本发明公开了一种语音助手控制方法,方法应用于智能电视,智能电视包括底层常驻服务和上层业务分发模块,方法包括:当接收到语音助手的语音指令时,通过底层常驻服务获取语音助手对应的目标特征值;根据目标特征值将语音指令发给对应的语音服务器,以使得该语音服务器解析出语音指令对应的操作指令;接收操作指令,通过上层业务分发模块将操作指令以及目标特征值发送给共用的响应模块。本发明电视在集成多种语音助手时,可共用响应模块的逻辑资源,这样不仅解决了资源占用大的问题,而且降低了人力成本。
60.基于上述语音助手控制方法,本发明还提供了一种语音助手控制装置,如图3所示,装置包括:
61.获取模块41,用于当接收到语音助手的语音指令时,通过底层常驻服务获取语音助手对应的目标特征值;
62.解析模块42,用于根据目标特征值将语音指令发给对应的语音服务器,以使得语音服务器解析出语音指令对应的操作指令;
63.发送模块43,用于接收操作指令,通过上层业务分发模块将操作指令发送给共用的响应模块。
64.进一步地,装置还包括:
65.预设模块,用于预先为不同语音助手设置对应的特征值;
66.映射模块,用于根据不同语音助手对应的特征值建立语音助手与特征值之间的映射关系。
67.进一步地,获取模块41包括:
68.获取单元,用于通过底层常驻服务根据映射关系获取语音助手对应的目标特征值。
69.进一步地,装置还包括:
70.启动单元,用于当接收到开机广播后,自动启动底层常驻服务;
71.注册单元,用于将底层常驻服务注册为系统核心服务。
72.进一步地,发送模块43包括:
73.转发单元,用于接收操作指令,调用消息转发接口,将操作指令转发至上层业务分发模块;
74.发送单元,用于通过上层业务分发模块将操作指令以及目标特征值发送给共用的响应模块。
75.进一步地,发送单元包括:
76.子模块确定单元,用于确定操作指令与响应模块中对应的子模块;
77.响应模块单元,用于通过上层业务分发模块将操作指令以及目标特征值转发给子模块,以使子模块根据目标特征值响应操作指令。
78.需要说明的是,所属领域的技术人员可以清楚地了解到,上述语音助手控制装置和各模块/单元的具体实现过程,可以参考前述语音助手控制实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
79.上述语音助手控制装置可以实现为一种计算机程序的形式,该计算机程序可以如图4所示的智能电视上运行。
80.基于上述语音助手控制方法,本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有语音助手控制程序,语音助手控制程序被处理器执行,以实现上述实施例的语音助手控制方法中的步骤。
81.基于上述语音助手控制方法,本发明还提供了一种智能电视,如图4所示,其包括至少一个处理器(processor)20;显示屏21;以及存储器(memory)22,还可以包括通信接口(communications interface)23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令,以执行上述实施例中的方法。
82.此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
83.存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
84.存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
85.此外,上述存储介质以及智能电视中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。
86.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1