智能设备的控制方法、装置、电子设备及可读存储介质与流程

文档序号:29457427发布日期:2022-03-30 13:04阅读:78来源:国知局
1.本公开涉及计算机
技术领域
:,尤其涉及物联网技术、智能语音技术、智能家居技术、深度学习等人工智能
技术领域
:。
背景技术
::2.随着物联网和人工智能(artificialintelligence,ai)技术的快速发展,越来越多的智能设备出现在我们日常生活中。在智能家居、大堂迎宾、餐饮送餐等不同智能场景下,智能设备可以通过引入语音识别、语义(对话)理解等ai服务,以不同的物理形态承载一定的语音交互能力。3.通常,需要ai服务的提供商分别与各种智能设备的提供商进行反复沟通,来定义该种智能设备的各种设备操作所对应的语义理解结果,操作复杂,而且容易出错,从而导致了智能设备的语义理解的效率和可靠性。技术实现要素:4.本公开提供了一种智能设备的控制方法、装置、电子设备及可读存储介质。5.根据本公开的一方面,提供了一种智能设备的控制方法,包括:6.对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息;7.根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据;8.根据所述设备操作特征组,对所述智能设备进行控制。9.根据本公开的另一方面,提供了一种智能设备的控制装置,包括:10.语音识别单元,用于对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息;11.语义理解单元,用于根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据;12.操作控制单元,用于根据所述设备操作特征组,对所述智能设备进行控制。13.根据本公开的再一方面,提供了一种电子设备,包括:14.至少一个处理器;以及15.与所述至少一个处理器通信连接的存储器;其中,16.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。17.根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。18.根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。19.由上述技术方案可知,本公开实施例通过对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息,进而,根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据,使得能够根据所述设备操作特征组,对所述智能设备进行控制,操作简单,而且正确率高,从而提高了智能设备的语义理解的效率和可靠性。20.另外,采用本公开所提供的技术方案,能够有效地提高用户的体验。21.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明22.为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。附图用于更好地理解本方案,不构成对本公开的限定。其中:23.图1是根据本公开第一实施例的示意图;24.图2所对应的实施例中所采用的语义理解模型的一框架示意图;25.图3所对应的实施例中所采用的语义理解模型的一框架示意图;26.图4是根据本公开第二实施例的示意图;27.图5是用来实现本公开实施例的智能设备的控制方法的电子设备的框图。具体实施方式28.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。29.显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。30.需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(personaldigitalassistant,pda)、无线手持设备、平板电脑(tabletcomputer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。31.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。32.随着物联网和ai服务的快速发展,越来越多的智能设备出现在我们日常生活中。在智能家居、大堂迎宾、餐饮送餐等不同场景下,智能设备以不同的物理形态承载了一定的语音交互能力。在语音交互技术的背后,需要智能设备的提供商引入语音识别、语义(对话)理解等ai服务。33.然而,对于智能设备的提供商来说,ai服务往往从ai服务的提供商采购,而现有的ai服务的提供商面对智能设备的提供商提出的语义理解技术需求时,在产品初期需要深入了解场景业务,转化成技术需求之后再做大量的定制化开发,其中涉及的人工成本和沟通成本会非常沉重。34.现有语义理解技术在智能设备不同场景应用时,首先需要智能设备的提供商理解ai服务的提供商的数据需求和技术边界;其次需要ai服务的提供商深度理解智能设备的提供商的场景需求,将场景需求转化成ai可解的问题。35.例如,智能家居场景下,智能设备可以有窗帘、灯、电视机、空调等多种智能夹家居设备,其提供商希望用户通过语音就能完成各种设备操作(如打开窗帘、调亮灯、电视调大音量、空调调到20℃等)。现有技术需要以下过程:36.智能设备的提供商与ai服务的提供商沟通场景需求,商讨技术边界问题;37.智能设备的提供商(在ai服务的提供商指导下)根据智能设备的功能集合构建数据集(对话及对应语义结果);38.ai服务的提供商根据数据集定制化设计问题、训练模型,来提供ai服务;39.智能设备的提供商接入ai服务,再进一步将语义理解结果转化为设备语言。40.当切换到另一个智能场景时,ai服务的提供商需要重复上述完整的过程。现有语义理解技术会存在如下的缺陷:41.双方在前期缺乏共同语言,沟通成本大;42.智能设备的提供商需要ai服务的提供商定制化支持,需要付出的费用跟定制化程度成正相关;43.智能设备的提供商需要了解ai知识,有一定的门槛;44.语义理解结果需要二次转化成智能设备的设备语言,才能够对智能设备进行控制,增加了智能设备的提供商开发成本;45.ai服务的提供商对场景的定制化缺乏迁移能力,无法规模化。46.因此,为了有效降低人工成本和沟通成本,亟需提供一种效率和可靠性更高的智能设备的控制方法。47.图1是根据本公开第一实施例的示意图,如图1所示。48.101、对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息。49.102、根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据。50.103、根据所述设备操作特征组,对所述智能设备进行控制。51.至此,针对不同的智能场景,可以直接根据语音识别处理的结果,获得智能设备可识别的该智能场景下的设备操作特征组,以供根据该设备操作特征组,对该智能设备进行控制,只需要智能设备的提供商与ai服务的提供商简单沟通下场景需求,并没有额外的知识负担和开发成本,ai服务的提供商也无需深度理解场景,能够最小化定制化人力成本。52.需要说明的是,101~103的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,例如,网络侧的语义理解平台中的处理引擎或者分布式系统等,本实施例对此不进行特别限定。53.可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。54.其中,作为101~103的执行主体的本地终端可以针对同一智能场景下智能设备的分布架构,对应为不同设备。55.智能设备的分布架构一:多个不同的智能设备分布在同一个智能场景下,由控制设备统一进行控制,此时,作为执行主体的本地终端则可以为该控制设备。56.智能设备的分布架构二:单独的智能设备分布在同一个智能场景下,智能设备对自身进行控制,此时,作为执行主体的本地终端则可以为该智能设备。57.这样,通过对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息,进而,根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据,使得能够根据所述设备操作特征组,对所述智能设备进行控制,操作简单,而且正确率高,从而提高了智能设备的语义理解的效率和可靠性。58.本公开中,通过根据智能设备所属智能场景的共性,将语音识别处理所获得的文本控制信息抽象成该智能设备可识别的多元特征组(即设备操作特征组),进而,直接控制该智能设备进行相应操作,无需再额外对所获得的多元特征组进行二次转换,操作简单,而且正确率高,从而提高了智能设备的语义理解的效率和可靠性。59.本实施例所提供的技术方案,需要在语音唤醒之后或者语音识别场景下执行。60.例如,在获取用户所提供的连续不断的语音之后,如小喵小喵等,对所获取的用户所提供的连续不断的语音,进行特定关键词检测。若在所获取的用户所提供的连续不断的语音中将特定关键词检测出来,则可以执行唤醒操作,以进入语音识别阶段。61.或者,再例如,响应于用户基于应用的特定控件的操作,如语音输入开始控件等,则可以执行唤醒操作,以直接进入语音识别阶段。62.可选地,在本实施例的一个可能的实现方式中,根据目前可能存在的智能场景的特点,例如,智能家居场景、智能交通场景、智能购物场景、智能配送场景等,可以将用户所提供的智能设备的任一语音控制信息的语音识别结果,抽象为四个特征数据,以构成设备操作的四元特征组,即设备操作特征组。63.具体地,所述设备操作特征组可以包括设备特征数据、属性特征数据、动作特征数据和值特征数据。64.这样,通过根据智能设备所属智能场景的共性,将语音识别处理所获得的文本控制信息抽象成该智能设备可识别的四元特征组(即设备特征数据、属性特征数据、动作特征数据和值特征数据),进而,直接控制该智能设备进行相应操作,无需再额外对所获得的多元特征组进行二次转换,操作简单,而且正确率高,从而提高了智能设备的语义理解的效率和可靠性。65.在该实现方式中,在102中,具体可以根据所述文本控制信息,利用所述智能设备所属智能场景所对应的语义理解模型,获得所述智能设备所属智能场景下的设备操作特征组。66.其中,所述语义理解模型以预训练模型为基座,以多任务学习的方式来识别设备特征数据、属性特征数据、动作特征数据和值特征数据,即「设备」-「属性」-「动作」-「值」四元组。67.所述语义理解模型的框架可以如图2所示,所述语义理解模型为基于预训练模型所构建,所述语义理解模型包括设备分类网络、属性分类网络、动作分类网络和值标注网络。68.其中,所采用的所述预训练模型,可以为基于转换器的双向编码器表示(bidirectionalencoderrepresentationfromtransformers,bert)模型、知识增强语义表示(enhancedrepresentationfromknowledgeintegration,ernie)模型等预训练语言模型。69.由于对话理解技术经常遇到数据量少、文本长度短等问题,在这些情况下预训练模型能很好地给所训练的语义理解模型提供基础的语义理解能力,相较于冷启动的语义理解模型会有明显收益。因此,本公开采用了预训练模型作为语义理解模型的基座,使得语义理解模型的任务学习的效果都得到了明显的提高。70.同时,通过采用预训练模型,在此基础上以多任务学习的方式对不同目标进行建模,「设备」-「属性」-「动作」-「值」四元组之间存在一定的关联关系,多任务学习能使得不同的任务共享信息,从而更好地学习。71.在本实现方式中,采用预训练模型,对语音识别处理所获得的文本控制信息进行通用表征,预训练模型所输出的通用表征可以作为各个分类网络和标注网络的输入,由各个分类网络和标注网络对其进行不同处理,以输出对应的特征数据。72.具体地,所采用的所述设备分类网络(deviceclassifiernetwork),可以用于对所述文本控制信息的所述预训练模型的向量表征进行设备特征分类处理,以获得设备特征数据。73.一般情况下,一个智能场景下的智能设备是有限可列举的,例如,智能家居场景下的智能设备可以包括电视、灯、空调、窗帘等设备。假设存在d1种设备,语义理解模型只需要在识别「设备」为d1+1个类别(d1个设备加1个无设备选项)的哪一个,这便是经典的多分类问题。该设备分类网络可以用支持向量机(supportvectormachine,svm)、神经网络等来建模,输入是预训练模型的向量表征,输出是设备特征数据。74.具体地,所采用的所述属性分类网络(propertyclassifiernetwork),可以用于对所述文本控制信息的所述预训练模型的向量表征进行属性特征分类处理,以获得属性特征数据。75.类似地,一个智能场景下的智能设备的设备操作的属性也是有限可列举的,例如,智能家居场景下的智能设备的设备操作的属性可以包括开关、室温、温度等属性。假设存在d2种属性,语义理解模型只需要在识别「属性」为d2+1个类别(d2个属性加1个无属性选项)的哪一个,这便是经典的多分类问题。该属性分类网络可以用支持向量机(supportvectormachine,svm)、神经网络等来建模,输入是预训练模型的向量表征,输出是属性特征数据。76.具体地,所采用的所述动作分类网络(actionclassifiernetwork),可以用于对所述文本控制信息的所述预训练模型的向量表征进行动作特征分类处理,以获得动作特征数据。77.对于智能设备来说,设备操作的动作主要有查询、调到、调高、调低等几种动作,这些「动作」在不同智能设备的不同「属性」下都可能存在共性,因此,动作分类网络器也可以看成是多分类问题。该动作分类网络可以用支持向量机(supportvectormachine,svm)、神经网络等来建模,输入是预训练模型的向量表征,输出是动作特征数据。78.具体地,所采用的所述值标注网络(sequencelabelingnetwork),可以用于对所述文本控制信息的所述预训练模型的向量表征进行值特征标注处理,以获得值特征数据。79.相对来说,智能设备的设备操作的「值」的识别会复杂许多。「值」主要来自于关键词(query,即文本控制信息)的片段,但由于任务特殊性,往往还需要将识别出来的「值」归一化到标准表述,例如,“20度”需要归一化为“20|度”,方便设备端进行处理。其中,由于「值」有多种不同的类型,因此,「值」的识别可以针对不同的类型采用不同的方法。80.例如,「值」类型为整型/浮点型(int/float),可以采用序列标注(sequencelabeling)、片段识别(span-based)等识别方法。81.或者,再例如,「值」类型为布尔型(bool),可以采用二分类、匹配等识别方法。82.或者,再例如,「值」类型为枚举类型(enum),可以采用序列标注(sequencelabeling)、片段识别(span-based)、匹配等识别方法。83.或者,再例如,「值」类型为时间类型(time),可以采用序列标注(sequencelabeling)、片段识别(span-based)等识别方法。84.其中,如果是使用序列标注和片段识别的识别方法,那么,在从文本控制信息中识别出「值」之后,还需要进一步进行归一化处理。常用的归一化手段可以采用但不限于文本相似度(如编辑距离、相同字符比例等)、语义相似度(如字/词向量等)、以及人为映射等方法。85.为了过滤不合理的特征数据,如图3所示,所述语义理解模型还可以进一步包括融合网络,用于对所述设备分类网络所输出的设备特征数、所述属性分类网络所输出的属性特征数据、所述动作分类网络所输出的动作特征数据和所述值标注网络所输出的值特征数据进行融合处理,以验证所述设备操作特征组中各特征数据的合理性。86.具体地,所述语义理解模型通过设备分类网络、属性分类网络、动作分类网络和值标注网络,可以分别获得「设备」-「属性」-「动作」-「值」四元组的初步结果,但是,每个网络所获得的结果可能存在不一致的问题,如设备=“窗帘”、属性=“温度”、动作=“打开”、值=“”(空)时,显然,一个单指令不应该同时出现“窗帘”与“温度”这两个并不具有关联关系的特征数据。为了避免语义理解模型输出这种不一致的结果,在该语义理解模型中还可以进一步引入了融合网络(fusionnetwork),对「设备」-「属性」-「动作」-「值」四元组的初步结果进行融合处理,该融合网络会对四元组进行二次检查,输出一个更加符合客观事实的四元组。87.这样,通过融合网络对各个分类网络和标注网络所输出的设备操作特征数据,进行融合学习处理,以验证所述设备操作特征组中各特征数据的合理性,使得能够过滤掉不合理的特征数据,从而能够有效提高智能设备的语义理解的可靠性。88.可选地,在本实施例的一个可能的实现方式中,在103中,根据所述设备操作特征组,对所述智能设备进行控制的具体执行操作,针对同一智能场景下智能设备的分布架构,执行不同操作。89.智能设备的分布架构一:多个不同的智能设备分布在同一个智能场景下,由控制设备统一进行控制。90.在这个分布架构中,具体可以根据所述设备操作特征组中第一设备操作特征数据,确定所述智能设备,进而,向所述智能设备发送所述设备操作特征组中第二设备操作特征数据,以供所述智能设备根据所述第二设备操作特征数据,执行操作。91.智能设备的分布架构二:单独的智能设备分布在同一个智能场景下,智能设备对自身进行控制。92.在这个分布架构中,具体可以根据所述设备操作特征组中设备操作特征数据,控制所述智能设备执行操作。93.这样,无需对所获得的所述设备操作特征组中各设备操作特征数据进行额外的二次转换处理,智能设备就能够直接识别所述设备操作特征组中的各设备操作特征数据,从而能够有效提高智能设备的语义理解的效率和可靠性。94.以智能空调作为举例,详细说明本公开所提供的技术方案的实现过程。通常,可以根据智能空调所属的智能家居场景的场景共性,将用户所提供的用于控制智能空调的语义理解问题抽象成「设备」-「属性」-「动作」-「值」四元组的语义理解结果。举个例子:智能空调所属的智能家居场景的「设备」-「属性」-「动作」-「值」四元组中,各设备操作特征数据的取值可以采用如下定义:95.「设备」的取值可以包括:空调;96.「属性」的取值可以包括:开关、室温、温度;97.「动作」的取值可以包括:打开/关闭、查询、调高/调低/调到;98.「值」的取值类型包括:无、整型。99.例如,「设备」-「属性」-「动作」-「值」四元组的一种定义可以为:空调-开关-打开/关闭-空;100.或者,再例如:「设备」-「属性」-「动作」-「值」四元组的另一种定义可以为:空调-室温-查询-取值(整型);101.或者,再例如:「设备」-「属性」-「动作」-「值」四元组的另一种定义可以为:空调-温度-调高/调低/调到-取值(整型)。102.那么,语音控制信息经过语音识别处理之后的语音识别结果:“空调调到20度”;103.「设备」:“空调”;104.「属性」:“温度”;105.「动作」:“调节到”;106.「值」:“20度”。107.不论是智能设备的技术开发者还是产品经理都能轻易地使用该四元组来定义智能设备的功能,在这种「设备」-「属性」-「动作」-「值」四元组的范式下,智能设备的提供商仅需要根据产品功能来定义「设备」-「属性」-「动作」-「值」四元组,同时,ai服务的提供商只需要针对该范式构建语义理解模型,即能识别「设备」-「属性」-「动作」-「值」四元组的语义理解模型。这样就不存在需要智能设备的提供商与ai服务的提供商之间的反复沟通的问题了,也不存在需要额外对语义理解结果进行二次转换的过程了。108.采用本公开所提供的技术方案,可以有如下有益效果:109.智能设备的提供商只需要描述场景需求,没有额外的知识负担和开发成本;110.ai服务的提供商不需要深度理解场景,最小化定制化人力成本;111.ai服务的提供商可以专心打磨通用对话理解技术,提高自身技术壁垒;以及112.场景适配能力强,缩短智能场景的整体交付周期。113.本实施例中,通过对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息,进而,根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据,使得能够根据所述设备操作特征组,对所述智能设备进行控制,操作简单,而且正确率高,从而提高了智能设备的语义理解的效率和可靠性。114.另外,采用本公开所提供的技术方案,能够有效地提高用户的体验。115.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本公开所必须的。116.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。117.图4是根据本公开第二实施例的示意图,如图4所示。本实施例的智能设备的控制装置400可以包括语音识别单元401、语义理解单元402和操作控制单元403。其中,语音识别单元401,用于对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息;语义理解单元402,用于根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据;操作控制单元403,用于根据所述设备操作特征组,对所述智能设备进行控制。118.需要说明的是,本实施例的智能设备的控制装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,例如,网络侧的语义理解平台中的处理引擎或者分布式系统等,本实施例对此不进行特别限定。119.可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。120.其中,作为智能设备的控制装置的本地终端可以针对同一智能场景下智能设备的分布架构,对应为不同设备。121.智能设备的分布架构一:多个不同的智能设备分布在同一个智能场景下,由控制设备统一进行控制,此时,作为智能设备的控制装置的本地终端则可以为该控制设备。122.智能设备的分布架构二:单独的智能设备分布在同一个智能场景下,智能设备对自身进行控制,此时,作为智能设备的控制装置的本地终端则可以为该智能设备。123.可选地,在本实施例的一个可能的实现方式中,所述设备操作特征组包括设备特征数据、属性特征数据、动作特征数据和值特征数据。124.在一个具体的实现过程中,所述语义理解单元402,具体可以用于根据所述文本控制信息,利用所述智能设备所属智能场景所对应的语义理解模型,获得所述智能设备所属智能场景下的设备操作特征组。其中,所述语义理解模型为基于预训练模型所构建;所述语义理解模型可以包括设备分类网络、属性分类网络、动作分类网络和值标注网络;其中,125.所述设备分类网络,可以用于对所述文本控制信息的所述预训练模型的向量表征进行设备特征分类处理,以获得设备特征数据;126.所述属性分类网络,可以用于对所述文本控制信息的所述预训练模型的向量表征进行属性特征分类处理,以获得属性特征数据;127.所述动作分类网络,可以用于对所述文本控制信息的所述预训练模型的向量表征进行动作特征分类处理,以获得动作特征数据;以及128.所述值标注网络,用于对所述文本控制信息的所述预训练模型的向量表征进行值特征标注处理,以获得值特征数据。129.在另一个具体的实现过程中,所述语义理解模型还可以进一步包括融合网络,可以用于对所述设备分类网络所输出的设备特征数、所述属性分类网络所输出的属性特征数据、所述动作分类网络所输出的动作特征数据和所述值标注网络所输出的值特征数据进行融合处理,以验证所述设备操作特征组中各特征数据的合理性。130.可选地,在本实施例的一个可能的实现方式中,所述操作控制单元403,具体可以用于根据所述设备操作特征组中第一设备操作特征数据,确定所述智能设备;向所述智能设备发送所述设备操作特征组中第二设备操作特征数据,以供所述智能设备根据所述第二设备操作特征数据,执行操作;或者根据所述设备操作特征组中设备操作特征数据,控制所述智能设备执行操作。131.需要说明的是,图1对应的实施例中方法,可以由本实施例提供的智能设备的控制装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。132.本实施例中,通过语音识别单元对用户所提供的智能设备的语音控制信息进行语音识别处理,以获得所述智能设备的文本控制信息,进而,由语义理解单元根据所述文本控制信息,获得所述智能设备所属智能场景下的设备操作特征组,所述设备操作特征组包括至少两个设备操作特征数据,使得操作控制单元能够根据所述设备操作特征组,对所述智能设备进行控制,操作简单,而且正确率高,从而提高了智能设备的语义理解的效率和可靠性。133.另外,采用本公开所提供的技术方案,能够有效地提高用户的体验。134.本公开的技术方案中,所涉及的用户语音信息的获取、存储和应用等,例如,语音控制信息等,均符合相关法律法规的规定,且不违背公序良俗。135.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。136.图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。137.如图5所示,电子设备500包括计算单元501,其可以根据存储在只读存储器(rom)502中的计算机程序或者从存储单元508加载到随机访问存储器(ram)503中的计算机程序,来执行各种适当的动作和处理。在ram503中,还可存储电子设备500操作所需的各种程序和数据。计算单元501、rom502以及ram503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。138.电子设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许电子设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。139.计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如智能设备的控制方法。例如,在一些实施例中,智能设备的控制方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom502和/或通信单元509而被载入和/或安装到电子设备500上。当计算机程序加载到ram503并由计算单元501执行时,可以执行上文描述的智能设备的控制方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行智能设备的控制方法。140.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。141.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。142.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。143.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。144.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网和区块链网络。145.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtualprivateserver",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。146.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。147.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1