基于情绪的终端控制方法、装置及终端与流程

文档序号:11157679阅读:290来源:国知局
基于情绪的终端控制方法、装置及终端与制造工艺

本发明涉及智能控制技术领域,尤其涉及一种基于情绪的终端控制方法、装置及终端。



背景技术:

随着技术发展,现有的智能终端可以使用多种方式进行控制,例如智能电视可以采用手势、语音等进行控制。

现有技术中,手势识别是指用户面对电视图像采集设备做出指定手势动作,以触发相关操作来控制电视。语音控制是指通过电视盒或遥控器麦克风收音,经过语音识别理解用户指令的准确目的,并发送控制信号至电视。

但是,手势和语音控制是基于用户操作对终端进行控制。用户在选择节目时,如何对用户意图进行分析,并准确化地推荐节目是一个亟待解决的问题。



技术实现要素:

本发明解决的技术问题是如何实现对用户意图进行分析,并准确化地推荐节目。

为解决上述技术问题,本发明实施例提供一种基于情绪的终端控制方法,基于情绪的终端控制方法包括:

对接收到的语音数据进行语音识别处理,以得到语音识别结果;基于语音识别结果和预设情绪词库确定第一情绪结果;至少根据所述第一情绪结果确定用户情绪,并推送与所述用户情绪关联的播放内容。

可选的,所述基于语音识别结果和预设情绪词库确定第一情绪结果包括:

对所述语音识别结果进行关键词提取处理,以得到关键词;将所述关键词与所述预设情绪词库中各个情绪类别的情绪得分词库进行匹配,以根据匹配结果确定所述语音识别结果针对各个情绪类别的情绪得分,其中,所述关键词与所述情绪得分词库的匹配度越高,所述情绪得分越高;确定所述情绪得分最高的情绪类别为所述第一情绪结果。

可选的,所述推送与所述用户情绪关联的播放内容包括:根据所述第一情绪结果对应的所述情绪类别推送所述播放内容,所述播放内容与所述情绪类别一一对应。

可选的,所述终端控制方法还包括:对接收到的面部图像进行面部识别,以确定第二情绪结果。

可选的,所述对接收到的面部图像进行面部识别包括:将所述面部图像与预设图像进行匹配,以确定所述面部图像针对各个情绪类别的情绪得分;确定所述情绪得分最高的所述情绪类别为所述第二情绪结果。

可选的,所述推送与所述用户情绪关联的播放内容包括:根据所述第一情绪结果和所述第二情绪结果推送相应的播放内容。

可选的,所述推送与所述用户情绪关联的播放内容包括:所述第一情绪结果为有情绪时,根据所述第一情绪结果对应的所述情绪类别推送所述播放内容;所述第一情绪结果为无情绪时,根据所述第二情绪结果对应的所述情绪类别推送所述播放内容。

可选的,所述推送与所述用户情绪关联的播放内容包括:所述第一情绪结果和所述第二情绪结果对应的所述情绪类别一致时,根据所述情绪类别推送所述播放内容;所述第一情绪结果和所述第二情绪结果对应的所述情绪类别不一致时,以所述情绪得分最高的所述情绪类别推送所述播放内容;所述第一情绪结果为无情绪时,以所述第二情绪结果对应的所述情绪类别推送所述播放内容。

可选的,采用以下一种或多种方式推送所述播放内容:发送对话框提示是否播放所述播放内容、发送语音提示是否播放所述播放内容。

可选的,所述终端控制方法还包括:基于所述语音识别结果和预设指令库匹配得到第一控制指令;根据所述第一控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。

可选的,所述终端控制方法还包括:对接收到的手势动作数据与预设动作库匹配得到第二控制指令;根据所述第二控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。

为解决上述技术问题,本发明实施例还提供了一种基于情绪的终端控制装置,基于情绪的终端控制装置包括:

语音识别单元,用于对接收到的语音数据进行语音识别处理,以得到语音识别结果;第一情绪结果确定单元,用于基于语音识别结果和预设情绪词库确定第一情绪结果;推送单元,用于至少根据所述第一情绪结果确定用户情绪,并推送与所述用户情绪关联的播放内容。

可选的,所述第一情绪结果确定单元包括:

关键词提取子单元,用于对所述语音识别结果进行关键词提取处理,以得到关键词;第一匹配子单元,用于将所述关键词与所述预设情绪词库中各个情绪类别的情绪得分词库进行匹配,以根据匹配结果确定所述语音识别结果针对各个情绪类别的情绪得分,其中,所述关键词与所述情绪得分词库的匹配度越高,所述情绪得分越高,所述预设情绪词库用于存储情绪类别对应的所述情绪词库;第一确定子单元,用于确定所述情绪得分最高的情绪类别为所述第一情绪结果。

可选的,所述推送单元根据所述第一情绪结果对应的所述情绪类别推送所述播放内容,所述播放内容与所述情绪类别一一对应。

可选的,所述终端控制装置还包括:面部识别单元,用于对接收到的面部图像进行面部识别,以确定第二情绪结果。

可选的,所述面部识别单元包括:第二匹配子单元,用于将所述面部图像与预设图像进行匹配,以确定所述面部图像针对各个情绪类别的情绪得分;第二确定子单元,用于确定所述情绪得分最高的所述情绪类别为所述第二情绪结果。

可选的,所述推送单元根据所述第一情绪结果和所述第二情绪结果推送相应的播放内容。

可选的,所述推送单元包括:第一推送子单元,用于在所述第一情绪结果为有情绪时,根据所述第一情绪结果对应的所述情绪类别推送所述播放内容;第二推送子单元,用于在所述第一情绪结果为无情绪时,根据所述第二情绪结果对应的所述情绪类别推送所述播放内容。

可选的,所述推送单元包括:第三推送子单元,用于所述第一情绪结果和所述第二情绪结果对应的所述情绪类别一致时,根据所述情绪类别推送所述播放内容;第四推送子单元,用于所述第一情绪结果和所述第二情绪结果对应的所述情绪类别不一致时,以所述情绪得分最高的所述情绪类别推送所述播放内容;第五推送子单元,用于所述第一情绪结果为无情绪时,以所述第二情绪结果对应的所述情绪类别推送所述播放内容。

可选的,所述推送单元采用以下一种或多种方式推送所述播放内容:发送对话框提示是否播放所述播放内容、发送语音提示是否播放所述播放内容。

可选的,所述终端控制装置还包括:第一匹配单元,用于基于所述语音识别结果和预设指令库匹配得到第一控制指令,所述预设指令库用于存储所述第一控制指令,所述第一控制指令包括至少一个词;第一控制单元,用于根据所述第一控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。

可选的,所述终端控制装置还包括:第二匹配单元,用于对接收到的手势动作数据与预设动作库匹配得到第二控制指令,所述预设动作库用于存储所述手势动作对应的第二控制指令;第二控制单元,用于根据所述第二控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。

为解决上述技术问题,本发明实施例还提供了一种终端,所述终端包括所述基于情绪的终端控制装置。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

本发明技术方案对接收到的语音数据进行语音识别处理,以得到语音识别结果;基于语音识别结果和预设情绪词库确定第一情绪结果;至少根据所述第一情绪结果确定用户情绪,并推送与所述用户情绪关联的播放内容。本发明技术方案通过对用户的语音数据进行识别以及与预设情绪词库进行匹配,可以确定语音数据对应的第一情绪结果,进而可以确定用户在发送语音数据时的用户情绪;然后根据用户情绪为用户推送与用户情绪关联的播放内容,以使得终端的播放内容与用户情绪相适配,实现了终端根据用户情绪自动推送节目的技术效果;也就是说,通过对用户情绪进行判断,来确定用户意图是需要与用户情绪相适应的播放内容,进而使得终端更加智能化和人性化,提高用户体验。

进一步,对所述语音识别结果进行关键词提取处理,以得到关键词;将所述关键词与所述预设情绪词库中各个情绪类别的情绪得分词库进行匹配,以根据匹配结果确定所述语音识别结果针对各个情绪类别的情绪得分,其中,所述关键词与所述情绪得分词库的匹配度越高,所述情绪得分越高;确定所述情绪得分最高的情绪类别为所述第一情绪结果。本发明技术方案通过对用户的语音识别结果进行关键词提取处理,并根据关键词和预设情绪词库中的词进行比较,确定情绪得分最高的情绪类别为用户的情绪;也就是从语音数据的语义层面实现对用户情绪的判断,保证了对播放内容推送的准确性。

进一步,对接收到的面部图像进行面部识别,以确定第二情绪结果;根据所述第一情绪结果和所述第二情绪结果推送相应的播放内容。本发明技术方案通过将用户语音数据中判断出的情绪与用户面部判断出的情绪结合,综合判断出用户当前的情绪,提高了对用户情绪判断的准确性,从而提高了播放内容推送的准确性,进一步提高终端的智能化程度和人性化程度。

附图说明

图1是本发明实施例一种基于情绪的终端控制方法的流程图;

图2是图1所示的步骤S102的一种具体实施的流程图;

图3是本发明实施例另一种基于情绪的终端控制方法的流程图;

图4是图3所示的步骤S305的一种具体实施的流程图;

图5是图3所示的步骤S305的另一种具体实施的流程图;

图6是本发明实施例一种基于情绪的终端控制装置的结构示意图;

图7是图6所示第一情绪结果确定单元602的结构示意图;

图8是本发明实施例另一种基于情绪的终端控制装置的结构示意图。

具体实施方式

如背景技术中所述,现有技术的手势和语音控制是基于用户操作对终端进行控制。用户在选择节目时,如何对用户意图进行分析,并准确化的推荐节目是一个亟待解决的问题。

本申请发明人创造性的提出,至少基于用户的语音数据来判断用户在说话时的情绪,进而利用该情绪为用户推送节目,实现了对用户意图的分析以及分析的准确性。

本发明实施例通过对用户的语音数据进行识别以及与预设情绪词库进行匹配,可以确定语音数据对应的第一情绪结果,进而可以确定用户在发送语音数据时的用户情绪;然后根据用户情绪为用户推送与用户情绪关联的播放内容,以使得终端的播放内容与用户情绪相适配,实现了终端根据用户情绪自动推送节目的技术效果;也就是说,通过对用户情绪进行判断,来确定用户意图是需要与用户情绪相适应的播放内容,进而使得终端更加智能化和人性化,提高用户体验。

为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

图1是本发明实施例一种基于情绪的终端控制方法的流程图。

图1所示的基于情绪的终端控制方法可以包括以下步骤:

步骤S101:对接收到的语音数据进行语音识别处理,以得到语音识别结果;

步骤S102:基于语音识别结果和预设情绪词库确定第一情绪结果;

步骤S103:至少根据所述第一情绪结果确定用户情绪,并推送与所述用户情绪关联的播放内容。

具体实施中,在步骤S101中,可以将语音格式的语音数据转换为文本格式的语音识别结果,以便于进行后续的处理。本领域技术人员应当理解的是,可以采用任意可实施的方式实现对语音数据的语音识别处理,本发明实施例对此不做限制。

具体实施中,预设情绪词库可以是预先配置的。所述预设情绪词库可以存储多种情绪对应的词。在步骤S102中,将语音识别结果和预设情绪词库中的词进行匹配,并将匹配到的词对应的情绪作为第一情绪结果。也就是说,第一情绪结果可以表征语音数据所承载的用户的情绪。

进而在步骤S103中,至少根据所述第一情绪结果确定用户情绪。也就是说,可以将语音数据所承载的用户的情绪确定为用户情绪,也可以将语音数据所承载的用户的情绪与其他任意可实施的方式判断出的用户的情绪相结合,来确定用户情绪。在用户情绪确定之后,可以根据用户情绪推送与所述用户情绪关联的播放内容。例如,在用户情绪为开心时,推送的播放内容可以是喜剧、爱情剧;在用户情绪为难过时,推送的播放内容可以是喜剧、治愈系节目;在用户情绪为害怕时,推送的播放内容可以是喜剧、综艺节目等。

本发明实施例通过对用户的语音数据进行识别以及与预设情绪词库进行匹配,可以确定语音数据对应的第一情绪结果,进而可以确定用户在发送语音数据时的用户情绪;然后根据用户情绪为用户推送与用户情绪关联的播放内容,以使得终端的播放内容与用户情绪相适配,实现了终端根据用户情绪自动推送节目的技术效果;也就是说,通过对用户情绪进行判断,来确定用户意图是需要与用户情绪相适应的播放内容,进而使得终端更加智能化和人性化,提高用户体验。

优选地,在步骤S103中,可以发送对话框提示是否播放所述播放内容、或者,可以发送语音提示是否播放所述播放内容。具体而言,用户可以通过对终端进行选择操作,确定是否播放所述播放内容。例如,可以通过手势识别的方式进行选择;也可以通过语音控制的方式进行选择。

优选地,图1所示的基于情绪的终端控制方法还可以包括:基于所述语音识别结果和预设指令库匹配得到第一控制指令;根据所述第一控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。本实施例中,由于在用户的语音数据中还可以包括对终端的控制指令,因此还可以对语音识别结果做进一步的处理。具体而言,将语音识别结果和预设指令库进行匹配,并在匹配得到第一控制指令后,根据第一控制指令控制终端,所述终端可以响应于第一控制指令执行相应的操作。例如,切换频道、调节音量等。

可以理解的是,预设指令库可以是预先配置的;终端执行相应的操作限于预设指令库中第一控制指令指向的操作。

优选地,图1所示的基于情绪的终端控制方法可以包括:对接收到的手势动作数据与预设动作库匹配得到第二控制指令;根据所述第二控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。本实施例中,还可以对用户的手势动作进行检测,并在检测到手势动作后对其做进一步的处理,以确定是否对终端有进一步的控制。具体而言,将手势动作和预设动作库进行匹配,当手势动作与预设动作库中的动作相匹配时,确定该动作对应的第二控制指令;根据第二控制指令控制终端,所述终端可以响应于第二控制指令执行相应的操作。例如,切换频道、调节音量等。

可以理解的是,预设动作库可以是预先配置的;终端执行相应的操作限于预设动作库中动作对应的第二控制指令指向的操作。

优选地,步骤S102的一种实施方式可参照图2,图2是图1所示的步骤S102的一种具体实施的流程图。

步骤S102可以包括以下步骤:

步骤S201:对所述语音识别结果进行关键词提取处理,以得到关键词;

步骤S202:将所述关键词与所述预设情绪词库中各个情绪类别的情绪得分词库进行匹配,以根据匹配结果确定所述语音识别结果针对各个情绪类别的情绪得分;

步骤S203:确定所述情绪得分最高的情绪类别为所述第一情绪结果。

具体实施中,在步骤S201中,对语音识别结果进行关键词提取,得到语音识别结果的关键词。具体而言,语音识别结果的关键词可以用于表征语音数据的语义,那么可以根据关键词来对语音数据所承载的用户的情绪进行判定。

具体实施中,所述预设情绪词库可以存储多个情绪类别,以及各个情绪类别对应的情绪得分词库。具体而言,每一情绪类别可以表示一种情绪;每一情绪类别可以有多个情绪得分,情绪得分越高表示越接近该情绪类别。每一情绪类别的情绪得分词库可以存储该情绪类别的多个情绪得分对应的词。那么在步骤S202中,可以将语音识别结果的关键词与各个情绪类别的情绪得分词库中的词进行匹配,并根据匹配到的词确定语音识别结果针对各个情绪类别的情绪得分。其中,所述关键词与所述情绪得分词库的匹配度越高,所述情绪得分越高。

具体地,可以将将语音识别结果与预设情绪词库中所有情绪类别对应的情绪得分词库进行匹配,并得到语音识别结果针对所有情绪类别的情绪得分。例如,语音识别结果确定的情绪得分为:“难过”十分、“厌恶”六分、“惊讶”两分、“生气”一分、“开心”零分。

具体实施中,在确定所述语音识别结果针对各个情绪类别的情绪得分后,由于情绪得分越高表示关键词越接近情绪得分对应的情绪类别,因此在步骤S203中,确定所述情绪得分最高的情绪类别为所述第一情绪结果。

例如,用户输入“别啰嗦我就是想找部喜剧片而已”,可以得到关键词为“啰嗦”和“喜剧片”;经过与各个情绪类别的情绪得分词库中的词匹配后,判定用户“生气”两分,“开心”一分,那么可以判定第一情绪结果为“生气”。可以理解的是,如果在步骤S202中,语音识别结果针对各个情绪类别的情绪得分均为零,或者无法得到语音识别结果针对各个情绪类别的情绪得分的情况下,则将第一情绪结果判定为无情绪。

继续参照图1,在步骤S103中,则可以根据步骤S203的判断结果进行播放内容的推送,也即根据所述第一情绪结果对应的所述情绪类别推送所述播放内容。其中,所述播放内容可以与所述情绪类别一一对应。例如,在用户情绪为开心时,推送的播放内容可以是爱情剧;在用户情绪为难过时,推送的播放内容可以是喜剧;在用户情绪为害怕时,推送的播放内容可以是综艺节目等。

需要说明的是,播放内容与情绪类别的对应关系可以根据实际的应用环境进行适应性的自定义配置,本发明实施例对此不做限制。

可以理解的是,与所述用户情绪关联的播放内容可以为带有与情绪类型关联的内容标签的播放内容,每个情绪类型关联至少一个内容标签,每个播放内容都带有至少一个内容标签,推送的内容应为带有与第一情绪结果关联的内容标签的播放内容。例如,在用户情绪为开心时,推送的播放内容可以是带有喜剧、爱情剧等内容标签的播放内容;在用户情绪为难过时,推送的播放内容可以是喜剧、治愈系节目等内容标签的播放内容;在用户情绪为害怕时,推送的播放内容可以是带有喜剧、综艺节目等内容标签的播放内容。如果有多个与用户情绪关联的播放内容可被推送,则随机选取一个播放,或根据实际的应用环境进行适应性的自定义配置选取一个播放,或全部推送供用户选择播放等等,本发明实施例对此不做限制。

本发明实施例通过对用户的语音识别结果进行关键词提取处理,并根据关键词和预设情绪词库中的词进行比较,确定情绪得分最高的情绪类别为用户的情绪;也就是从语音数据的语义层面实现对用户情绪的判断,保证了对播放内容推送的准确性。

图3是本发明实施例另一种基于情绪的终端控制方法的流程图。

本实施例中,可以预先对用户的面部图像进行采集,以用于面部情绪的判断。在确定第一情绪结果之后,还可以对接收到的面部图像进行面部识别,以确定第二情绪结果。

具体实施中,图3所示的基于情绪的终端控制方法可以包括以下步骤:

步骤S301:对接收到的语音数据进行语音识别处理,以得到语音识别结果;

步骤S302:基于语音识别结果和预设情绪词库确定第一情绪结果;

步骤S303:将所述面部图像与预设图像进行匹配,以确定所述面部图像针对各个情绪类别的情绪得分;

步骤S304:确定所述情绪得分最高的所述情绪类别为所述第二情绪结果;

步骤S305:根据所述第一情绪结果和所述第二情绪结果推送相应的播放内容。

本实施例中步骤S301和步骤S302的具体实施方式可参照图1所示实施例的步骤S101和步骤S102,此处不再赘述。

具体实施中,面部图像可以包括用户的面部,那么可以包括用户的面部表情,面部表情可以表征用户的情绪。具体而言,用户的情绪不同时,其对应的用户图像不同。在步骤S303之前,可以预先设置预设图像,每一预设图像可以表征一种情绪类别,每一情绪类别可以表征一种用户的情绪。那么在执行步骤S303时,则可以将面部图像与预设图像进行匹配,根据面部图像与预设图像的匹配度可以确定面部图像针对各个情绪类别的情绪得分。也就是说,面部图像与预设图像的匹配度越高,面部图像针对预设图像对应的情绪类别的情绪得分越高;面部图像的情绪得分越高,表明面部图像所承载的情绪越接近该情绪得分对应的情绪类别。

进而在步骤S304中,可以将情绪得分最高的所述情绪类别为所述第二情绪结果。也就是说,第二情绪结果表示根据用户的面部图像判断出的情绪。

例如,用户做了皱眉的表情,将面部图像与预设图像匹配后,可以判定用户“难过”两分,“伤心”一分,那么可以判定第二情绪结果为“难过”。

可以理解的是,如果在步骤S303中,面部图像针对各个情绪类别的情绪得分均为零,或者无法得到面部图像针对各个情绪类别的情绪得分的情况下,则将第二情绪结果判定为无情绪。

具体实施中,在步骤S305中,根据所述第一情绪结果和所述第二情绪结果推送相应的播放内容。与图1所示的步骤S103相比,本步骤通过将第一情绪结果和所述第二情绪结果相结合来向用户推送节目。本发明实施例通过将用户语音数据中判断出的情绪与用户面部判断出的情绪结合,综合判断出用户当前的情绪,提高了对用户情绪判断的准确性,从而提高了播放内容推送的准确性,进一步提高终端的智能化和人性化。

优选地,在步骤S305中,可以发送对话框提示是否播放所述播放内容、或者,可以发送语音提示是否播放所述播放内容。具体而言,用户可以通过对终端进行选择操作,确定是否播放所述播放内容。例如,可以通过手势识别的方式进行选择;也可以通过语音控制的方式进行选择。

优选地,步骤S305的一种实施方式可参照图4,图4是图3所示的步骤S305的一种具体实施的流程图。

步骤S305可以包括以下步骤:

步骤S401:所述第一情绪结果为有情绪时,根据所述第一情绪结果对应的所述情绪类别推送所述播放内容;

步骤S402:所述第一情绪结果为无情绪时,根据所述第二情绪结果对应的所述情绪类别推送所述播放内容。

本实施例中,第一情绪结果可以表示根据用户语音数据判断出的情绪;第二情绪结果可以表示根据用户面部判断出的情绪。考虑到确定第二情绪结果时,与情绪类别完全对应的预设图像的获取和配置难度大,影响第二情绪结果判断的准确性。故本实施例在将将第一情绪结果与第二情绪结果结合时,优先考虑第一情绪结果。

具体实施中,在步骤S401和步骤S402中,如果第一情绪结果为有情绪,那么可以将所述第一情绪结果对应的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容;如果第一情绪结果为无情绪,那么可以将所述第二情绪结果对应的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容。

本发明实施例提供了一种将第一情绪结果和所述第二情绪结果结合推送播放内容时的一种实施方式,通过第一情绪结果优先的方式,保证用户情绪判断的准确性;并在第一情绪结果为无情绪时,保证依然有用户情绪的判定结果,并推送播放内容,进一步提高终端的智能化程度和人性化程度。

优选地,步骤S305的另一种实施方式可参照图5,图5是图3所示的步骤S305的另一种具体实施的流程图。

步骤S305可以包括以下步骤:

步骤S501:所述第一情绪结果和所述第二情绪结果对应的所述情绪类别一致时,根据所述情绪类别推送所述播放内容;

步骤S502:所述第一情绪结果和所述第二情绪结果对应的所述情绪类别不一致时,以所述情绪得分最高的所述情绪类别推送所述播放内容;

步骤S503:所述第一情绪结果为无情绪时,以所述第二情绪结果对应的所述情绪类别推送所述播放内容。

本实施例中,第一情绪结果可以表示根据用户语音数据判断出的情绪;第二情绪结果可以表示根据用户面部判断出的情绪。由于在得到第一情绪结果和第二情绪结果时,第一情绪结果和第二情绪结果均是根据情绪得分确定的,因此,本实施例在将第一情绪结果与第二情绪结果结合时,可以根据情绪得分的高低来确定最终的用户情绪。

具体实施中,在步骤S501和步骤S502中,如果第一情绪结果和所述第二情绪结果对应的所述情绪类别一致,则可以将该情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容;如果第一情绪结果和所述第二情绪结果对应的所述情绪类别不一致,则将情绪得分最高的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容。

具体实施中,由于第一情绪结果是根据语音识别结果的关键词和预设情绪词库匹配得到的,因此在不能在预设情绪词库匹配得到所述关键词时,第一情绪结果为无情绪。而第二情绪结果是根据面部图像和预设图像匹配得到的,通常不会出现无情绪的状况。故在步骤S503中,在第一情绪结果为无情绪时,可以将第二情绪结果对应的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容。

本发明实施例提供了另一种将第一情绪结果和所述第二情绪结果结合推送播放内容时的一种实施方式,通过情绪得分的高低来确定最终的用户情绪,保证了用户情绪判断的准确性;并在第一情绪结果为无情绪时,保证依然有用户情绪的判定结果,并推送播放内容,进一步提高终端的智能化程度和人性化程度。

图6是本发明实施例一种基于情绪的终端控制装置的结构示意图。

图6所示的基于情绪的终端控制装置60可以包括语音识别单元601、第一情绪结果确定单元602和推送单元603。

其中,语音识别单元601用于对接收到的语音数据进行语音识别处理,以得到语音识别结果;第一情绪结果确定单元602用于基于语音识别结果和预设情绪词库确定第一情绪结果;推送单元603用于至少根据所述第一情绪结果确定用户情绪,并推送与所述用户情绪关联的播放内容。

具体实施中,语音识别单元601可以将语音格式的语音数据转换为文本格式的语音识别结果,以便于进行后续的处理。本领域技术人员应当理解的是,可以采用任意可实施的方式实现对语音数据的语音识别处理,本发明实施例对此不做限制。

具体实施中,预设情绪词库可以是预先配置的。所述预设情绪词库可以存储多种情绪对应的词。第一情绪结果确定单元602可以将语音识别结果和预设情绪词库中的词进行匹配,并将匹配到的词对应的情绪作为第一情绪结果。也就是说,第一情绪结果可以表征语音数据所承载的用户的情绪。

推送单元603进而可以至少根据所述第一情绪结果确定用户情绪。也就是说,可以将语音数据所承载的用户的情绪确定为用户情绪,也可以将语音数据所承载的用户的情绪与其他任意可实施的方式判断出的用户的情绪相结合,来确定用户情绪。在用户情绪确定之后,可以根据用户情绪推送与所述用户情绪关联的播放内容。例如,在用户情绪为开心时,推送的播放内容可以是喜剧、爱情剧;在用户情绪为难过时,推送的播放内容可以是喜剧、治愈系节目;在用户情绪为害怕时,推送的播放内容可以是喜剧、综艺节目等。

本发明实施例通过对用户的语音数据进行识别以及与预设情绪词库进行匹配,可以确定语音数据对应的第一情绪结果,进而可以确定用户在发送语音数据时的用户情绪;然后根据用户情绪为用户推送与用户情绪关联的播放内容,以使得终端的播放内容与用户情绪相适配,实现了终端根据用户情绪自动推送节目的技术效果;也就是说,通过对用户情绪进行判断,来确定用户意图是需要与用户情绪相适应的播放内容,进而使得终端更加智能化和人性化,提高用户体验。

优选地,推送单元603可以发送对话框提示是否播放所述播放内容、或者,可以发送语音提示是否播放所述播放内容。具体而言,用户可以通过对终端进行选择操作,确定是否播放所述播放内容。例如,可以通过手势识别的方式进行选择;也可以通过语音控制的方式进行选择。

优选地,图6所示的于情绪的终端控制装置60还可以包括第一匹配单元(图未示)和第一控制单元(图未示)。第一匹配单元可以基于所述语音识别结果和预设指令库匹配得到第一控制指令;第一控制单元可以根据所述第一控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。本实施例中,由于在用户的语音数据中还可以包括对终端的控制指令,因此还可以对语音识别结果做进一步的处理。具体而言,第一匹配单元将语音识别结果和预设指令库进行匹配,并在匹配得到第一控制指令后,第一控制单元根据第一控制指令控制终端,所述终端可以响应于第一控制指令执行相应的操作。例如,切换频道、调节音量等。

可以理解的是,预设指令库可以是预先配置的;终端执行相应的操作限于预设指令库中第一控制指令指向的操作。

优选地,图6所示的于情绪的终端控制装置60还可以包括第二匹配单元(图未示)和第二控制单元(图未示)。第二匹配单元对接收到的手势动作数据与预设动作库匹配得到第二控制指令;第二控制单元根据所述第二控制指令控制终端执行相应的操作,所述相应的操作不包括推送播放内容。本实施例中,还可以对用户的手势动作进行检测,并在检测到手势动作后对其做进一步的处理,以确定是否对终端有进一步的控制。具体而言,第二匹配单元将手势动作和预设动作库进行匹配,当手势动作与预设动作库中的动作相匹配时,确定该动作对应的第二控制指令;第二控制单元根据第二控制指令控制终端,所述终端可以响应于第二控制指令执行相应的操作。例如,切换频道、调节音量等。

可以理解的是,预设动作库可以是预先配置的;终端执行相应的操作限于预设动作库中动作对应的第二控制指令指向的操作。

优选地,第一情绪结果确定单元602的一种实施方式可参照图7,图7是图6所示第一情绪结果确定单元602的结构示意图。

第一情绪结果确定单元602可以包括关键词提取子单元71、第一匹配子单元72和第一确定子单元73。

其中,关键词提取子单元71用于对所述语音识别结果进行关键词提取处理,以得到关键词;第一匹配子单元72用于将所述关键词与所述预设情绪词库中各个情绪类别的情绪得分词库进行匹配,以根据匹配结果确定所述语音识别结果针对各个情绪类别的情绪得分,其中,所述关键词与所述情绪得分词库的匹配度越高,所述情绪得分越高,所述预设情绪词库用于存储情绪类别对应的所述情绪词库;第一确定子单元73用于确定所述情绪得分最高的情绪类别为所述第一情绪结果。

具体实施中,关键词提取子单元71可以对语音识别结果进行关键词提取,得到语音识别结果的关键词。具体而言,语音识别结果的关键词可以用于表征语音数据的语义,那么可以根据关键词来对语音数据所承载的用户的情绪进行判定。

具体实施中,所述预设情绪词库可以存储多个情绪类别,以及各个情绪类别对应的情绪得分词库。具体而言,每一情绪类别可以表示一种情绪;每一情绪类别可以有多个情绪得分,情绪得分越高表示越接近该情绪类别。每一情绪类别的情绪得分词库可以存储该情绪类别的多个情绪得分对应的词。那么第一匹配子单元72可以将语音识别结果的关键词与各个情绪类别的情绪得分词库中的词进行匹配,并根据匹配到的词确定语音识别结果针对各个情绪类别的情绪得分。其中,所述关键词与所述情绪得分词库的匹配度越高,所述情绪得分越高。

具体地,可以将将语音识别结果与预设情绪词库中所有情绪类别对应的情绪得分词库进行匹配,并得到语音识别结果针对所有情绪类别的情绪得分。例如,语音识别结果确定的情绪得分为:“难过”十分、“厌恶”六分、“惊讶”两分、“生气”一分、“开心”零分。

具体实施中,在确定所述语音识别结果针对各个情绪类别的情绪得分后,由于情绪得分越高表示关键词越接近情绪得分对应的情绪类别,因此第一确定子单元73可以确定所述情绪得分最高的情绪类别为所述第一情绪结果。例如,语音识别结果确定的情绪得分为:难过十分、厌恶六分、惊讶两分、生气一分、开心零分,那么可以判定第一情绪结果为难过。

可以理解的是,如果语音识别结果针对各个情绪类别的情绪得分均为零,或者无法得到语音识别结果针对各个情绪类别的情绪得分的情况下,则将第一情绪结果判定为无情绪。

继续参照图6,推送单元603可以根据第一确定子单元73的判断结果进行播放内容的推送,也即根据所述第一情绪结果对应的所述情绪类别推送所述播放内容。其中,所述播放内容可以与所述情绪类别一一对应。例如,在用户情绪为开心时,推送的播放内容可以是爱情剧;在用户情绪为难过时,推送的播放内容可以是喜剧;在用户情绪为害怕时,推送的播放内容可以是综艺节目等。

需要说明的是,播放内容与情绪类别的对应关系可以根据实际的应用环境进行适应性的自定义配置,本发明实施例对此不做限制。

可以理解的是,与所述用户情绪关联的播放内容可以为带有与情绪类型关联的内容标签的播放内容,每个情绪类型关联至少一个内容标签,每个播放内容都带有至少一个内容标签,推送的内容应为带有与第一情绪结果关联的内容标签的播放内容。例如,在用户情绪为开心时,推送的播放内容可以是带有喜剧、爱情剧等内容标签的播放内容;在用户情绪为难过时,推送的播放内容可以是喜剧、治愈系节目等内容标签的播放内容;在用户情绪为害怕时,推送的播放内容可以是带有喜剧、综艺节目等内容标签的播放内容。如果有多个与用户情绪关联的播放内容可被推送,则随机选取一个播放,或根据实际的应用环境进行适应性的自定义配置选取一个播放,或全部推送供用户选择播放等等,本发明实施例对此不做限制。

本发明实施例通过对用户的语音识别结果进行关键词提取处理,并根据关键词和预设情绪词库中的词进行比较,确定情绪得分最高的情绪类别为用户的情绪;也就是从语音数据的语义层面实现对用户情绪的判断,保证了对播放内容推送的准确性。

图8是本发明实施例另一种基于情绪的终端控制装置的结构示意图。

图8所示的基于情绪的终端控制装置80可以包括语音识别单元801、第一情绪结果确定单元802、面部识别单元803和推送单元804;面部识别单元803可以包括第二匹配子单元8031和第二确定子单元8032。

其中,语音识别单元801用于对接收到的语音数据进行语音识别处理,以得到语音识别结果;第一情绪结果确定单元802用于基于语音识别结果和预设情绪词库确定第一情绪结果;面部识别单元803用于对接收到的面部图像进行面部识别,以确定第二情绪结果;推送单元804用于至少根据所述第一情绪结果确定用户情绪,并推送与所述用户情绪关联的播放内容。

具体而言,第二匹配子单元8031用于将所述面部图像与预设图像进行匹配,以确定所述面部图像针对各个情绪类别的情绪得分。

第二确定子单元8032用于确定所述情绪得分最高的所述情绪类别为所述第二情绪结果。

本实施例中,可以预先对用户的面部图像进行采集,以用于面部情绪的判断。在确定第一情绪结果之后,面部识别单元803还可以对接收到的面部图像进行面部识别,以确定第二情绪结果。

本实施例中语音识别单元801和第一情绪结果确定单元802的具体实施方式可参照图6所示实施例的语音识别单元601和第一情绪结果确定单元602,此处不再赘述。

具体实施中,面部图像可以包括用户的面部,那么可以包括用户的面部表情,面部表情可以表征用户的情绪。具体而言,用户的情绪不同时,其对应的用户图像不同。可以预先设置预设图像,每一预设图像可以表征一种情绪类别,每一情绪类别可以表征一种用户的情绪。那么第二匹配子单元8031可以将面部图像与预设图像进行匹配,根据面部图像与预设图像的匹配度可以确定面部图像针对各个情绪类别的情绪得分。也就是说,面部图像与预设图像的匹配度越高,面部图像针对预设图像对应的情绪类别的情绪得分越高;面部图像的情绪得分越高,表明面部图像所承载的情绪越接近该情绪得分对应的情绪类别。

进而第二确定子单元8032可以将情绪得分最高的所述情绪类别为所述第二情绪结果。也就是说,第二情绪结果表示根据用户的面部图像判断出的情绪。

可以理解的是,如果面部图像针对各个情绪类别的情绪得分均为零,或者无法得到面部图像针对各个情绪类别的情绪得分的情况下,则将第二情绪结果判定为无情绪。

具体实施中,推送单元804可以根据所述第一情绪结果和所述第二情绪结果推送相应的播放内容。与图6所示的推送单元603相比,推送单元804通过将第一情绪结果和所述第二情绪结果相结合来向用户推送节目。本发明实施例通过将用户语音数据中判断出的情绪与用户面部判断出的情绪结合,综合判断出用户当前的情绪,提高了对用户情绪判断的准确性,从而提高了播放内容推送的准确性,进一步提高终端的智能化程度和人性化程度。

优选地,推送单元804可以发送对话框提示是否播放所述播放内容、或者,可以发送语音提示是否播放所述播放内容。具体而言,用户可以通过对终端进行选择操作,确定是否播放所述播放内容。例如,可以通过手势识别的方式进行选择;也可以通过语音控制的方式进行选择。

优选地,推送单元804可以包括第一推送子单元(图未示)和第二推送子单元(图未示)。第一推送子单元用于在所述第一情绪结果为有情绪时,根据所述第一情绪结果对应的所述情绪类别推送所述播放内容。

第二推送子单元用于在所述第一情绪结果为无情绪时,根据所述第二情绪结果对应的所述情绪类别推送所述播放内容。

本实施例中,第一情绪结果可以表示根据用户语音数据判断出的情绪;第二情绪结果可以表示根据用户面部判断出的情绪。考虑到确定第二情绪结果时,与情绪类别完全对应的预设图像的获取和配置难度大,影响第二情绪结果判断的准确性。故本实施例在将将第一情绪结果与第二情绪结果结合时,优先考虑第一情绪结果。

具体实施中,如果第一情绪结果为有情绪,那么第一推送子单元可以将所述第一情绪结果对应的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容;如果第一情绪结果为无情绪,那么第二推送子单元可以将所述第二情绪结果对应的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容。

本发明实施例提供了一种将第一情绪结果和所述第二情绪结果结合推送播放内容时的一种实施方式,通过第一情绪结果优先的方式,保证用户情绪判断的准确性;并在第一情绪结果为无情绪时,保证依然有用户情绪的判定结果,并推送播放内容,进一步提高终端的智能化和人性化。

本实施例中,第一情绪结果可以表示根据用户语音数据判断出的情绪;第二情绪结果可以表示根据用户面部判断出的情绪。由于在得到第一情绪结果和第二情绪结果时,第一情绪结果和第二情绪结果均是根据情绪得分确定的,因此,本实施例在将将第一情绪结果与第二情绪结果结合时,可以根据情绪得分的高低来确定最终的用户情绪。

优选地,推送单元804可以包括第三推送子单元(图未示)、第四推送子单元(图未示)和第五推送子单元(图未示)。

其中,第三推送子单元用于所述第一情绪结果和所述第二情绪结果对应的所述情绪类别一致时,根据所述情绪类别推送所述播放内容。

第四推送子单元用于所述第一情绪结果和所述第二情绪结果对应的所述情绪类别不一致时,以所述情绪得分最高的所述情绪类别推送所述播放内容。

第五推送子单元用于所述第一情绪结果为无情绪时,以所述第二情绪结果对应的所述情绪类别推送所述播放内容。

具体实施中,如果第一情绪结果和所述第二情绪结果对应的所述情绪类别一致,则第三推送子单元可以将该情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容;如果第一情绪结果和所述第二情绪结果对应的所述情绪类别不一致,则第四推送子单元可以将情绪得分最高的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容。

具体实施中,由于第一情绪结果是根据语音识别结果的关键词和预设情绪词库匹配得到的,因此在不能在预设情绪词库匹配得到所述关键词时,第一情绪结果为无情绪。而第二情绪结果是根据面部图像和预设图像匹配得到的,通常不会出现无情绪的状况。故第五推送子单元可以在第一情绪结果为无情绪时,可以将第二情绪结果对应的所述情绪类别确定为用户情绪,并推送与所述用户情绪关联的所述播放内容。

本发明实施例提供了另一种将第一情绪结果和所述第二情绪结果结合推送播放内容时的一种实施方式,通过情绪得分的高低来确定最终的用户情绪,保证了用户情绪判断的准确性;并在第一情绪结果为无情绪时,保证依然有用户情绪的判定结果,并推送播放内容,进一步提高终端的智能化和人性化。

本发明实施例还公开了一种终端,所述终端可以包括图6所示的基于情绪的终端控制装置60或图8所示的基于情绪的终端控制装置80。所述终端包括但不限于电视、计算机、手机、笔记本、平板电脑等。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于以计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1