一种语音控制方法、装置、存储介质及空调与流程

文档序号:17652125发布日期:2019-05-15 21:32阅读:190来源:国知局
一种语音控制方法、装置、存储介质及空调与流程

本发明属于语音控制技术领域,具体涉及一种语音控制方法、装置、存储介质及空调,尤其涉及一种基于用户语音情绪变化的报告推送方法、装置、存储介质及空调。



背景技术:

在移动互联网时代逐渐步入人工智能时代后,不可避免地给企业及用户的行为带来一系列改变与重塑。其中最大的变化莫过于,用户的一切行为在企业面前似乎都将是“可视化”的。

例如:银行会记录用户取款、转账记录,通信运行商会记录用户的上网数据,等等;企业会保留有用户的相关信息用于更好的服务。又如:类似网易音乐年度报告,它是用h5的形式为用户展示一年里用户听了多少首歌,哪一天最特别,那首歌听的最多,最喜欢的歌手等。

但这种方式只是根据历史记录去统计分析,在语音交互方面,使得语音交互方式单一,无个性化定制的用户服务,用户体验性差。



技术实现要素:

本发明的目的在于,提供一种语音控制方法、装置、存储介质及空调,以解决现有技术中语音交互方式单一的问题,达到丰富语音交互方式的效果。

本发明提供一种语音控制方法,包括:收集语音数据;基于所述语音数据进行画像处理,得到用户的语音画像;根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。

可选地,收集语音数据,包括:获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储;其中,语音采集模块,包括:麦克风阵列。

可选地,基于所述语音数据进行画像处理,包括:对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息;对所述情绪信息进行建模处理,以构建得到用户的语音画像。

可选地,所述建模处理,包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。

可选地,根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,包括:识别所述语音画像所包含的情绪特征;将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息;所述情绪信息,包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一;根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。

可选地,推送所述情绪变化情况,包括:显示所述情绪报告;和/或,将所述情绪报告发送至设定的客户端;和/或,对所述情绪报告进行语音播报。

与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:收集单元,用于收集语音数据;控制单元,用于基于所述语音数据进行画像处理,得到用户的语音画像;所述控制单元,还用于根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。

可选地,所述收集单元收集语音数据,包括:获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储;其中,语音采集模块,包括:麦克风阵列。

可选地,所述控制单元基于所述语音数据进行画像处理,包括:对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息;对所述情绪信息进行建模处理,以构建得到用户的语音画像。

可选地,所述建模处理,包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。

可选地,所述控制单元根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,包括:识别所述语音画像所包含的情绪特征;将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息;所述情绪信息,包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一;根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。

可选地,所述控制单元推送所述情绪变化情况,包括:显示所述情绪报告;和/或,将所述情绪报告发送至设定的客户端;和/或,对所述情绪报告进行语音播报。

与上述装置相匹配,本发明再一方面提供一种空调,包括:以上所述的语音控制装置。

与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

与上述方法相匹配,本发明再一方面提供一种空调,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以丰富语音交互方式。

进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,提升用户的交互体验。

进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以实现不同用户的个性化服务需求。

进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以增强语音交互的趣味性。

进一步,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,可以帮助用户进行情绪管理。

由此,本发明的方案,通过建立语音画像,识别用户情绪,推送总结报告,解决现有技术中语音交互方式单一的问题,从而,克服现有技术中语音交互方式单一、不能实现个性化服务和用户体验差的缺陷,实现语音交互方式丰富、能够实现个性化服务和用户体验好的有益效果。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的语音控制方法的一实施例的流程示意图;

图2为本发明的方法中基于所述语音数据进行画像处理的一实施例的流程示意图;

图3为本发明的方法中根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况的一实施例的流程示意图;

图4为本发明的语音控制装置的一实施例的结构示意图;

图5为本发明的空调的一实施例的语音画像的构建流程示意图。

结合附图,本发明实施例中附图标记如下:

102-收集单元;104-控制单元。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以包括:步骤s110至步骤s130。

在步骤s110处,收集语音数据。例如:收集用户在设定时间段内发出的语音数据。

可选地,步骤s110中收集语音数据,可以包括:获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储。

由此,通过获取语音采集模块采集到的语音数据并存储,实现对一段时间内语音数据的收集,使得对语音数据的收集方便且精准。

其中,语音采集模块,可以包括:麦克风阵列。

例如:语音数据收集,如通过麦克风进行语音数据收集。如系统使用麦克风阵列获取用户语音信息。

由此,通过麦克风阵列采集语音数据,采集方式简便且采集结果精准。

在步骤s120处,基于所述语音数据进行画像处理,得到用户的语音画像。

可选地,可以结合图2所示本发明的方法中基于所述语音数据进行画像处理的一实施例流程示意图,进一步说明步骤s120中基于所述语音数据进行画像处理的具体过程,可以包括:步骤s210和步骤s220。

步骤s210,对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息。

例如:分析建模,如对收集的语音数据进行分析建模。

步骤s220,对所述情绪信息进行建模处理,以构建得到用户的语音画像。

例如:构建用户语音画像,如基于分析建模得到的模型,构建用户语音画像,从而获取用户一段时间情绪变化,进而使设备通过播报装置进行播报情绪变化总结。

由此,通过对语音数据进行分析处理而得到用户的声音信息,进而对该声音信息进行建模处理得到用户的语音画像,使得基于语音数据构建语音画像精确且可靠。

更可选地,所述建模处理,可以包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。

例如:系统通过语音情绪识别单元从麦克风阵列获取到的语音音频数据中分类出用户的情绪,包括快乐、忧伤、平和、恐惧、愤怒等,通过聚类算法、机器学习、自然语言处理等算法分析建模构成用户语音画像。

由此,通过多种算法对声音信息进行建模处理进而构建得到语音画像,处理方式灵活且可靠。

在步骤s130处,根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。

例如:可以通过建立语音画像(即从用户的语音中识别得到的用户画像,命名为用户语音画像),识别用户情绪,推送总结报告,提升用户的交互体验。如:通过建立“语音画像”,识别、获取用户情绪信息,推送总结报告,提升用户的交互体验。

由此,通过基于语音数据进行画像处理得到语音画像,进而基于该语音画像可以确定用户在一段时间内的情绪报告,丰富了语音交互方式,提升了用户体验。

可选地,可以结合图3所示本发明的方法中根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况的一实施例流程示意图,进一步说明步骤s130中根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况的具体过程,可以包括:步骤s310至步骤s330。

步骤s310,识别所述语音画像所包含的情绪特征。

步骤s320,将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息。所述情绪信息,可以包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一。

例如:语音情绪识别单元可选使用算法重点关注声音中的“关键声学特征”,然后将这些特征与一个分类系统进行对照,从而判断用户情绪;或使用通过深度学习方式建立的情绪识别模型,直接从用户语音中分类出用户情绪信息。如:采集大量不同用户声音信息,系统给不同声音信息打上不同的情绪标签。使用采集到的声音数据和情绪标签训练深度学习模型。最后得出可使用的情绪识别模型,通过给该模型输入用户声音数据得到该用户的情绪。

步骤s330,根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。

例如:系统通过用户画像获取用户一段时间(一周、一月、一年等)内的情绪变化情况。

由此,通过识别语音画像中声音信息的声学特征,进而将该声学特征对设定的情绪信息范围进行对比以确定该声学特征对应的情绪信息,从而基于该情绪信息生成用户在该一段时间内的情绪报告,使得基于语音画像生成情绪报告精准而可靠。

可选地,步骤s130中推送所述情绪变化情况,可以包括以下至少一种推送方式。

第一种推送方式:显示所述情绪报告。

第二种推送方式:将所述情绪报告发送至设定的客户端(如用户手机)。

第三种推送方式:对所述情绪报告进行语音播报,例如:可以利用设定的扬声器对所述情绪报告进行语音播报。

例如:系统在一段时间(一周、一月、一年等)后根据统计单元存储统计的情绪信息,组织播报文本,使用扬声器向用户播报近期内用户的情绪变化情况。如:向用户播报近期内用户的情绪变化情况,可以提升用户体验,增强趣味性,帮助用户进行情绪管理。

由此,通过多种形式的推送方式,可以满足不同用户的不同推送需求,灵活性好、且人性化好。

经大量的试验验证,采用本实施例的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以丰富语音交互方式。

根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图4所示本发明的装置的一实施例的结构示意图。该语音控制装置可以包括:收集单元102和控制单元104。

在一个可选例子中,收集单元102,可以用于收集语音数据。例如:收集用户在设定时间段内发出的语音数据。该收集单元102的具体功能及处理参见步骤s110。

可选地,所述收集单元102收集语音数据,可以包括:所述收集单元102,具体还可以用于获取由语音采集模块采集到的语音数据,并对一段时间内采集的语音数据进行存储。

由此,通过获取语音采集模块采集到的语音数据并存储,实现对一段时间内语音数据的收集,使得对语音数据的收集方便且精准。

其中,语音采集模块,可以包括:麦克风阵列。

例如:语音数据收集,如通过麦克风进行语音数据收集。如系统使用麦克风阵列获取用户语音信息。

由此,通过麦克风阵列采集语音数据,采集方式简便且采集结果精准。

在一个可选例子中,控制单元104,可以用于基于所述语音数据进行画像处理,得到用户的语音画像。该控制单元104的具体功能及处理参见步骤s120。

可选地,所述控制单元104基于所述语音数据进行画像处理,可以包括:

所述控制单元104,具体还可以用于对所述语音数据进行分析处理,并从所述分析处理所得结果中提取用户的情绪信息。该控制单元104的具体功能及处理还参见步骤s210。

例如:分析建模,如对收集的语音数据进行分析建模。

所述控制单元104,具体还可以用于对所述情绪信息进行建模处理,以构建得到用户的语音画像。该控制单元104的具体功能及处理还参见步骤s220。

例如:构建用户语音画像,如基于分析建模得到的模型,构建用户语音画像,从而获取用户一段时间情绪变化,进而使设备通过播报装置进行播报情绪变化总结。

由此,通过对语音数据进行分析处理而得到用户的声音信息,进而对该声音信息进行建模处理得到用户的语音画像,使得基于语音数据构建语音画像精确且可靠。

更可选地,所述建模处理,可以包括:利用聚类算法、机器学习算法、自然语音处理算法中的至少之一进行的处理。

例如:系统通过语音情绪识别单元从麦克风阵列获取到的语音音频数据中分类出用户的情绪,包括快乐、忧伤、平和、恐惧、愤怒等,通过聚类算法、机器学习、自然语言处理等算法分析建模构成用户语音画像。

由此,通过多种算法对声音信息进行建模处理进而构建得到语音画像,处理方式灵活且可靠。

在一个可选例子中,所述控制单元104,还可以用于根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,并推送所述情绪变化情况。该控制单元104的具体功能及处理还参见步骤s130。

例如:可以通过建立语音画像(即从用户的语音中识别得到的用户画像,命名为用户语音画像),识别用户情绪,推送总结报告,提升用户的交互体验。如:通过建立“语音画像”,识别、获取用户情绪信息,推送总结报告,提升用户的交互体验。

由此,通过基于语音数据进行画像处理得到语音画像,进而基于该语音画像可以确定用户在一段时间内的情绪报告,丰富了语音交互方式,提升了用户体验。

可选地,所述控制单元104根据所述语音画像在一段时间内的变化情况确定用户在一段时间内的情绪变化情况,可以包括:

所述控制单元104,具体还可以用于识别所述语音画像所包含的情绪特征。该控制单元104的具体功能及处理还参见步骤s310。

所述控制单元104,具体还可以用于将所述情绪特征与设定的情绪信息范围进行对比,以确定与所述情绪特征对应的情绪信息。所述情绪信息,可以包括:快乐情绪、忧伤情绪、平和情绪、恐惧情绪、愤怒情绪中的至少之一。该控制单元104的具体功能及处理还参见步骤s320。

例如:语音情绪识别单元可选使用算法重点关注声音中的“关键声学特征”,然后将这些特征与一个分类系统进行对照,从而判断用户情绪;或使用通过深度学习方式建立的情绪识别模型,直接从用户语音中分类出用户情绪信息。如:采集大量不同用户声音信息,系统给不同声音信息打上不同的情绪标签。使用采集到的声音数据和情绪标签训练深度学习模型。最后得出可使用的情绪识别模型,通过给该模型输入用户声音数据得到该用户的情绪。

所述控制单元104,具体还可以用于根据用户在一段时间内的情绪信息的变化情况,生成该一段时间内的情绪变化情况;所述情绪变化情况,能够以情绪报告的形式体现。该控制单元104的具体功能及处理还参见步骤s330。

例如:系统通过用户画像获取用户一段时间(一周、一月、一年等)内的情绪变化情况。

由此,通过识别语音画像中声音信息的声学特征,进而将该声学特征对设定的情绪信息范围进行对比以确定该声学特征对应的情绪信息,从而基于该情绪信息生成用户在该一段时间内的情绪报告,使得基于语音画像生成情绪报告精准而可靠。

可选地,所述控制单元104推送所述情绪变化情况,可以包括以下至少一种推送方式。

第一种推送方式:所述控制单元104,具体还可以用于显示所述情绪报告。

第二种推送方式:所述控制单元104,具体还可以用于将所述情绪报告发送至设定的客户端(如用户手机)。

第三种推送方式:所述控制单元104,具体还可以用于对所述情绪报告进行语音播报,例如:可以利用设定的扬声器对所述情绪报告进行语音播报。

例如:系统在一段时间(一周、一月、一年等)后根据统计单元存储统计的情绪信息,组织播报文本,使用扬声器向用户播报近期内用户的情绪变化情况。如:向用户播报近期内用户的情绪变化情况,可以提升用户体验,增强趣味性,帮助用户进行情绪管理。

由此,通过多种形式的推送方式,可以满足不同用户的不同推送需求,灵活性好、且人性化好。

由于本实施例的装置所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,提升用户的交互体验。

根据本发明的实施例,还提供了对应于语音控制装置的一种空调。该空调可以包括:以上所述的语音控制装置。

随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值、提供更好的用户服务。于是,“用户画像”的概念也就应运而生。借助人工智能技术,可以从用户的语音信息中提取大量用户画像特征,包括情绪、性别、年龄、地域、健康状况、身高、体重、面部特征等。这项技术被称为用户语音画像。目前情绪识别、性别识别更为成熟。而用户画像是需要采集更多的信息,使用更多的算法去分析建模,得到的信息更为准确,还能预测。推送的方法也不同,传统是h5形式,因这个应用于智能设备,故采用语音播报的形式。

在一个可选实施方式中,本发明的方案,通过建立语音画像(即从用户的语音中识别得到的用户画像,命名为用户语音画像),识别用户情绪,推送总结报告,提升用户的交互体验。

在一个可选例子中,本发明的方案,通过建立“语音画像”,识别、获取用户情绪信息,推送总结报告,提升用户的交互体验。

在一个可选具体实施方式中,可以参见图5所示的例子,对本发明的方案的具体实现过程进行示例性说明。

在一个可选具体例子中,本发明的方案,可以提供一种基于用户语音情绪变化的报告推送,该系统主要可以由麦克风阵列、语音情绪识别单元、扬声器、无线通讯模块等组成。

在一个可选具体例子中,本发明的方案,可以提供一种基于用户语音情绪变化的报告推送方法。

参见图5所示的例子,该基于用户语音情绪变化的报告推送方法,主要可以包括:

步骤1、语音数据收集,如通过麦克风进行语音数据收集。

可选地,系统使用麦克风阵列获取用户语音信息。

步骤2、分析建模,如对收集的语音数据进行分析建模。

步骤3、构建用户语音画像,如基于分析建模得到的模型,构建用户语音画像,从而获取用户一段时间情绪变化,进而使设备通过播报装置进行播报情绪变化总结。

可选地,系统通过语音情绪识别单元从麦克风阵列获取到的语音音频数据中分类出用户的情绪,包括快乐、忧伤、平和、恐惧、愤怒等,通过聚类算法、机器学习、自然语言处理等算法分析建模构成用户语音画像。

可选地,语音情绪识别单元可选使用算法重点关注声音中的“关键声学特征”,然后将这些特征与一个分类系统进行对照,从而判断用户情绪;或使用通过深度学习方式建立的情绪识别模型,直接从用户语音中分类出用户情绪信息。

例如:使用算法重点关注声音中的“关键声学特征”中的算法可以为情绪识别模型。模型本身就可从声音中侧重提取所需的“关键声学特征”。模型本身由数据训练得出。在训练得出模型的过程中,机器会自动得出相关特征值。模型本身依据训练得出的参数值和网络结构可达到识别用户情绪的目的。

例如:通过深度学习方式建立的情绪识别模型,可以包括:采集大量不同用户声音信息,系统给不同声音信息打上不同的情绪标签。使用采集到的声音数据和情绪标签训练深度学习模型。最后得出可使用的情绪识别模型,通过给该模型输入用户声音数据得到该用户的情绪。

可选地,系统通过用户画像获取用户一段时间(一周、一月、一年等)内的情绪变化情况。

可选地,系统在一段时间(一周、一月、一年等)后根据统计单元存储统计的情绪信息,组织播报文本,使用扬声器向用户播报近期内用户的情绪变化情况。

例如:向用户播报近期内用户的情绪变化情况,可以提升用户体验,增强趣味性,帮助用户进行情绪管理。类似的推送案例,可以包括:网易云音乐的个人年度音乐总结推送,类似支付宝的消费记录年度推送,等等。

由于本实施例的空调所实现的处理及功能基本相应于前述图4所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以实现不同用户的个性化服务需求。

根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以增强语音交互的趣味性。

根据本发明的实施例,还提供了对应于语音控制方法的一种空调。该空调,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

由于本实施例的空调所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过建立语音画像,识别用户情绪,推送总结报告,可以帮助用户进行情绪管理。

综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。

以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1