一种语音交互方法、装置、存储介质及计算机设备与流程

文档序号：15313403发布日期：2018-08-31 22:24阅读：217来源：国知局

本发明涉及人机交互技术领域，尤其涉及一种语音交互方法、装置、存储介质及计算机设备。

背景技术：

人机交互是一门研究系统与用户之间的交互关系的学问。系统可以是机器，也可以说是计算机系统和软件。通过人与计算机的互动、沟通、信息交换，产生一系列的输入和输出，然后完成一个任务或达到一个目的，其中语音交互就是用语音为信息载体与机器进行互动的模式。虽然人机交互已广泛应用于人们生活的方方面面，但现有机器人的交互方式存在不能满足用户实际使用需求的问题，与用户之间的交互不够智能化，难以与人们的实际生活需求相适应。

比如，在母婴生活中，睡眠一直以来是困扰广大产后女性的一大问题，良好的睡眠对产后女性的修复有很大的帮助。但是，照顾宝宝等各种问题都离不开新生儿母亲，母亲的睡眠质量就得不到保障，而且很多职场母亲，白天要应付工作，晚上要照顾宝宝，但宝宝晚上的哭闹行为，严重影响了职场母亲的睡眠。因而，目前市场上出现了针对母婴生活的交互机器人，如智能陪伴机器人，但其大多数还侧重于播放音乐、讲故事等功能，然而，很多时候，孩子特别是婴儿哭闹只是为了寻求母亲或其他亲人的安抚，如果此时婴儿没有得到了母亲或其他亲人的回应，那么婴儿就会很难安静下来或入睡，严重影响家庭成员特别是新生儿母亲的生活质量。还比如，随着我国经济的发展，老龄化问题日益突出，其中“空巢老人”现象尤其引人关注。据统计，到2050年，我国临终无子女的老年人将达到7900万左右，独居和空巢老年人将占54％以上，空巢老人的养老问题，也再次引发关注。对此，社会上也涌现出一系列如电视盒子等专为老人设计的科技产品，来提升老人的晚年生活质量，但这些科技产品顶多增加老人的生活内容，难以缓解他们对家庭温暖的渴望，老人们很多时候只是想听听儿女的声音，碍于儿女工作繁忙，他们又不能经常与儿女沟通交流，可见目前这些科技产品对老年人生活质量的提升帮助并不大，仍然没有最大程度的解决空巢老人寂寞的问题。

显然，目前还没有能够满足人们在生活中实际需求的交互机器人，缺乏模拟不同用户之间的交互习惯、智能安抚等功能，智能化程度仍然很低。

技术实现要素：

本发明提供一种语音交互方法、装置、存储介质及计算机设备，用以解决现有技术中的机器人的交互方式不能满足用户实际使用需求的问题。

依据本发明的一个方面，提供一种语音交互方法，包括：

在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

在语音交互模式下，当采集到所述用户的语音信息时，根据所述交互习惯，模拟与所述用户进行语音交互的用户，对语音信息进行响应。

可选的，还包括：

当采集到预设的语音开启指令时，开启所述语音交互模式。

可选的，所述在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯，包括：

在学习模式下，采集语音发起用户和语音响应用户的语音信息；

根据预设的学习训练模型，以采集的语音信息为样本，学习语音发起用户和语音响应用户之间进行语音交互的交互习惯。

可选的，在学习不同用户间进行语音交互的交互习惯后，还包括：

将学习得到的交互习惯，按照语音发起用户和语音响应用户进行关联存储。

可选的，所述对所述语音信息进行响应，包括：

根据采集到的所述用户的语音信息的音量大小，确定对该语音信息进行响应的音量值；

根据确定的音量值，对所述语音信息进行响应。

可选的，还包括：

确定用户特征信息；

获取与所述用户特征信息匹配的目标信息；

当接收到对所述目标信息的播放指令时，对所述目标信息进行语音播放。

依据本发明的第二个方面，提供一种语音交互装置，包括：

训练模块，用于在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

交互模块，用于在语音交互模式下，当采集到所述用户的语音信息时，根据所述交互习惯，模拟与所述用户进行语音交互的用户，对语音信息进行响应。

可选的，还包括：

语音开启模块，用于当采集到预设的语音开启指令时，开启所述语音交互模式。

可选的，所述训练模块包括：

采集单元，在学习模式下，采集语音发起用户和语音响应用户的语音信息；

学习单元，根据预设的学习训练模型，以采集的语音信息为样本，学习语音发起用户和语音响应用户之间进行语音交互的交互习惯。

可选的，还包括：

关联存储模块，用于将学习得到的交互习惯，按照语音发起用户和语音响应用户进行关联存储。

可选的，还包括：

音量调节模块，用于根据采集到的所述用户的语音信息的音量大小，确定对该语音信息进行响应的音量值。

可选的，还包括：

确定模块，用于确定用户特征信息；

获取模块，用于获取与所述用户特征信息匹配的目标信息；

语音播放模块，用于当接收到对所述目标信息的播放指令时，对所述目标信息进行语音播放。

依据本发明的第三个方面，提供一种计算机可读存储介质，所述存储介质上存储有计算机程序，所述程序被处理器执行时实现如下方法的步骤：

在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

在语音交互模式下，当采集到所述用户的语音信息时，根据所述交互习惯，模拟与所述用户进行语音交互的用户，对语音信息进行响应。

依据本发明的第四个方面，提供一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如下方法的步骤：

在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

在语音交互模式下，当采集到所述用户的语音信息时，根据所述交互习惯，模拟与所述用户进行语音交互的用户，对语音信息进行响应。

可选的，还包括：

声音采集器及声控器，当所述声音采集器采集到预设的语音开启指令时，所述声控器开启所述语音交互模式。

可选的，所述声音采集器还用于在学习模式下，采集语音发起用户和语音响应用户的语音信息；

所述处理器执行所述程序时根据预设的学习训练模型，以采集的语音信息为样本，学习语音发起用户和语音响应用户之间进行语音交互的交互习惯。

可选的，还包括：

声谱分析器，用于将学习得到的交互习惯，按照语音发起用户和语音响应用户进行关联存储。

可选的，所述处理器执行所述程序时还实现如下方法的步骤：

根据采集到的所述用户的语音信息的音量大小，确定对该语音信息进行响应的音量值；

根据确定的音量值，对所述语音信息进行响应。

可选的，所述处理器执行所述程序时还实现如下方法的步骤：

确定用户特征信息；

获取与所述用户特征信息匹配的目标信息；

当接收到对所述目标信息的播放指令时，对所述目标信息进行语音播放。

本发明的有益效果为：

本发明所述方案，通过在学习模式下学习到的语音发起用户和语音响应用户之间的交互习惯，针对性的对语音发起用户进行智能化的回应，使得人机之间的交互更加智能化，用户体验佳。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本发明一实施例语音交互方法的流程图；

图2为本发明一实施例语音交互方法的流程图；

图3为本发明一实施例语音交互方法的流程图；

图4为本发明一实施例语音交互方法的流程图；

图5为本发明一实施例语音交互装置的结构示意图；

图6为本发明一实施例计算机设备的结构示意图；

图7为本发明一具体实施例计算机设备为机器人时的结构示意图。

其中：11-训练模块，111-采集单元，112-学习单元，12-交互模块，13-语音开启模块，14-关联存储模块，15-音量调节模块，16-确定模块，17-获取模块，18-语音播放模块，21-存储器，22-处理器，23-声音采集器，24-声控器，25-声谱分析器，26-播放器，27-输入键盘，28-显示器。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

请参见图1，在本发明的第一实施例中，提供一种语音交互方法，包括：

步骤s101：在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

步骤s102：在语音交互模式下，当采集到用户的语音信息时，根据交互习惯，模拟与用户进行语音交互的用户，对语音信息进行响应。

优选的，在实际情形中，在语音交互模式下，当采集到用户a的语音信息时，根据交互习惯，模拟与用户a进行语音交互的用户b，对用户a的语音信息进行响应。

可选的，还包括：

当采集到预设的语音开启指令时，开启语音交互模式。

可选的，请参见图2，在步骤s101中，在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯，包括：

步骤s011：在学习模式下，采集语音发起用户和语音响应用户的语音信息；

步骤s012：根据预设的学习训练模型，以采集的语音信息为样本，学习语音发起用户和语音响应用户之间进行语音交互的交互习惯。

可选的，在学习不同用户间进行语音交互的交互习惯后，还包括：

将学习得到的交互习惯，按照语音发起用户和语音响应用户进行关联存储。

可选的，请参见图3，所述对所述语音信息进行响应，包括：

步骤s201：根据采集到的用户的语音信息的音量大小，确定对该语音信息进行响应的音量值；

步骤s202：根据确定的音量值，对语音信息进行响应。

可选的，请参见图4，还包括：

步骤s301：确定用户特征信息；

步骤s302：获取与用户特征信息匹配的目标信息；

步骤s303：当接收到对目标信息的播放指令时，对目标信息进行语音播放。

在本发明的第二实施例中，提供了一种语音交互装置，请参见图5，包括：

训练模块11，用于在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

交互模块12，用于在语音交互模式下，当采集到所述用户的语音信息时，根据交互习惯，模拟与用户进行语音交互的用户，对语音信息进行响应。

可选的，还包括：

语音开启模块13，用于当采集到预设的语音开启指令时，开启语音交互模式。

可选的，训练模块11包括：

采集单元111，在学习模式下，采集语音发起用户和语音响应用户的语音信息；优选的，还用于采集预设的语音开启指令。

学习单元112，根据预设的学习训练模型，以采集的语音信息为样本，学习语音发起用户和语音响应用户之间进行语音交互的交互习惯。

可选的，还包括：

关联存储模块14，用于将学习得到的交互习惯，按照语音发起用户和语音响应用户进行关联存储。在语音交互模式下，该装置就能辨别出是哪个用户的语音信息。

可选的，还包括：

音量调节模块15，用于根据采集单元111采集到的用户的语音信息的音量大小，确定对该语音信息进行响应的音量值。

可选的，还包括：

确定模块16，用于确定用户特征信息；

获取模块17，用于获取与用户特征信息匹配的目标信息；

语音播放模块18，用于当接收到对目标信息的播放指令时，对目标信息进行语音播放。

在本发明的第三实施例中，提供一种计算机可读存储介质，存储介质上存储有计算机程序，程序被处理器执行时实现如下方法的步骤：

步骤s101：在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

步骤s102：在语音交互模式下，当采集到所述用户的语音信息时，根据交互习惯，模拟与用户进行语音交互的用户，对语音信息进行响应。

可选的，程序被处理器执行时实现如下方法的步骤：

当采集到预设的语音开启指令时，开启语音交互模式。

可选的，在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯，程序被处理器执行时实现如下方法的步骤：

步骤s011：在学习模式下，采集语音发起用户和语音响应用户的语音信息；

步骤s012：根据预设的学习训练模型，以采集的语音信息为样本，学习语音发起用户和语音响应用户之间进行语音交互的交互习惯。

可选的，在学习不同用户间进行语音交互的交互习惯后，所述程序被处理器执行时实现如下方法的步骤：

将学习得到的交互习惯，按照语音发起用户和语音响应用户进行关联存储。

可选的，对语音信息进行响应，程序被处理器执行时实现如下方法的步骤：

步骤s201：根据采集到的用户的语音信息的音量大小，确定对该语音信息进行响应的音量值；

步骤s202：根据确定的音量值，对语音信息进行响应。

可选的，程序被处理器执行时还实现如下方法的步骤：

步骤s301：确定用户特征信息；

步骤s302：获取与用户特征信息匹配的目标信息；

步骤s303：当接收到对目标信息的播放指令时，对目标信息进行语音播放。

请参见图1-6，在本发明的第四实施例中，提供了一种计算机设备(参见图6)，包括存储器21、处理器22及存储在存储器21上并可在处理器22上运行的计算机程序，处理器22执行程序时实现如下方法的步骤：

步骤s101：在学习模式下，根据预设的学习训练模型，学习不同用户间进行语音交互的交互习惯；

步骤s102：在语音交互模式下，当采集到所述用户的语音信息时，根据交互习惯，模拟与用户进行语音交互的用户，对语音信息进行响应。(具体参见图1)

可选的，还包括：

声音采集器23及声控器24，当声音采集器23采集到预设的语音开启指令时，声控器24开启语音交互模式。当声音采集器23没有采集到预设的语音开启指令时，使该计算机设备进入待机状态。

可选的，声音采集器23还用于在学习模式下，采集语音发起用户和语音响应用户的语音信息。

处理器22执行程序时根据预设的学习训练模型，以采集的语音信息为样本，学习语音发起用户和语音响应用户之间进行语音交互的交互习惯。

可选的，还包括：

声谱分析器25，用于将学习得到的交互习惯，按照语音发起用户和语音响应用户进行关联存储。

可选的，请参见图3，处理器22执行程序时还实现如下方法的步骤：

步骤s201：根据采集到的用户的语音信息的音量大小，确定对该语音信息进行响应的音量值；

步骤s202：根据确定的音量值，对语音信息进行响应。

可选的，请参见图4，所述处理器22执行程序时还实现如下方法的步骤：

步骤s301：确定用户特征信息；

步骤s302：获取与用户特征信息匹配的目标信息；

步骤s303：当接收到对目标信息的播放指令时，对目标信息进行语音播放。

本发明提供的语音交互方法、装置及计算机设备，可以应用在母婴、空巢老人、缓解人工服务压力的人工智能语音服务等实际生活中，但本发明对应用场景不做唯一限定。为使本发明更加清楚明白，下面列举具体实施场景来对本发明做进一步说明。

在本发明的第五实施例中，请参见图6、图7，本发明实施例优选计算机设备为应用于母婴生活中的智能陪伴机器人，此时，语音交互模式为睡眠哄睡模式，在宝宝突然哭闹时，机器人会模拟妈妈的声音来安抚宝宝，语音发起用户为宝宝，语音响应用户为妈妈，用户特征信息包括宝宝年龄大小，与用户特征信息匹配的目标信息包括存储器21里存储的海量宝宝护理常识及注意事项等，存储器21还存储学习模式下宝宝哭闹声音习惯及妈妈响应习惯，宝宝哭闹声音习惯及对哭闹习惯做出响应的妈妈的响应习惯即为两者之间的交互习惯，下面，结合具体使用场景对本发明做进一步的说明。

该智能陪伴机器人身后设有开关按钮，其可手动控制播放器26的播放音量。

请参见图7，机器人机身正面设有显示器28的led显示屏，用于显示当前日期，宝宝出生日期、宝宝大小等特征信息；

还设置有输入键盘27，输入键盘27上设置有1～9等9个数字，用于输入宝宝生日及校准当前时间；

机身正面还有：常识按钮，按下常识按钮播放器26即可播放当前年龄段宝宝的护理常识及注意事项等目标信息；睡眠按钮，按下睡眠按钮，用于在宝宝睡眠哭闹时根据学习到的交互习惯模拟妈妈，辅助妈妈安慰宝宝；学习按钮，按下学习按钮机器人就可学习宝宝哭闹习惯及妈妈响应习惯并进行智能分析关联存储，作为睡眠辅助模式下机器人模拟妈妈声音的声音来源；usb插口，用于更新宝宝护理常识及注意事项，以获取时新的护理知识。

声控器24：当机器人处于睡眠模式时，通过宝宝哭闹声音声控开启睡眠哄睡模式，在此，宝宝哭闹声音即为预设的预设的语音开启指令，从而使机器人处于睡眠哄睡模式的工作状态。当宝宝停止哭闹，使机器人处于待机状态。

声音采集器23：采用声音传感器采集宝宝哭闹的语音信息及妈妈安抚宝宝的语音信息；

声谱分析器25：根据声音采集器23采集到的语音信息，区分声音类型为宝宝，还是妈妈，还是其他亲人，并在学习模式下，将学习得到的交互习惯，按照语音发起用户宝宝和语音响应用户妈妈进行关联存储；在睡眠哄睡模式下辨别是否为宝宝哭闹声音。

处理器22：分析宝宝哭闹声音习惯和妈妈响应习惯，在睡眠哄睡模式下，当声音采集器23采集到宝宝哭闹的声音时，根据宝宝和妈妈之间的交互习惯，模拟妈妈对宝宝此时的哭闹习惯最有效的语音信息来回复、安抚宝宝，也就是说，机器人智能检索在学习模式下学习的最为有效的妈妈的声音安抚宝宝，而且处理器22还会根据宝宝哭闹声音的大小，调节对宝宝进行回应的语音信息的音量值。

使用场景1：当拿到机器人时，用户可用输入宝宝出生年月，比如宝宝当前1个月，打开机器人，按下常识功能键，即可向机器人发出播放指令，由于机器人内的存储器21内存储有海量宝宝护理常识及注意事项等目标信息，机器人通过播放器26讲述宝宝在1个月的护理常识及误区，使得用户能够更好的护理宝宝。若宝宝长到2个月时，按下常识功能键，机器人就会讲述宝宝2个月大时的护理常识及误区。也就是说，本发明实施例中的机器人会伴随宝宝成长，讲述当前宝宝所处年龄段的护理技巧等。

使用场景2：拿到机器人后，在宝宝哭闹时按下学习键打开学习功能，机器人会自动学习宝宝哭闹声音、妈妈安抚回应声音等，即两者之间的交互习惯。当宝宝睡眠时，打开睡眠模式，睡眠模式下，当宝宝哭闹时，机器人会根据宝宝哭闹声音，检索出已存储的最为有效的安抚宝宝的妈妈的声音来回应宝宝，并且根据宝宝哭闹声音的大小调节模拟妈妈声音的大小，当哭闹声大时，安抚声音大，当哭闹声音小，安抚声音小，当宝宝进入睡眠，机器人进入休眠模式。

可见，本发明实施例提供的智能陪伴机器人，为妈妈们提供了适合宝宝各个年龄段的护理常识及注意事项和误区，并着重学习宝宝哭闹习惯和妈妈对哭闹习惯做出响应的护理习惯，当处于睡眠哄睡模式时，智能模拟妈妈声音辅助安抚宝宝，使妈妈睡眠尽可能少的被打扰，大大满足了用户的实际使用需求。

在本发明的第六实施例中，本发明实施例优选计算机设备为应用于空巢老人生活中的智能陪伴机器人，在学习模式下，智能陪伴机器人会学习日常生活中老人和儿女之间进行语音交互的交互习惯，等到儿女离家后，老人就可以与机器人进行交流来打发孤独和无聊，在机器人处于语音交互模式下时，当机器人采集到老人说话的声音时，机器人就会模拟孩子的声音来对老人的声音进行回应，由此，老人就可以在长期独居的生活中通过与机器人的交互来更好地排解孤独了，从而提高老年人的生活质量和身心健康。而且，为了增强老人对自身健康的管理质量，机器人确定的用户特征信息将会包括老人年龄段、性别、健康状态等，与用户特征信息匹配的目标信息包括存储器21里存储的针对老人在不同年龄段、不同健康状态下的海量护理常识及注意事项等，从而提高老人的健康管理质量，增强身体素质。

显然，本发明通过在学习模式下学习到的语音发起用户和语音响应用户之间的交互习惯，针对性的对语音发起用户进行智能化的回应，使得人机之间的交互更加智能化，用户体验佳。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：rom、ram、磁盘或光盘等。

总之，以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李蜜
技术所有人：青岛海尔科技有限公司
我是此专利的发明人