一种对话控制方法、装置及机器人与流程

文档序号：11202359阅读：624来源：国知局

本发明涉及通信领域，更具体的说，涉及一种对话控制方法、装置及机器人。

背景技术：

随着科学技术的不断发展，在机器人领域的研究不断深入。其中，机器人(robot)是自动执行工作的机器装置。它既可以接受人类指挥，又可以运行预先编排的程序，也可以根据以人工智能技术制定的原则纲领行动。它的任务是协助或取代人类工作的工作，例如生产业、建筑业，或是危险的工作。

现在已经能够实现人与机器人的中文的沟通交流，具体的，采集用户输入的中文语音，并针对该中文语音进行回复，但是现在仅能够实现人与机器人的中文的沟通交流，会导致人与机器人的沟通交流方式单一。

技术实现要素：

有鉴于此，本发明提供一种对话控制方法、装置及机器人，以解决现在仅能够实现人与机器人的中文的沟通交流，会导致人与机器人的沟通交流方式单一的问题。

为解决上述技术问题，本发明采用了如下技术方案：

一种对话控制方法，应用于机器人，包括：

采集用户输入的语音；其中，所述语音为任一语种的语音；

对所述语音进行语音识别，得到所述语音对应的多个字符串；

基于多个所述字符串确定所述语音对应的语种，并查找与多个所述字符串对应的回答消息；其中，所述回答消息的语种与所述语音的语种相同；

输出所述回答消息。

优选地，对所述语音进行语音识别，得到所述语音对应的多个字符串，包括:

根据所述语音中的静音点，将所述语音拆分得到多个有效语音；

查询与每个所述有效语音对应的所述字符串，得到所述语音对应的多个字符串。

优选地，查找与多个所述字符串对应的回答消息，包括：

将多个所述字符串翻译成中文短句；

采用匹配算法，查找与所述中文短句相匹配的中文回答消息；

将所述中文回答消息翻译成所述回答消息。

优选地，输出所述回答消息包括：

将所述回答消息显示在所述机器人的显示屏幕上；

和/或，将所述回答消息语音输出。

优选地，采集用户输入的语音后，还包括：

对所述语音进行降噪处理，得到降噪后的语音；

相应的，对所述语音进行语音识别，得到所述语音对应的多个字符串，具体包括：

对所述降噪后的语音进行语音识别，得到所述降噪后的语音对应的多个字符串。

一种对话控制装置，应用于机器人，包括：

语音采集模块，用于采集用户输入的语音；其中，所述语音为任一语种的语音；

语音识别模块，用于对所述语音进行语音识别，得到所述语音对应的多个字符串；

语种确定模块，用于基于多个所述字符串确定所述语音对应的语种；

查找模块，用于查找与多个所述字符串对应的回答消息；其中，所述回答消息的语种与所述语音的语种相同；

语音输出模块，用于输出所述回答消息。

优选地，所述语音识别模块包括：

拆分子模块，用于根据所述语音中的静音点，将所述语音拆分得到多个有效语音；

查询子模块，用于查询与每个所述有效语音对应的所述字符串，得到所述语音对应的多个字符串。

优选地，所述查找模块包括：

第一翻译子模块，用于将多个所述字符串翻译成中文短句；

匹配查找子模块，用于采用匹配算法，查找与所述中文短句相匹配的中文回答消息；

第二翻译子模块，用于将所述中文回答消息翻译成所述回答消息。

优选地，还包括：

降噪处理模块，用于所述语音采集模块采集用户输入的语音后，对所述语音进行降噪处理，得到降噪后的语音；

相应的，所述语音识别模块用于对所述语音进行语音识别，得到所述语音对应的多个字符串时，具体用于：

对所述降噪后的语音进行语音识别，得到所述降噪后的语音对应的多个字符串。

一种机器人，包括：语音采集模块、处理器和语音输出模块；

其中，所述语音采集模块，用于采集用户输入的语音；其中，所述语音为任一语种的语音；

所述处理器，用于对所述语音进行语音识别，得到所述语音对应的多个字符串，以及基于多个所述字符串确定所述语音对应的语种，并查找与多个所述字符串对应的回答消息；其中，所述回答消息的语种与所述语音的语种相同；

所述语音输出模块，用于输出所述回答消息。

相较于现有技术，本发明具有以下有益效果：

本发明提供了一种对话控制方法、装置及机器人，本发明中通过采集用户输入的语音，对所述语音进行语音识别，得到所述语音对应的多个字符串，基于多个所述字符串确定所述语音对应的语种，并查找与多个所述字符串对应的回答消息以及输出所述回答消息的方式来实现人与机器人的多语种的沟通交流，进而使人与机器人的沟通交流方式更丰富。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明提供的一种对话控制方法的方法流程图；

图2为本发明提供的另一种对话控制方法的方法流程图；

图3为本发明提供的一种对话控制装置的结构示意图；

图4为本发明提供的另一种对话控制装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种对话控制方法，应用于机器人，包括：

s101、采集用户输入的语音；

其中，所述语音为任一语种的语音，语种可以包括英语、俄语、西班牙等语种。

其中，用户为与机器人进行沟通交流的人员，用户输入的语音可以为英文语音。

需要说明的是，可选的，在本实施例的基础上，采集用户输入的语音后，对语音进行降噪处理，得到降噪后的语音。

其中，用户在输入语音时，机器人的语音采集装置可能会采集到杂音，此时可以使用降噪处理方法对杂音进行降噪处理，其中，降噪处理可以采用采样除燥法、噪声门等方式。

对语音进行降噪处理，能够去除杂音对采集的语音的影响。

s102、对语音进行语音识别，得到语音对应的多个字符串；

其中，语音识别是将语音转换成字符串的过程。需要说明的是，得到语音对应的多个字符串后，可以将得到的多个字符串显示在显示屏幕上，即用户界面ui上。

需要说明的是，当采集用户输入的语音后，对语音进行降噪处理，得到降噪后的语音后，本步骤就相应的更改为：

对降噪后的语音进行语音识别，得到降噪后的语音对应的多个字符串。

可选的，在本实施例的基础上，步骤s102包括：

1)根据语音中的静音点，将语音拆分得到多个有效语音；

其中，由于用户在说出语音时，中间会有停顿，所以会出现静音点，静音点的地方是没有用户输入的语音的，即静音点的地方为无效语音。

进而，就可以根据语音中的静音点，将语音拆分得到多个有效语音。其中，有效语音是指包含用户输入的有效的语音。

2)查询与每个有效语音对应的字符串，得到语音对应的多个字符串。

具体的，根据预先存储的多个语音与字符串的对应关系，查找与每个有效语音对应的字符串，得到语音对应的多个字符串。

需要说明的一点是，在查询与每个有效语音对应的字符串时，应该参考前后有效语音查询得到的字符串的识别结果来提高查询与每个有效语音对应的字符串的准确度。

本实施例中，将语音转换成字符串是因为查找字符串对应的回答消息的准确度高于直接查找语音对应的回答消息的准确度。

s103、基于多个所述字符串确定所述语音对应的语种；

具体的，得到多个字符串后，每个字符串在进行保存时，是以一串数字的形式进行保存，如01110，查看每个字符串对应的数字所属的标准代码，其中，标准代码包括美国信息交换标准代码ascii码、unicode码等。

将得到的每个字符串对应的标准代码确定出来之后，由于每种语言对应的标准代码是不同的，进而就能够得到多个字符串对应的语种。

需要说明的是，上述确定语种的方法适用于用户的语音为同一种语种，如：如用户说的是英语或者是日语，上述确定语种的方法不适用于混合语音，如中英混合，i去吃饭了，即为中英文混合，在这种情况下，只要是确定有中文，就认为用户说的是汉语。

s104、查找与多个字符串对应的回答消息；其中，所述回答消息的语种与所述语音的语种相同；

其中，已经预先存储了多个不同的一串字符串对应的回答消息，此时只需要查找与本方案中的多个字符串对应的回答消息即可。

s105、输出回答消息。

可选的，在本实施例的基础上，步骤s105具体包括：

将回答消息显示在机器人的显示屏幕上，和/或，将回答消息语音输出。

具体的，将回答消息显示在机器人的显示屏幕上，即将回答消息显示在机器人的ui上。

此外，将回答消息语音输出，具体包括：

将回答消息分割成多个发音单位，为每个发音单位匹配一个音频数据，最后将多个音频数据进行组合，得到一段音频数据，进而将一段音频数据输出即可。可选的，可以通过机器人的麦克风输出。

本实施例中，通过采集用户输入的语音，对语音进行语音识别，得到语音对应的多个字符串，基于多个所述字符串确定所述语音对应的语种，并查找与多个字符串对应的回答消息以及输出回答消息的方式来实现人与机器人的多语种的沟通交流，进而使人与机器人的沟通交流方式更丰富。

可选的，在上述任一实施例的基础上，参照图2，步骤s104包括：

s201、将多个字符串翻译成中文短句；

具体的，将每个字符串通过机器人内置的翻译引擎翻译成中文词组，再将得到的多个中文词组按照字符串的排列顺序进行组合，得到中文短句。

其中，在将得到的多个中文词组按照字符串的排列顺序进行组合时，可以根据中文词组的前后中文词组的组合方式，适当性的调整每个字符串翻译得到的中文词组，使其得到的中文短句更通顺。

s202、采用匹配算法，查找与中文短句相匹配的中文回答消息；

具体的，数据库中保存有成对、一对多或者多对一的对话语句，其中，对话短句包含用户问句和数据库问句，将得到的中文短句与每个用户问句、数据库问句进行匹配，将匹配度最高的用户问句或者是数据库问句作为与中文短句相匹配的问题，进而查找与匹配度最高的用户问句或者是数据库问句相对应的答案即可，相应的答案即为与中文短句相匹配的中文回答消息。

s203、将中文回答消息翻译成回答消息。

具体的，通过机器人内置的翻译引擎，将中文回答消息翻译成回答消息即可。

本实施例中，可以通过将字符串翻译成中文短句，查找与中文短句相匹配的中文回答消息，并通过翻译中文回答消息的方式来得到回答消息。

可选的，本发明的另一实施例中提供了一种对话控制装置，应用于机器人，包括：

语音采集模块101，用于采集用户输入的语音；其中，所述语音为任一语种的语音；

语音识别模块102，用于对所述语音进行语音识别，得到所述语音对应的多个字符串；

语种确定模块103，用于基于多个所述字符串确定所述语音对应的语种；

查找模块104，用于查找与多个所述字符串对应的回答消息；其中，所述回答消息的语种与所述语音的语种相同；

语音输出模块105，用于输出所述回答消息。

可选的，进一步，所述语音识别模块102包括：

拆分子模块，用于根据所述语音中的静音点，将所述语音拆分得到多个有效语音；

查询子模块，用于查询与每个所述有效语音对应的所述字符串，得到所述语音对应的多个字符串。

可选的，进一步，还包括：

降噪处理模块，用于所述语音采集模块101采集用户输入的语音后，对所述语音进行降噪处理，得到降噪后的语音；

相应的，所述语音识别模块102用于对所述语音进行语音识别，得到所述语音对应的多个字符串时，具体用于：

对所述降噪后的语音进行语音识别，得到所述降噪后的语音对应的多个字符串。

可选的，进一步，所述语音输出模块105用于输出所述回答消息时，具体用于：

将所述回答消息显示在所述机器人的显示屏幕上；

和/或，将所述回答消息语音输出。

需要说明的是，本实施例中的各个模块的工作过程，请参照上述实施例中的相应部分，在此不再赘述。

可选的，在图3对应的实施例的基础上，参照图4，所述查找模块104包括：

第一翻译子模块1041，用于将多个所述字符串翻译成中文短句；

匹配查找子模块1042，用于采用匹配算法，查找与所述中文短句相匹配的中文回答消息；

第二翻译子模块1043，用于将所述中文回答消息翻译成所述回答消息。

本实施例中，可以通过将字符串翻译成中文短句，查找与中文短句相匹配的中文回答消息，并通过翻译中文回答消息的方式来得到回答消息。

需要说明的是，本实施例中的各个模块的工作过程，请参照上述实施例中的相应部分，在此不再赘述。

可选的，本发明的另一实施例中提供了一种机器人，包括：语音采集模块、处理器和语音输出模块；

其中，所述语音采集模块，用于采集用户输入的语音；其中，所述语音为任一语种的语音；

所述语音输出模块，用于输出所述回答消息。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许会山
技术所有人：上海思依暄机器人科技股份有限公司
我是此专利的发明人

上一篇：一种高效率的电动自行车车把荧光涂覆装置的制造方法
上一篇：陈列文化遗产用展示柜保护文化遗产的方法与流程