一种适用于无人机的语音控制方法

文档序号:8543083阅读:1276来源:国知局
一种适用于无人机的语音控制方法
【技术领域】
[0001]本发明涉及智能机器人的远程遥控技术领域,更具体地,涉及一种适用于无人机的语音控制方法。
【背景技术】
[0002]无人机是一种有动力、可控制、能携带多种任务设备、执行多种作战任务并能重复使用的无人机战术飞行器。由于其零伤亡风险和高机动性等优势引起了各国军方的高度重视。无人机飞行过程分为起飞、高空飞行和降落三个部分,高空飞行阶段周围环境相对稳定,无需对飞机的飞行速度和姿态做太多调整,所以依靠车内测控台通过GPS导航就能够满足。但是在起飞和降落阶段无人机的速度变化大、姿态调整频繁、降落场地也比较复杂所以对无人机的控制系统要求很高。现阶段无人机普遍采用测控车外遥控器的方式,让经验丰富的飞行人员通过观察来控制无人机,从而满足起飞、降落阶段对控制系统实时性、机动性、高度复杂性的要求。
[0003]无人机的研宄和发展正在全世界范围内掀起高潮。无人机的遥控方式主要分为手动遥控、超视距遥控和半自主/自主控制。超视距遥控是指地面操作人员根据无人机传送回来的云台拍摄图像和飞行姿态信号操控无人机。
[0004]然而,无人机控制方式多为遥控控制,其需要根据无人机发回的诸多参数由遥控人员自行判断是否适合于发送控制指令。然而,这种方式需要使得无人机能够随时,或者是在关键时刻,能够发回其自身的飞行参数和工作状态信息;其次,这种方式过于依赖遥控人员的经验,一旦反应较慢,则无人机在遇险情况下可能发生故障甚至坠毁。这些或者不可靠或者不确定的因素不利于飞行任务的成功完成。

【发明内容】

[0005]为了提供智能化的无人机遥控方式同时减少上述现有技术中的不可靠和不确定因素,本发明提供了一种适用于无人机的语音控制方法,包括:
[0006](I)遥控装置接收语音指令;
[0007](2)将语音指令发送到无人机的控制单元;
[0008](3)无人机的控制单元将语音指令分解成若干个单独动作的指令;
[0009](4)无人机控制单元对所述若干个单独动作的指令进行预演;
[0010](5)无人机根据预演结果,向遥控装置提供反馈信息。
[0011]进一步地,所述步骤(I)包括:
[0012](1.1)遥控装置进行人脸识别并进行声纹识别;
[0013](1.2)根据人脸识别的结果,判断是否接收语音。
[0014]进一步地,所述步骤(1.2)包括:如果通过人脸识别,则对接收到的语音进一步判断是否为具有语音控制的权限的语音,确定该语音所对应的权限,并进行语音识别。
[0015]进一步地,所述步骤(2)包括:通过无线数传单元将语音指令发送到无人机的通信单元,该通信单元再将语音指令的安全性验证,并在通过验证后将语音指令传送到无人机的控制单元。
[0016]进一步地,所述步骤(3)包括:识别语音指令中包括特定间隔符,并根据这种间隔符把语音指令分解成若干个单独动作的指令。
[0017]进一步地,所述把语音指令分解成若干个单独动作的指令包括:根据各种语音指令的预设运行时间,为各单独动作的指令之间分配间隔时间。
[0018]进一步地,所述步骤(4)包括:无人机控制单元为每个单独动作的指令检测相应执行部件的关联状态,并判断语音执行指令是否可行。
[0019]进一步地,所述检测相应执行部件的关联状态包括:
[0020]判断相应执行部件的种类;
[0021]根据相应执行部件的种类,判断是否需要检测相应执行部件的关联状态:如果不需要,则直接判断该语音执行指令可行。
[0022]进一步地,所述关联状态包括:所述关联状态包括:无人机的控制单元获得飞行速度、飞行高度、飞行轨迹与周围障碍物之间的距离。
[0023]进一步地,所述步骤(5)包括:无人机控制单元通过以预设的时间长度延长语音指令之间的间隔进行第二次预演,然后根据第二次预演的结果,向遥控装置提供反馈其发出的语音指令是否可行的信息。
[0024]本发明的有益效果是:去掉了无人机需要确保对其自身飞行参数和工作参数的高可靠传输要求,同时能够智能地估计可行的方案并自动地执行,大大提高了无人机遥控的效率。此外,通过语音识别技术,本发明还增强了无人机遥控的安全性。
【附图说明】
[0025]图1示出了根据本发明的适用于无人机的语音控制方法的流程框图。
【具体实施方式】
[0026]如图1所示,根据本发明的优选实施例,适用于无人机的语音控制方法包括如下步骤:
[0027](I)遥控装置接收语音指令;遥控装置包括声纹模型库和人脸数据库。该步骤包括:
[0028](1.1)遥控装置进行人脸识别并进行声纹识别。
[0029]人脸识别时,人脸数据库中预先保存有人脸信息(例如通过红外信号检测人脸图像并留存人眼间隔、人眼长度等生理特征),在采集时,通过红外信号采集到人脸数据与人脸数据库中的数据作比较。如果通过人脸识别,则对接收到的语音进一步判断是否为具有语音控制的权限的语音,确定该语音所对应的权限,并进行语音识别。
[0030](1.2)根据人脸识别的结果,判断是否接收语音。
[0031]声纹识另Ij(Voiceprint Recognit1n, VPR),也称为说话人识别(SpeakerRecognit1n),有两类,S卩说话人辨认(Speaker Identificat1n)和说话人确认(SpeakerVerificat1n)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术。本发明中,声纹模型库采用高斯模型,具有允许进行语音控制的人员的声纹特征信息。每位具有发出语音控制指令的人员均上传一段训练语音,该训练语音被通过最大似然方法对语音进行训练,进而得到声纹库。
[0032]进行声纹比较时,语音指令发出者发出语音指令,该语音指令被与声纹数据库进行声纹对比。语音指令中如果包括多条单独执行一个动作的语音指令,则要在多个动作的语音指令之间增加特定间隔符的语音,例如英文字母“O”的发音。优选地,该间隔不超过3秒
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1