一种语音识别解锁方法、移动终端及存储器与流程

文档序号：17473010发布日期：2019-04-20 05:56阅读：331来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本申请涉及语音解锁领域，尤其涉及一种语音识别解锁方法、移动终端及存储器。

背景技术：

随着互联网的发展，移动终端的解锁方式多种多样，常见的有密码解锁、指纹解锁、人像解锁等，如今，语音解锁成为行业内的一种新兴的解锁模式。

现有技术中，通过语音解锁移动终端时，根据接收到的语音解锁指令获取用户录入的语音信息，将语音信息与提前预设的解锁语音匹配，如果匹配成功，则移动终端执行解锁操作，实现移动终端的语音解锁。

但是，由于现有技术中预设的解锁语音单一，通常为一个字符或一段话，从而用户在语音解锁时录入的语音单一，很容易被旁边的人听到，导致现有技术中移动终端的语音解锁安全性较低，从而严重影响移动终端的安全性。

技术实现要素：

为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种语音识别解锁方法、移动终端机存储器。

第一方面，本申请提供了一种语音识别解锁方法，包括：

接收语音解锁操作指令；

根据所述语音解锁操作指令，选取至少一个预设目标解锁语音中的其中一个生成对应的解锁标记；

获取用户录入的语音信息；

如果所述语音信息与所述解锁标记对应的预设目标解锁语音匹配，则执行解锁操作。

可选地，所述解锁标记包括所述预设目标解锁语音对应的语音标记，所述语音标记对应其中一个预设目标解锁语音。

可选地，所述解锁标记还包括语段标记，所述语段标记对应所述语音标记的其中一段。

可选地，所述解锁标记设置为语音播放信息或者语段显示信息，其中所述语音播放信息通过移动终端的播放器播放，所述语段显示信息通过移动终端的显示屏显示。

可选地，所述如果所述语音信息与所述解锁标记对应的预设目标解锁语音匹配，则执行解锁操作，包括：

判断所述语音信息与所述解锁标记对应的预设目标解锁语音是否形成完整的语义；

如果是，则控制移动终端解锁。

可选地，如果所述语音信息与所述解锁标记对应的预设目标解锁语音不匹配，所述方法还包括：

判断所述语音信息的语义正确率以及所述语音信息的声学特征与所述预设目标解锁语音的声学特征匹配率；

如果所述语义正确率及声学特征匹配率达到预设值，则控制移动终端解锁。

可选地，所述声学特征包括声波特征。

可选地，所述语义正确率和声学特征匹配率的预设值设置为80％-90％。

第二方面，本申请提供了一种移动终端，包括：处理器、存储器、通信接口和总线；其中，

所述处理器、存储器、通信接口通过所述总线完成相互间的通信；

所述通信接口用于外部设备之间的信息传输；

所述处理器用于调用所述存储器中的程序指令，以执行第一方面所述的语音识别解锁方法。

第三方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有显示控制程序，所述显示控制程序被处理器执行时实现如第一方面任一实施例所述的语音识别解锁方法的步骤。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点：

本申请实施例提供的该方法，包括移动终端接收语音解锁操作指令，根据所述语音解锁操作指令，选取至少一个预设目标解锁语音中的一个生成对应的解锁标记；且移动终端获取用户录入的语音信息；如果所述语音信息与所述解锁标记对应的预设目标解锁语音匹配，则执行解锁操作。本申请实施例提供的语音识别解锁方法，通过录入多个预设目标解锁语音，当需要语音解锁时，选取其中一个与录入的语音信息匹配，从而降低录入语音信息被窃取后导致的安全性问题。另外，在接收到语音解锁操作指令时，生成解锁标记，用户根据解锁标记的提示输入语音信息，相比现有技术中直接输入录音的方式，在输入录音时有了更多样的选择，减少单一录音方式带来的安全性低的问题，从而提高了语音解锁的安全性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种语音识别解锁方法流程示意图；

图2为本申请实施例提供的一种语音解锁模式设置场景示意图；

图3为本申请实施例提供的另一种语音识别解锁方法流程示意图；

图4为本申请实施例提供的一种场景应用图；

图5为本申请实施例提供的又一种语音识别解锁方法流程示意图；

图6是本发明实施例提供的移动终端的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

现有技术中，在进行语音解锁时，录入的语音信息单一，容易被周围的人窃听，导致移动终端的安全性较低，一旦手机被盗取后，很容易通过窃取到的语音信息解锁移动终端，盗取移动终端中的重要信息。本申请实施例可有效解决上述问题，具体参考下述实施例。

实施例一

参见图1，图1为本申请实施例提供的一种语音识别解锁方法流程示意图。

在步骤s100中，接收语音解锁操作指令。

语音解锁操作指令对应用户的语音解锁操作，本申请实施例中，语音解锁操作可设置为按键操作或手势操作，当用户按压或者触摸移动终端的按键，或者按照预设手势在移动终端的显示屏上滑动时，移动终端监测到上述操作，生成语音解锁操作指令。

以按键操作为例，用户将移动终端提前设置为语音解锁模式，当按压移动终端的功能键或者开机键时，唤醒移动终端的显示屏，但是移动终端仍处于待解锁状态，无法处理其它操作。此时，移动终端根据监测到的按键操作，生成语音解锁操作指令，处理器根据语音解锁操作指令唤醒移动终端的显示屏，显示出相应的语音解锁操作界面。语音解锁操作指令可设置为字符串指令，字符串的串头字符可用于标识语音解锁操作为按键操作，还是手势操作。

例如，语音解锁操作界面上可设置录音虚拟键，方便用户执行下一步语音解锁操作。如果语音解锁成功，则移动终端显示主页界面，如果语音解锁失败，则移动终端依然显示语音解锁操作，提示用户解锁失败。

在步骤s200中，根据语音解锁操作指令，选取至少一个预设目标解锁语音中的其中一个生成对应的解锁标记。

本申请实施例中，在设置移动终端的语音解锁模式时，预先设定目标解锁语音，并设置至少一个目标解锁语音，目标解锁语音相当于口令，用户需要在解锁时，录入语音信息与目标解锁语音匹配。

由于在设置语音解锁模式时，录入了至少一个目标解锁语音，因此，在接收到语音解锁指令时，需要指定其中一个目标解锁语音作为对比口令。本申请实施例中，在选取其中一个预设目标解锁语音的同时，生成对应的解锁标记。

解锁标记包括与预设目标解锁语音对应的语音标记，也就是说，在语音解锁模式中，每一个预设目标解锁语音对应一个语音标记。例如：在语音解锁模式中，录入三个预设目标解锁语音，分别为“床前明月光，疑是地上霜”、“你好，请解锁”、“hello，unlock，please”，同时，设置三个预设目标解锁语音的语音标记为“明月”、“你好”、“hello”。

一种实施方式中，相应的解锁标记包括语音标记，那么解锁标记为“明月”、“你好”、“hello”，用户需要根据解锁标记录入语音信息。如果选取预设目标解锁语音“床前明月光，疑是地上霜”作为口令，那么相应的解锁标记为“明月”。解锁标记可根据用户的使用习惯或记忆习惯，自行设置，因此解锁标记不限于“明月”、“你好”、“hello”，也可以是相关联的其它标记词汇，当然也可以是1、2、3这样的简单标记，在此不做限定。

另一种实施方式中，解锁标记还可以包括语段标记，也就是解锁标记为语音标记+语段标记，语段标记对应语音标记的其中一段，例如，语音标记为“明月”，那么语段标记对应“床前明月光，疑是地上霜”的其中一段，可以为第一段或第二段，其中第一段和第二段可分别用数字1、2表示，所以，解锁标记可表示为“明月+1”或“明月+2”。

语音标记+语段标记的表现形式不作为本申请的限定，用户可根据习惯或者记忆使用其它具有标记功能的表示方法，用户可在设置语音解锁模式时，自行设置解锁标记，当然也可以在移动终端中设定解锁标记模板，由用户根据模板设置语音标记和语段标记的词汇选择。解锁标记可以为“明月+1”“明月+a”“月光a”等多种形式。

参见图2，为本申请实施例提供的一种语音解锁模式设置场景示意图。如图2所示，打开语音解锁模式界面，在界面中属于预设目标解锁语音的语义，同时录入语音，在解锁标记处输入自定义的解锁标记。

本申请实施例中，解锁标记可设置为语音播放信息或者语段显示信息。如果解锁标记为语音播放信息，那么在触发语音解锁操作后，移动终端播放解锁标记，用户听到解锁标记后，根据指令录入语音信息；如果解锁标记为语段显示信息，那么解锁标记显示在语音解锁界面，用户在显示屏上看到语段显示信息后，根据解锁标记录入语音信息。

在步骤s300中，获取用户录入的语音信息。

由上述步骤可知，用户需要根据解锁标记录入语音信息。如果在语音解锁界面显示“明月”解锁标记，那么用户需要向移动终端录入“明月”对应的预设解锁语音“床前明月光，疑是地上霜”。同理，如果通过移动终端的播放器听到解锁标记“明月”，用户需要根据“明月”录入语音信息。

用户通过移动终端的音频输入模块输入语音信息，音频输入模块为麦克风，麦克风可采集用户录入的语音信息，并将语音信息通过编码发送至处理器处理。

在步骤s400中，如果所述语音信息与所述解锁标记对应的预设目标解锁语音匹配，则执行解锁操作。

用户输入的语音信息经过处理，生成处理器可识别的特征编码，同理，解锁标记对应的预设目标解锁语音也经过处理生成特征编码，在对比语音信息和预设目标解锁语音时，可将两者进行匹配对比。特征编码的格式在此不做限定，如果匹配成功，则唤醒处理器及其它功能模块工作，移动终端进入工作状态，用户可在移动终端上实现多种操作。

移动终端解锁后，对于多次语音解锁过程中，每个预设目标解锁语音的匹配成功率进行统计。在下次语音解锁过程中选取预设目标解锁语音时，可选取匹配成功率低的预设目标解锁语音生成解锁标记，选取匹配成功率低的预设目标解锁语音可以锻炼用户语音解锁的熟练度，反复对不熟悉的预设目标解锁语音进行练习，使每个预设目标解锁语音的匹配成功率均提升，保证每次语音解锁的成功率，同时使用户语音解锁更加熟练，加速语音解锁。

由上述描述可知，本申请实施例中，根据语音解锁操作指令，选取至少一个预设目标解锁语音中的其中一个生成对应的解锁标记，所以，本申请实施例中需要在移动终端中预设至少一个预设目标解锁语音，用户在语音解锁时，选取不同的预设目标解锁语音生成解锁标记，那么用户输入的语音信息便不同，降低周边陌生人窃取语音解锁信息的可能性。另外，不同解锁标记对应不同的预设目标解锁语音，同时对应用户输入不同的语音信息，如果周边陌生人只是听到了语音信息，但是对应不上解锁标记，依然无法解锁手机，因此进一步提升了移动终端的安全性。

实施例二

参见图3，图3为本申请实施例提供的另一种语音识别解锁方法流程示意图。

由上述实施例可知，解锁标记可包括语音标记和语段标记，语音标记对应预设目标解锁语音，语段标记对应预设目标解锁语音的其中一个语段。本申请实施例以解锁标记包括语音标记和语段标记为前提，在获取到用户录入的语音信息后，语音信息与解锁标记对应的预设目标解锁语音匹配方法如下：

在步骤s401中，判断语音信息与所述解锁标记对应的预设目标解锁语音是否形成完整的语义。

在获取到用户录入的语音信息后，由于解锁标记包括语音信息和语段信息，因此，需要判断语音信息与解锁标记对应的预设目标解锁语音是否形成完整语义。

也就是说，解锁标记中语音标记对应第一预设目标解锁语音，语段标记对应第一预设目标解锁语音的第一语段，那么，用户需要录入第一预设目标解锁语音的第二语段，使第一语段和第二语段形成完整的语义。参见图4，为本申请实施例提供的一种场景应用图，如图4所示，在移动终端的语音解锁界面上显示“明月+1”，在此对解锁标记的表现形式不做具体限定。

解锁标记为“明月+1”，对应“床前明月光，疑是地上霜”的第一语段“床前明月光”，如果用户录入的语音信息对应“疑是地上霜”，那么便形成完整的语义。

同理，如果解锁标记为“明月+2”，则对应“床前明月光，疑是地上霜”的第二语段“疑是地上霜”，用户录入语音信息对应“疑是地上霜”便形成完整语义。

本申请实施例中，解锁标记可以为语音播放信息或者语段显示信息，最优选的解锁标记为语段显示信息，也就是在语音解锁界面上显示解锁标记，用户看到语音解锁界面上的解锁标记后，长按界面上的录音虚拟键录入语音信息，判断语音信息与解锁标记对应的语段是否形成完整语义。

解锁标记设置为语段显示信息，可防止周边的人将解锁标记与用户输入的语音信息匹配，从而防止移动终端被其它人解锁，提升移动终端的安全性。

在步骤s402中，如果是，则控制移动终端解锁。

如果语音信息与解锁标记对应的语段信息形成完整的语义，那么控制移动终端解锁。此处的完整语义，并不等于常规认知中的完整语义，也可以是用户自设的语义，用户可以将两个完全不相干的语句拼接在一起形成一个预设目标解锁语音，那么该预设目标解锁语音对应的语义就是一个完整的语义。

为了防止移动终端被解锁，用户可设置非常见的语段组合，增大语音解锁难度。

由上述描述可知，本申请实施例中，解锁标记设置为语音标记和语段标记的结合，使用户在语音解锁过程中，通过解锁标记，录入预设目标解锁语音的其中一个语段，并对语音信息与解锁标记对应的语段信息进行匹配，如果形成完整语义，那么移动终端解锁。本申请实施中，可生成多个解锁标记，同时解锁标记中的语段标记可对应多个语段，增加了语音信息录入的多样性，降低语音信息被听取后导致的安全性问题，保护用户的信息安全。

实施例三

参见图5，图5为本申请实施例提供的又一种语音识别解锁方法流程示意图。

在步骤s401中，判断语音信息与解锁标记对应的预设目标解锁语音是否形成完整的语义。

在步骤s402中，如果是，则控制移动终端解锁。

在步骤s403中，判断语音信息的语义正确率以及语音信息的声学特征与预设目标解锁语音的声学特征匹配率。

结合实施例二，本申请实施例中，如果语音信息与解锁标记对应的预设目标解锁语音没有形成完整的语义，那么判断语音信息的语义正确率以及语音信息的声学特征与预设目标解锁语音的声学特征匹配率。

在实际语音解锁过程中，如果当前的环境比较嘈杂，例如高铁上、地铁中或者马路上，由于环境比较乱、杂音多，导致用户录入的语音信息中掺杂其它的声音，导致语音信息与解锁标记对应的语段匹配率低，从而无法形成完整的语义，降低了语音解锁的正确率。

因此，本申请实施例中，如果语音信息与解锁标记对应的预设目标解锁语音没有形成完整的语义，可以计算语音信息的语义正确率。在将获取到的语音信息翻译成语义信息后，对比预设目标解锁语音，逐字对比语音信息对应的语义信息与预设目标解锁语音对应的语义信息，根据对比结果计算正确率。例如，在十个字中，有八个字与预设目标解锁语音对应的语义相同，那么正确率便是80％。

同时，在确定语音信息语义正确率的基础上，判断目标解锁语音的声学特征匹配率。其中，声学特征包括声波特征、声音的频率、波长等特征信息。

在语音信息语义正确率的基础上，计算语音信息的声学特征与预设目标解锁语音的声学特征匹配率，可以保证再嘈杂的环境下语音信息被污染后，可以通过声学特征判断是否为用户录入的语音信息，增加语音解锁的准确率。

在步骤s404中，如果所述语义正确率及声学特征匹配率达到预设值，则控制移动终端解锁。

本申请实施例中，语义正确率和声学特征匹配率的预设值设置为80％-90％。语义正确率达到预设值后，再判断声学特征匹配率是否达到预设值。语义正确率达到预设值时，表明当前环境下获取到的语音信息基本正确，再通过声波特征判断用户的声波与预设目标解锁语音的声波匹配率，使语音信息的语音匹配要求降低，通过声波特征弥补嘈杂环境下语音信息的缺陷。

另外，通过语义和声学双重特征的匹配，可以增加语音解锁的成功率，同时也避免其它人在知道语音解锁的语义时解锁移动终端，进一步增加语音解锁的安全性。

本申请实施例中，用户在语音解锁模式下设置预设目标解锁语音时，同时记录预设目标解锁语音的语义信息和声学特征信息，也就是记录用户输入的预设目标解锁语音的声波特征，以便在获取到用户输入的语音信息时，同时匹配语义和声波特征。

由上述描述可知，本申请实施例中，在获取到用户录入的语音信息后，同时匹配语音信息的语义正确率和声学特征匹配率，有效保证语音信息的语义以及声波是否符合用户的声波特征，防止在其它人录入正确语义的语音信息后解锁移动终端，进一步增加移动终端中信息的安全性。

本申请实施例还提供了一种移动终端，参见图6，图6是本发明实施例提供的移动终端的结构示意图。图6所示的移动终端900包括：处理器901、存储器902、总线904和通信接口903。移动终端900中的各个组件通过总线系统耦合在一起。可理解，总线904用于实现这些组件之间的连接通信。总线904除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图6中将各种总线都标为总线904。

其中，通信接口903可以包括显示器、键盘或者点击设备(例如，鼠标，轨迹球(trackball)、触感板或者触摸屏等。处理器901用于调用存储器902中的程序指令，以执行如上各方法实施例所提供的方法，例如包括：接收语音解锁操作指令；根据所述语音解锁操作指令，选取至少一个预设目标解锁语音中的其中一个生成对应的解锁标记；获取用户录入的语音信息；如果所述语音信息与所述解锁标记对应的预设目标解锁语音匹配，则执行解锁操作。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有显示控制程序，所述显示控制程序被处理器执行时实现如前述任一方法实施例所述的语音识别解锁方法的步骤。例如包括：接收语音解锁操作指令；根据所述语音解锁操作指令，选取至少一个预设目标解锁语音中的其中一个生成对应的解锁标记；获取用户录入的语音信息；如果所述语音信息与所述解锁标记对应的预设目标解锁语音匹配，则执行解锁操作。

在具体实施过程中，存储器902中存储至少一个预设目标解锁语音，处理器901接收到用户录入的语音信息后，将语音信息翻译成语义信息，并于解锁标记对应的语段信息匹配，判断是否形成完整语义。

用户通过移动终端的交互界面输入预设目标解锁语音的语音和录音，并存储在存储器中，在接收到语音解锁操作指令时，从存储器中选择其中一个预设目标解锁语音的解锁标记。在存储器中，预设目标解锁语音与解锁标记打包存储。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits，asic)、数字信号处理器(digitalsignalprocessing，dsp)、数字信号处理设备(dspdevice，dspd)、可编程逻辑设备(programmablelogicdevice，pld)、现场可编程门阵列(field-programmablegatearray，fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，各器件的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张飞
技术所有人：努比亚技术有限公司
我是此专利的发明人

上一篇：一种多点多向触控操作系统及方法与流程
上一篇：一种偏位杆件双球铰转向连接器的制作方法