用户设备及其语音控制方法_3

文档序号：8398252阅读：来源：国知局

息的声纹特征与声纹特征库内的预设声纹相匹配时，也可以直接执行步骤S204’，而在不匹配时则执行S204’ ’，在此不作限定。
[0055]步骤S203，判断语音输入信息是否为预设的问候式语音，在判断为预设的问候式语音时执行步骤S204’，在判断不为预设的问候式语音时则执行步骤S204’ ’。
[0056]步骤S204’，接通通话呼入，并将语音输入信息发送给通话呼入的对方。
[0057]步骤S204’ ’，拒接通话呼入。
[0058]本实施例的步骤S203、步骤S204’和步骤S204’ ’的具体实现过程还请参阅前面实施例对应的步骤S102、步骤S103’和步骤S103’’的相关描述，在本技术领域人员容易结合理解的范围内，不作赘述。
[0059]值得一提的是，在拒接通话呼入后，本实施例也可以将语音输入信息以邮件、视频或者短信息的方式发送给通话呼入的对方，而避免直接拒接所引起的纠纷、误会等麻烦，在此不作细述。
[0060]需要说明的是，在通话呼入的过程中，用户随时可以进行手动操作而取代语音控制的方式，本实施例实现了手动操作和语音控制的自动切换功能。
[0061]相对于前面实施例而言，本实施例在可进行语言控制的基础上，进一步针对语言控制的权限进行限定，在实现用户设备智能化的同时，提高了安全性能，避免非用户设备的持有者有意/无意对用户设备进行误操作，从而避免不必要的麻烦。
[0062]请参阅图3，图3是本发明实施例提供的用户设备语音控制方法的第三实施例流程示意图，本实施例语音控制方法包括但不限于以下几个步骤。
[0063]步骤S301，在收到对方的通话呼入时，用户设备录取本方的语音输入信息。
[0064]本实施例步骤S301请参阅前面实施例步骤SlOl的相关描述，在此不作赘述。
[0065]步骤S302，获取语音输入信息中的语音特征向量。
[0066]在步骤S302中，还可以预先对语音输入信息进行端点检测、去除多余的静音和非用户式语音(譬如机器发音、混杂噪音等)；接着，对语音输入信息进行降噪及特征分析等，以获取语音特征向量。其中，在本技术领域人员理解的范围内，不对其具体实现过程进行描述和限定。
[0067]步骤S303，利用存储于本地和/或网络端的声学模型和/或语言模型对语音特征向量进行识别以提取用于指代对方名称的文本信息，并从本地查找与通话呼入相对应的预存储名称。
[0068]在步骤S303中，用户设备可以智能地识别提取到常用的名称字符段的文本信息，譬如“李XX”、“小张”、“Green”等表示名称的文本信息。需要说明的是，如果通话呼入的号码等未预先存储于本地的通讯录等，可以默认为匹配或者不匹配进行处理，用户可以自行设定，在此不作限定。
[0069]步骤S304，判断对方名称与预存储名称是否匹配，在判断对方名称与预存储名称相匹配时执行步骤S305，在判断对方名称与预存储名称不匹配时提示本方名称错误、拒接通话呼入或保持通话呼入。
[0070]步骤S305，判断语音输入信息是否为预设的问候式语音，在判断为预设的问候式语音时执行步骤S306’，在判断不为预设的问候式语音时则执行步骤S306’ ’。
[0071]步骤S306’，接通通话呼入，并将语音输入信息发送给通话呼入的对方。
[0072]步骤S306’ ’，拒接通话呼入。
[0073]本实施例的步骤S305、步骤S306’和步骤S306’ ’的具体实现过程还请参阅前面实施例对应的步骤S102、步骤S103’和步骤S103’’的相关描述，在本技术领域人员容易结合理解的范围内，不作赘述。
[0074]值得一提的是，在拒接通话呼入后，本实施例也可以将语音输入信息以邮件、视频或者短信息的方式发送给通话呼入的对方，而避免直接拒接所引起的纠纷、误会等麻烦，在此不作细述。
[0075]需要说明的是，在通话呼入的过程中，用户随时可以进行手动操作而取代语音控制的方式，本实施例实现了手动操作和语音控制的自动切换功能。
[0076]本实施例通过对通话呼入的对方名称进行判断，可以防止用户误判到错误的对方，譬如在一般情况下，用户约好小张在时间段A去开会，而在时间段A由于用户忙而没法看用户设备，此时按直觉去称呼“小张”可能就出现尴尬；或者用户已到目的地，而觉得无需接通，而拒接了来自重要客户、人物的紧急电话，发生不必要的麻烦。本实施例进一步提高了语音控制的智能化，防止不必要的错误发生，改善用户体验。
[0077]请结合前面实施例参阅图4，图4是本发明实施例提供的用户设备第一实施例的结构框图，本实施例用户设备包括但不限于录取模块41、判断模块42、呼入处理模块43和发送模块44。
[0078]需要说明的是，本实施例的用户设备可以为手机、平板电脑、笔记本电脑或台式电脑等，其中，可以在平板电脑、笔记本电脑或台式电脑等安装预定的通话软件，在此不作细述。
[0079]在本实施例中，录取模块41用于在收到对方的通话呼入时，录取本方的语音输入信息。
[0080]为了自动/智能实现语音控制以录取语音输入信息，录取模块41可以判断是否开启了 “语音控制功能”，也可以在通话呼入时自动触发并录取语音输入信息，当然，也可以根据用户在预定时间段内未进行任何操作而启动“语音控制功能”而录取模块41进行录取语音输入信息等，在本技术领域人员容易理解的范围内，不作细述。不难看出，本实施例可以在很多应用场景下，譬如手部有水分、手部戴有手套、寒冷天气不便动手操作等，或者用户设备不在手边、面临危险境地而没法接触使用用户设备时自动/智能地启动“语音控制功能”，以对通话呼入进行操作。
[0081]值得注意的是，在其他实施例中，本实施例录取模块41还可以在非通话呼入状态下进行语音控制。譬如用户在需要通话呼出、短信息发送或者邮件发送等情况下进行语音控制，这个过程中，用户可以通过预先设定的特定语音输入信息来“启动”通话呼出功能、短信息发送功能或者邮件发送功能，接着通过语音进行输入和发送等操作，在此不作限定。
[0082]判断模块42用于判断录取模块41录取的语音输入信息是否为预设的问候式语曰?
[0083]用户设备需要预先设置或存储语义模型，以使得判断模块42根据语义模型判断语音输入信息的语义。具体而言，用户可以根据应用场景和场景动作，进行学习并训练语义模型，接着将语义模型预存储于本地和/或网络端；接着判断模块42可以根据语音输入信息从预存储于本地和/或网络端的语义词库查找对应的语义模型，根据语义模型判断语音输入信息是否为预设的问候式语音。如图5所示，本实施例判断模块42具体可以包括查找单元421和判断单元422。其中，查找单元421用于根据录取模块41录取的语音输入信息从预存储于本地和/或网络端的语义词库查找对应的语义模型；接着，判断单元422，用于根据查找单元421查找的语义模型判断语音输入信息是否为预设的问候式语音。其中，本实施例判断模块42可以采用“云识别”等技术进行语义判断，以提高识别准确率。
[0084]举例而言，预设的问候式语音可以包括“你好”、“嗨”、“hello”、“晚上好”、“早上好”和“很高兴接到你的电话”等表示问候式(或示好式)的语音段，当然，还可以具体包括对方的称呼、昵称或其他语音段，在此不作限定。其中，用户不需要记忆和学习用户设备内规定的语音指令，而可以根据个人习惯对语义模型进行个性化设置，实现自然语境、语义的生成和匹配，提高了智能度。
[0085]此外，非预设的问候式语音可以包括委婉式语音，譬如包括“抱歉”、“不好意思”、“我很忙” “我待会给你回复”和“现在不方便接电话”等表示歉意的语音段；在其他实施例中，非预设的问候式语音还可以根据声音的分贝大小进行判断，譬如高于80分贝，表示用户不开心、生气等情绪，此时也可以表示拒接等。此时，呼入处理模块43在判断模块42判断语音输入信息为预设的委婉式语音时，拒接通话呼入。
[0086]需要说明的是，在特殊的情况下，无论是通话呼入或呼出，如果判断模块42判断类似于“救命”、“着火啦”和“help”等特殊语音，则可以直接接通通话呼入或者对特定的号码进行通话呼出，譬如直接拨打“110”、“ 120”以及“ 122”等，在此不作细述。
[0087]呼入处理模块43用于在判断模块42判断语音输入信息为预设的问候式语音时，接通通话呼入；且发送模块44在呼入处理模块43接通通话呼入时，将语音输入信息发送给通话呼入的对方。此外，呼入处理模块43在判断模块42判断语音输入信息不为预设的问候式语音

完整全部详细技术资料下载

当前第3页1 2 3 4 5