用于语音和视频通讯的交互控制方法及装置的制造方法

文档序号:9452748阅读:452来源:国知局
用于语音和视频通讯的交互控制方法及装置的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域,尤其涉及一种用于语音和视频通讯的交互控制方法及装置。
【背景技术】
[0002]随着互联网技术的快速发展,即时通讯IM(Instant messaging)工具(例如微信、QQ等)越来越多应用于人们的生活和工作中,頂工具(頂软件)已成为人们和生活中的一种常用交流工具。在使用IM软件的过程中,用户可通过文字、语音和视频等方式与m好友或聊天群进行交流。
[0003]在用户通过视频的方式与好友聊天的过程中,如果用户需要执行某些操作,用户的通常做法是手动执行对应的操作。例如,用户需要调整视频窗口的大小,此时,用户需要操作鼠标来调整视频窗口的大小。再例如,用户需要远端聊天用户帮忙挑选最美的图片,图片存放在远端云上,则只能本地先将远端图片下载后,传输给聊天用户,聊天用户接收图片传输,点击查看,然后再将选择结果告诉用户。
[0004]然而,在视频通讯的过程中,有时用户会出现不方便手动执行某些操作的情况,由于现有的交互控制方式比较单一,用户在视频通讯过程中,无法解放双手,用户的交互体验并不理想。

【发明内容】

[0005]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本发明的一个目的在于提出一种用于语音和视频通讯的交互控制方法,该方法使得用户在语音/或视频通讯的过程中,通过语音和/或手势方式即可控制终端执行其他操作,避免了用户手动操作的麻烦,提高了用户的交互体验。
[0007]本发明的第二个目的在于提出一种用于语音和视频通讯的交互控制装置。
[0008]为达上述目的,本发明第一方面实施例提出了一种用于语音和视频通讯的交互控制方法,包括:获取用户通过预设方式输入的用户行为数据,其中,所述预设方式包括语音方式和/或手势方式;确定所述用户行为数据中是否包含预设的触发信息;若判断获知包含所述触发信息,则确定在预设的操作指令集中与所述触发信息对应的操作指令,并执行所述操作指令对应的事件。
[0009]本发明实施例的用于语音和视频通讯的交互控制方法,获取用户通过语音方式和/或手势方式输入的用户行为数据,确定用户行为数据中是否包含预设的触发信息,以及在判断获知包含触发信息时,确定在预设的操作指令集中与触发信息对应的操作指令,并执行操作指令对应的事件,由此,使得用户在语音/或视频通讯的过程中,通过语音和/或手势方式即可控制终端执行其他操作,避免了用户手动操作的麻烦,提高了用户的交互体验。
[0010]为达上述目的,本发明第二方面实施例提出了一种用于语音和视频通讯的交互控制装置,包括:获取模块,用于获取用户通过预设方式输入的用户行为数据,其中,所述预设方式包括语音方式和/或手势方式;判断模块,用于确定所述用户行为数据中是否包含预设的触发信息;处理模块,用于在判断获知包含所述触发信息时,确定在预设的操作指令集中与所述触发信息对应的操作指令,并执行所述操作指令对应的事件。
[0011]本发明实施例的用于语音和视频通讯的交互控制装置,通过获取模块获取用户通过语音方式和/或手势方式输入的用户行为数据,判断模块确定用户行为数据中是否包含预设的触发信息,以及在判断获知包含触发信息时,处理模块确定在预设的操作指令集中与触发信息对应的操作指令,并执行操作指令对应的事件,由此,使得用户在语音或视频通讯的过程中,通过语音和/或手势方式即可控制终端执行其他操作,避免了用户手动操作的麻烦,提高了用户的交互体验。
【附图说明】
[0012]图1是本发明一个实施例的用于语音和视频通讯的交互控制方法的流程图。
[0013]图2是本发明另一个实施例的用于语音和视频通讯的交互控制方法的流程图。
[0014]图3是本发明另一个实施例的用于语音和视频通讯的交互控制方法的流程图。
[0015]图4是本发明另一个实施例的用于语音和视频通讯的交互控制方法的流程图。
[0016]图5是本发明另一个实施例的用于语音和视频通讯的交互控制方法的流程图。
[0017]图6是本发明一个实施例的于语音和视频通讯的交互控制的结构示意图。
【具体实施方式】
[0018]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0019]下面参考附图描述本发明实施例的用于语音和视频通讯的交互控制方法及装置。
[0020]图1是本发明一个实施例的用于语音和视频通讯的交互控制方法的流程图。
[0021]如图1所示,该用于语音和视频通讯的交互控制方法包括:
[0022]S101,获取用户通过预设方式输入的用户行为数据。
[0023]其中,预设方式包括语音方式和/或手势方式。
[0024]具体地,在用户与其他一个或者多个用户进行语音通话的过程中,为了能够根据用户输入的语音数据执行一些操作,可对用户输入的语音数据进行监控。
[0025]另外,在用户与其他一个或者多个用户进行视频通话的过程中,为了能够根据用户输入的语音数据或者手势动作执行一些操作,在对用户输入的语音数据进行监控的同时,还可以对终端的摄像头进行监控,以便根据摄像头所获得的视频信息中获得用户输入的手势动作。
[0026]S102,确定用户行为数据中是否包含预设的触发信息。
[0027]为了减少对用户正常语音或者视频通话的影响,在用户需要终端自动根据自己输入的语音或者手势自动执行一些操作时,用户可通过输入一些触发应用程序控制终端执行一些操作的触发词或者触发动作,应用程序获取用户在触发词或者触发动作之后,后续输入的语音或者手势动作,并根据语音或者手动动作执行一些操作。
[0028]其中,触发信息可以包括但不限于触发词、动作操作词、关键字、触发手势动作和手势动作。
[0029]在本发明的一个实施例中,若监控到用户通过语音方式输入用户行为数据,可判断用户行为数据中是否包含预设的触发词,若判断获知包含触发词,则进一步判断用户行为数据中是否包含预设的动作操作词。应当理解的是,此时的用户行为数据即为语音数据。
[0030]另外,在用户通过视频通话方式进行聊天的过程中,可通过摄像头获取用户输入的用户行为数据,在获得用户行为数据后,可判断用户行为数据中是否包含预设的触发手势动作,若判断获知包含触发手势动作,则进一步判断用户行为数据中是否包含预设的手势操作。
[0031]S103,若判断获知包含触发信息,则确定在预设的操作指令集中与触发信息对应的操作指令,并执行操作指令对应的事件。
[0032]其中,需要理解的是,触发信息、操作指令与事件之间的对应关系是预先保存的。
[0033]例如,在用户A与用户B进行视频通话的过程中,假定触发应用程序根据用户输入的语音数据执行一些操作的预留语音指令(触发词)为“X语音助手”,即在用户输入的语音数据中包含“X语音助手”后,可对语音数据中“X语音助手”之后的语音数据进行识别,以确定在用户输入的“X语音助手”之后的语音数据中是否包含预设的动作操作词。假定获得到用户当前输入的语音数据为“X语音助手,下载百度云图片X.jpg和1.jpg,发送给用户B并让其选择”。此时,可通过现有技术对用户输入的语音数据进行解析,以获得语音数据的解析结果,并判断解析结果中是否包含预设的动作操作词,若包含预设的动作操作词,则获得与动作操作词对应的操作指令,并根据操作指令执行对应的操作。
[0034]再例如,在用户A与用户B进行视频通话的过程中,假定触发应用程
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1