一种信息处理方法及电子设备的制造方法_2

文档序号:9691307阅读:来源:国知局
知名度较高的人物的语音参数,例如,可以用模仿某些播音员的语音参数来对第一文本信息进行配音。这样第二电子设备在播放第一视频信息,听到的声音有可能是第二用户的,有可能不是第二用户的,采用本实施例提供的技术方案,从而增加了趣味性。
[0064]本发明实施例中,如图1-5所示,在步骤105之后,所述方法还包括步骤106:将所述第一视频信息发送给所述第二电子设备。
[0065]这里,第二电子设备收到第一视频信息后,对所述第一视频信息输出给第二用户观看。
[0066]本发明实施例提供的技术方案,可以用于以下场景,第一用户与第二用户建立视频连接,但是第一用户正在开会,而第二用户正在向第一用户询问一件非常紧急的事情,由于第一用户正在开会,无法通过语音方式告知第二用户所询问的事情,因为第一用户不适合在开会的场合通过语音方式告知第二用户;在现有技术条件下,第一用户要么等到开会结束之后告诉第二用户所询问的事情,要么中断会议离开会场告诉第二用户所询问的事情;采用本发明实施例提供的技术方案,第一用户只需要对着图像采集单元作口型,这样第一电子设备就会根据口型进行唇语检测和识别,得到第一信息,该第一信息就是第一用户要传递给第二用户的信息。可见,本发明实施例提供的技术方案,能够在不适合通过语音方式将相关信息传输给对方时,依然能够将相关的信息传递给对方,从而提升用户体验。
[0067]实施例二
[0068]基于上述的实施例一,本发明实施例提供一种信息处理方法,应用于第一电子设备,所述第一电子设备具有第一图像采集单元和第一语音采集单元,图2为本发明实施例二信息处理方法的实现流程示意图,如图2所示,该方法包括:
[0069]步骤201,接收来自于第二电子设备的第一请求信息,所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接;
[0070]步骤202,基于所述第一请求信息,开启所述第一图像采集单元,通过所述第一图像采集单元采集操作体的第一图像,获得第一图像信息;
[0071]这里,所述第一图像采集单元可以为摄像头。
[0072]这里,所述操作体可以是用户,具体可以是第一用户。所述第一图像信息可以是二维数字图像信息、当然也可以是三维的数字图像信息,第一图像信息是二维还是三维,与第一图像采集单元的性能密切相关。
[0073]步骤203,提取所述第一图像信息中至少一个预定子区域的图像信息进行分析,获得第二图像息;
[0074]这里,所述预定子区域具体可以是面部区域,具体可以是唇部区域;当所述预定子区域为面部区域时,所述第二图像信息可以是面部图像信息,所述预定子区域为唇部区域时,所述第二图像信息可以是唇部的口型图形信息。
[0075]步骤204,根据所述第二图像信息生成第一信息;
[0076]这里,所述第一信息可以为语音信息和/或文本信息。
[0077]步骤205,基于所述第一请求信息,开启所述第一声音采集单元,通过所述第一语音采集单元采集第一语音信息;基于所述第一语音信息对所述第一信息进行修正,得到修正后的第一信息;
[0078]步骤206,将所述第一图像信息和修正后的第一信息进行整合,得到第一视频信肩、O
[0079]本发明实施例中,在步骤206之后,所述方法还包括:将所述第一视频信息发送给所述第二电子设备。
[0080]这里,第二电子设备收到第一视频信息后,对所述第一视频信息输出给第二用户观看。
[0081]本发明实施例中,当所述第一信息为语音信息时,所述根据所述第二图像信息生成第一信息,包括:
[0082]步骤SI,对所述第二图像信息进行唇语识别,得到第一文本信息;
[0083]步骤S2,对所述第一文本信息进行配音,得到第一信息。
[0084]本发明实施例提供的技术方案能够用于下面的场景,即第一用户以很小的声音对着第一语音采集单元说话,这种很小的声音类似于窃窃私语的,也就是说所述语音参数中音强较小,而保留了音色和音高;由于距离所述第一语音采集单元较近,所述第一语音采集单元是可以采集到第一语音信息,所以采集到第一语音单元是可以用于对基于第二图像信息而得到的第一信息进行修正,然后将所述第一图像信息和修正后的第一信息进行整合,得到第一视频信息。如此,本发明实施例提供的技术方案,通过对第一信息进行修正,使得传递给第二用户的信息更为准确。
[0085]实施例三
[0086]基于上述的实施例一和实施例二,本发明实施例提供一种信息处理方法,应用于第一电子设备,所述第一电子设备具有第一图像采集单元,图3为本发明实施例三信息处理方法的实现流程示意图,如图3所示,该方法包括:
[0087]步骤301,接收来自于第二电子设备的第一请求信息,所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接;
[0088]步骤302,基于所述第一请求信息,开启所述第一图像采集单元,通过所述第一图像采集单元采集操作体的第一图像,获得第一图像信息;
[0089]这里,所述第一图像采集单元可以为摄像头。
[0090]这里,所述操作体可以是用户,具体可以是第一用户。所述第一图像信息可以是二维数字图像信息、当然也可以是三维的数字图像信息,第一图像信息是二维还是三维,与第一图像采集单元的性能密切相关。
[0091]步骤303,提取所述第一图像信息中至少一个预定子区域的图像信息进行分析,获得第二图像息;
[0092]这里,所述预定子区域具体可以是面部区域,具体可以是唇部区域;当所述预定子区域为面部区域时,所述第二图像信息可以是面部图像信息,所述预定子区域为唇部区域时,所述第二图像信息可以是唇部的口型图形信息。
[0093]步骤304,根据所述第二图像信息生成第一信息;
[0094]这里,所述第一信息可以为语音信息和/或文本信息。
[0095]步骤305,解析所述第一信息,当所述第一信息内容符合预定条件时,获取与所述第一信息对应的第二语音信息;
[0096]这里,所述预定条件可以是诗词片段信息、歌曲片段信息。所述获取与所述第一信息对应的第二语音信息,可以通过下面的方式:当确定所述第一信息中包括预定条件的信息时,可以以所述预定条件为关键词,检索得到与所述第一信息相关的第二语音信息。
[0097]步骤306,将所述第二语音信息与所述第一图像信息整合,得到第二视频信息。
[0098]本发明实施例中,在步骤306之后,所述方法还包括:将所述第一视频信息发送给所述第二电子设备。
[0099]这里,第二电子设备收到第一视频信息后,对所述第一视频信息输出给第二用户观看。
[0100]本发明实施例中,当所述第一信息为语音信息时,所述根据所述第二图像信息生成第一信息,包括:
[0101]步骤SI,对所述第二图像信息进行唇语识别,得到第一文本信息;
[0102]步骤S2,对所述第一文本信息进行配音,得到第一信息。
[0103]本发明实施例提供的技术方案,可以用于以下场景,第一用户与第二用户建立视频连接,但是第一用户正在给第一用户唱一首歌,但是第一用户嗓子发炎了,这时候唱歌的话肯定会影响唱歌的效果,采用本发明实施例提供的技术方案,第一用户可以不出声音只作口型;这时,第一电子设备基于提取的第二图像信息生产第一信息,然后第一电子设备发现第一信息满足预定条件,即预定条件的设置为歌曲片段信息,然后根据所述第一信息获取第二语音信息,就该例而言,本实施例可以以下列方式实现获取第二语音信息,第一种方式可以采用第一用户的语音参数对第一用户所唱的歌曲进行配音,得到第二语音信息;第二种方式可以采用某歌手的语音参数对第一用户所唱的歌曲进行配音,得到第二语音信息;第三种方式是直接获取某歌手所唱的歌曲,得到第二语音信息。可见,本发明实施例提供的技术方案,能够在不适合通过语音方式将相关信息传输给对方时,依然能够将相关的信息传递给对方,从而提升用户体验。
[0104]实施例四
[0105]本发明实施例提供一种信息处理方法,应用于第一电子设备,所述第一电子设备具有第一图像采集单元,图4为本发明实施例四信息处理方法的实现流程示意图,如图4所示,该方法包括:
[0106]步骤401,接收来自于第二电子设备的第一请求信息,所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接;
[0107]步骤402,基于所述第一请求信息,开启所述第一图像采集单元;通过所述第一图像采集单元采集操作体的第一图像,获得第一图像信息;
[0108]这里,所述第一图像采集单元可以为摄像头。
[0109]这里,所述操作体可以是用户,具体可以是第一用户。所述第一图像信息可以是二维数字图像信息、当然也可以是三维的数字图像信息,第一图像信息是二维还是三维,与第一图像采集单元的性能密切相关。
[0110]步骤403,提取所述第一图像信息中至少一个预定子区域的图像信息进行分析,获得第二图像息;
[0111]这里,所述预定子区域具体可以是面部区域,具体可以是唇部区域;当所述预定子区域为面部区域时,所述第二图像信息可以是面部图像信息,所述预定子区域为唇部区域时,所述第二图像信息可以是唇部的口型图形信息。
[0112]步骤404,根据所述第二图像信息生成第一信息;
[0113]这里,所述第一信息可以为语音信息和/或文本信息。
[0114]步骤405,将所述第一图像信息和第一信息进行整合,得到第一视频信息;
[0115]步骤406,确定所述第一图像信息中未包括所述预定子区域的图像信息时,发出第一提示信息,所述第一提示信息用于提示用户调整所述第一图像采集单元。
[0116]这里,由于步骤404中的第一信息可以为语音信息,也可以是文本信息,还可以是语音信息和文本信息,因此所述第一视频信息可能是语音配合图像的形式,还可以是文本配合图像的形式,还可以是语音配合文本配合图像的形式,当第一视频信息为文本配合图像的形式时,文本类似于字幕,第一视频信息在第二电子设备端进行播放时类似于无声电影;所述第一视频信息为语
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1