一种信息处理方法及电子设备的制造方法_4

文档序号:9691307阅读:来源:国知局
具体可以是面部区域,具体可以是唇部区域;当所述预定子区域为面部区域时,所述第二图像信息可以是面部图像信息,所述预定子区域为唇部区域时,所述第二图像信息可以是唇部的口型图形信息。
[0159]所述生成单元705,用于根据所述第二图像信息生成第一信息;
[0160]这里,所述第一信息可以为语音信息和/或文本信息。
[0161]所述第二开启单元706,用于基于所述第一请求信息,开启所述第一声音采集单元,通过所述第一语音采集单元采集第一语音信息;
[0162]所述修正单元707,用于基于所述第一语音信息对所述第一信息进行修正,得到修正后的第一信息。
[0163]所述第一整合单兀708,用于将所述第一图像信息和修正后的第一信息进行整合,得到第一视频信息。
[0164]本发明实施例中,该第一电子设备还包括第一发送单元,用于将所述第一视频信息发送给所述第二电子设备。这里,第二电子设备收到第一视频信息后,对所述第一视频信息输出给第二用户观看。
[0165]本发明实施例中,当所述第一信息为语音信息时,所述生成单元包括识别模块和配音模块,其中:
[0166]所述识别模块,用于对所述第二图像信息进行唇语识别,得到第一文本信息;
[0167]所述配音模块,用于对所述第一文本信息进行配音,得到第一信息。
[0168]本发明实施例提供的技术方案能够用于下面的场景,即第一用户以很小的声音对着第一语音采集单元说话,这种很小的声音类似于窃窃私语的,也就是说所述语音参数中音强较小,而保留了音色和音高;由于距离所述第一语音采集单元较近,所述第一语音采集单元是可以采集到第一语音信息,所以采集到第一语音单元是可以用于对基于第二图像信息而得到的第一信息进行修正,然后将所述第一图像信息和修正后的第一信息进行整合,得到第一视频信息。如此,本发明实施例提供的技术方案,通过对第一信息进行修正,使得传递给第二用户的信息更为准确。
[0169]实施例八
[0170]本发明实施例提供一种第一电子设备,所述第一电子设备具有第一图像采集单元,图8为本发明实施例八第一电子设备的组成结构示意图,如图8所示,所述第一电子设备800包括第一接收单元801、第一开启单元802、第一采集单元803、提取单元804、生成单元805、第一解析单元806、第一获取单元807和第一整合单元808,其中:
[0171]所述第一接收单元801,用于接收来自于第二电子设备的第一请求信息,所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接;
[0172]所述第一开启单元802,用于基于所述第一请求信息,开启所述第一图像采集单元;
[0173]所述第一采集单元803,用于通过所述第一图像采集单元采集操作体的第一图像,
获得第一图像信息;
[0174]所述提取单元804,用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析,获得第二图像信息;
[0175]所述生成单元805,用于根据所述第二图像信息生成第一信息;
[0176]所述第一解析单元806,用于解析所述第一信息,当所述第一信息内容符合预定条件时,触发所述第一获取单元;
[0177]所述第一获取单元807,用于获取与所述第一信息对应的第二语音信息;
[0178]所述第一整合单元808,用于将所述第二语音信息与所述第一图像信息整合,得到第二视频信息。
[0179]这里,所述预定条件可以是诗词片段信息、歌曲片段信息。所述获取与所述第一信息对应的第二语音信息,可以通过下面的方式:当确定所述第一信息中包括预定条件的信息时,可以以所述预定条件为关键词,检索得到与所述第一信息相关的第二语音信息。
[0180]本发明实施例中,该第一电子设备还包括第一发送单元,用于将所述第一视频信息发送给所述第二电子设备。这里,第二电子设备收到第一视频信息后,对所述第一视频信息输出给第二用户观看。
[0181]本发明实施例中,当所述第一信息为语音信息时,所述生成单元包括识别模块和配音模块,其中:
[0182]所述识别模块,用于对所述第二图像信息进行唇语识别,得到第一文本信息;
[0183]所述配音模块,用于对所述第一文本信息进行配音,得到第一信息。
[0184]本发明实施例提供的技术方案,可以用于以下场景,第一用户与第二用户建立视频连接,但是第一用户正在给第一用户唱一首歌,但是第一用户嗓子发炎了,这时候唱歌的话肯定会影响唱歌的效果,采用本发明实施例提供的技术方案,第一用户可以不出声音只作口型;这时,第一电子设备基于提取的第二图像信息生产第一信息,然后第一电子设备发现第一信息满足预定条件,即预定条件的设置为歌曲片段信息,然后根据所述第一信息获取第二语音信息,就该例而言,本实施例可以以下列方式实现获取第二语音信息,第一种方式可以采用第一用户的语音参数对第一用户所唱的歌曲进行配音,得到第二语音信息;第二种方式可以采用某歌手的语音参数对第一用户所唱的歌曲进行配音,得到第二语音信息;第三种方式是直接获取某歌手所唱的歌曲,得到第二语音信息。可见,本发明实施例提供的技术方案,能够在不适合通过语音方式将相关信息传输给对方时,依然能够将相关的信息传递给对方,从而提升用户体验。
[0185]实施例九
[0186]本发明实施例提供一种第一电子设备,所述第一电子设备具有第一图像采集单元,图9为本发明实施例九第一电子设备的组成结构示意图,如图9所示,所述第一电子设备900包括第一接收单元901、第一开启单元902、第一采集单元903、提取单元904、生成单元905、第一整合单元906和发出单元907,其中:
[0187]所述第一接收单元901,用于接收来自于第二电子设备的第一请求信息,所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接;
[0188]所述第一开启单元902,用于基于所述第一请求信息,开启所述第一图像采集单元;
[0189]所述第一采集单元903,用于通过所述第一图像采集单元采集操作体的第一图像,
获得第一图像信息;
[0190]所述提取单元904,用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析,获得第二图像信息;
[0191]所述生成单元905,用于根据所述第二图像信息生成第一信息;
[0192]所述第一整合单元906,用于将所述第一图像信息和第一信息进行整合,得到第一视频息O
[0193]所述发出单元907,用于确定所述第一图像信息中未包括所述预定子区域的图像信息时,发出第一提示信息,所述第一提示信息用于提示用户调整所述第一图像采集单元。
[0194]本发明实施例中,该第一电子设备还包括第一发送单元,用于将所述第一视频信息发送给所述第二电子设备。这里,第二电子设备收到第一视频信息后,对所述第一视频信息输出给第二用户观看。
[0195]本发明实施例中,当所述第一信息为语音信息时,所述生成单元包括识别模块和配音模块,其中:
[0196]所述识别模块,用于对所述第二图像信息进行唇语识别,得到第一文本信息;
[0197]所述配音模块,用于对所述第一文本信息进行配音,得到第一信息。
[0198]实施例十
[0199]本发明实施例提供一种第二电子设备,所述第二电子设备具有第一语音输出单元,图10为本发明实施例十第二电子设备的组成结构示意图,如图10所示,所述第二电子设备1000包括第二发送单元1001、第二接收单元1002、第二获取单元1003和输出单元1004,其中:
[0200]所述第二发送单元1001,用于向第一电子设备发送第一请求信息,所述第一请求信息用于表明所述第一电子设备向所述第二电子设备发起视频通信连接;
[0201]所述第二接收单元1002,用于接收所述第一电子设备发送的第一视频信息,解析所述第一视频信息,得到第一图像信息和第一信息;
[0202]所述第二获取单元1003,用于确定所述第一信息为文本信息时,获取与所述第一信息对应的第三语音信息,并将所述第三语音信息与所述第一图像信息整合,得到第二视频信息;
[0203]所述输出单元1004,用于将所述第二视频信息输出。
[0204]这里,所述获取与所述第一信息对应的第三语音信息,包括:可以按照第一用户的语音参数对第一信息进行配音,还可以按照某些特定人物的语音参数对第一信息进行配音,以得到第三语音信息。其中,所述语音参数包括音强、音高、音色;所述特定人物可以是第二用户、可以是某些知名度较高的人物的语音参数,例如,可以用模仿某些播音员的语音参数来对第一文本信息进行配音。这样第二电子设备在播放第一视频信息,听到的声音有可能是第二用户的,有可能不是第二用户的,采用本实施例提供的技术方案,从而增加了趣味性。
[0205]本发明实施例提供的技术方案,可以用于以下场景,第一用户与第二用户建立视频连接,但是第一用户正在开会,而第二用户正在向第一用户询问一件非常紧急的事情,由于第一用户正在开会,无法通过语音方式告知第二用户所询问的事情,因为第一用户不适合在开会的场合通过语音方式告知第二用户;采用本发明实施例提供的技术方案,第一用户只需要对着图像采集单元作口型,这样第一电子设备就会根据口型进行唇语检测和识另IJ,得到第一信息,该第一信息为文本信息。然后将该第一信息发送第二电子设备,第二电子设备检测到第一信息为文本信息,将第一信息转化为声音信息,即第三语音信息,如此,本实施例提供的技术方案,在网络带宽以及网络信号的不稳定时,依然保证视频通话的质量,这是因为将语音信息转化为文本信息,传输的数据量会陡降,因而只需要很小的带宽即可以实现保证视频通话的质量,需要说明的是,在带宽不好的情况下,第一电子设备可以将第一图像信息转化为一个标识,第二电子设备解析发现是标识的时候,可以调取采用前几秒的之前图像信息,然后配上第三语音信息,从而第二用户不会感觉到视频通话的质量受到了影响,第二用户之所以不认为视频通话质量受到下降,是因为人们对声音的延迟或停顿的敏感度要比对图像的延迟或停顿敏感的多,本发明
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1