一种语音消息可视化服务的实现方法及装置的制造方法

文档序号:9528077阅读:293来源:国知局
一种语音消息可视化服务的实现方法及装置的制造方法
【技术领域】
[0001]本发明涉及通讯领域,具体地说涉及一种综合的统一的语音消息服务。
【背景技术】
[0002]在信息通讯快速发展的今天,人们在使用电话进行通讯时,可能经常困扰于如下的情形:因为对方人不在,长时间拨打无人接听;因为外出办事错过了重要电话;在进行重要工作、会议时,不方便接听电话。于是,语音消息业务便产生了。语音消息服务可将用户未能及时接听的来电转至语音消息中,让来电者留言;并在将来的某个时间,提示被叫,让被叫方便地收听留言。
[0003]这是语音消息业务发展的初始阶段。但是,随着3G技术、下一代网络技术的不断成熟并走向商用,基于3G网络上的业务应用也越来越丰富。智能手机的出现,更加丰富了用户与语音消息业务之间的交互手段,最大的特点就是用户可以通过智能手机上传位置信息、图片等多种数据。
[0004]如图1所示,用户使用现今的语音消息系统时,用户发送什么信息就接收什么信息。现今比较流行的语音消息系统基本架构如图2所示,其核心组成模块包括信息接收模块、信息储存模块、信息下发模块。基本工作原理如下:用户(语音消息发送者)发送消息给语音消息系统,信息接收模块接收消息,并调用信息储存模块存储,然后信息下发模块将语音消息下发给语音消息接收者。

【发明内容】

[0005]本发明所要解决的技术问题是,提供一种语音消息可视频化的实现方法及装置,以实现用户发送基于自己面部特征生成的视频信息。
[0006]为了解决上述技术问题,本发明公开了一种语音消息可视化的实现装置,至少包括:
[0007]信息接收模块,接收消息发送方发送的或者本地存储的原始消息以及人像图片,其中,所述原始消息为文本消息或语音消息;
[0008]动态视频生成模块,从所述人像图片中提取面部特征,生成面部表情,并将所述面部表情与所述原始消息合成为动态视频信息,其中,生成的面部表情与原始消息内容相对应;
[0009]将所述动态视频信息在消息接收方的终端显示或发送给消息接收方。
[0010]可选地,上述装置中,所述动态视频生成模块包括:
[0011]面部特征提取子模块,从所述信息接收模块接收的人像图片中提取面部特征;
[0012]面部表情生成子模块,根据提取的所述面部特征生成面部表情;
[0013]信息转换子模块,根据词语库将文本或语音消息拆为单个词语,根据词语分析语境、情感,根据语境、情感从生成的面部表情中选择相应的面部表情图片,将面部表情图片与文本或语音消息合成为动态视频。
[0014]可选地,上述装置置于语音消息系统侧。
[0015]可选地,上述装置还包括:
[0016]信息储存模块,存储所述消息发送方发送的原始消息以及人像图片,以及存储所述动态视频生成模块生成的动态视频信息以及对应的接收方信息;
[0017]信息下发模块,将所述信息储存模块存储的动态视频信息下发给对应的接收方。
[0018]可选地,上述装置中,所述接收方为移动终端用户或交互式网络电视(IPTV)用户。
[0019]本发明还公开了一种语音消息可视化的实现方法,包括:
[0020]接收消息发送方发送的或者本地存储的原始消息以及人像图片,其中,所述原始消息为文本消息或语音消息;
[0021]从所述人像图片中提取面部特征,生成面部表情,并将生成的面部表情与所述原始消息合成为动态视频信息,其中,生成的面部表情与原始消息内容相对应;
[0022]将所述动态视频信息在消息接收方的终端显示或发送给消息接收方。
[0023]可选地,上述方法中,将生成的面部表情与所述原始消息合成为动态视频信息的过程包括:
[0024]根据词语库将文本或语音消息拆为单个词语,根据词语分析语境、情感,根据语境、情感从生成的面部表情中选择相应的面部表情图片,将面部表情图片与文本或语音消息合成为动态视频。
[0025]可选地,上述方法还包括:
[0026]将合成的动态视频信息下发给对应的接收方。
[0027]可选地,上述方法中,所述接收方为移动终端用户或交互式网络电视(IPTV)用户。
[0028]本申请技术方案将文本消息、语音消息转换了基于用户面部特征生成的视频消息,较大限度地利用了资源,使用户更方便更有趣的发送信息,提高市场的竞争力,有明显的经济效益和社会效益。
【附图说明】
[0029]图1为目前语音消息系统的原理示意图;
[0030]图2为目前语音消息系统的架构示意图;
[0031]图3为本发明改进后的语音消息系统原理示意图;
[0032]图4为本发明改进后的语音消息系统结构示意图;
[0033]图5为本发明实施例中用户发送消息流程图;
[0034]图6为本发明实施例中用户接收消息流程图;
[0035]图7为本发明应用场景一流程图;
[0036]图8为本实施例中语音消息转化为动态视频的流程图;
[0037]图9为本发明应用场景二流程图;
[0038]图10为本实施例中文本消息转化为动态视频的流程图;
[0039]图11为本发明应用场景二流程图。
【具体实施方式】
[0040]为使本发明的目的、技术方案和优点更加清楚明白,下文将结合附图对本发明技术方案作进一步详细说明。需要说明的是,在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
[0041]实施例1
[0042]由于在图1所示的传统语音消息系统中,消息发送者只能单纯发送信息。因此本申请发明人考虑,如果架构一种如图3所示的语音消息系统,让用户发送信息的同时可以上传自己的照片,从而让系统生成基于自己面部特征生成的视频信息,再发送给接收者。这样,将较大限度地利用各种数据,提高用户的满意度和市场的竞争力。
[0043]基于上述思想,本实施例提供一种语音消息可视化的实现装置,至少包括信息接收模块和动态视频生成模块。
[0044]其中,信息接收模块,接收消息发送方发送的原始消息、以及人像图片,本实施例中原始消息为文本消息或语音消息;
[0045]动态视频生成模块,从收到的人像图片中提取面部特征,生成面部表情,并将生成的面部表情与收到的原始消息合成为动态视频信息,其中,生成的面部表情与原始消息内容相对应;
[0046]将所述动态视频信息在消息接收方的终端显示或发送给消息接收方。
[0047]具体地,动态视频生成模块包括面部特征提取子模块、面部表情生成子模块和信息转换子模块。
[0048]其中,信息接收模块与信息储存模块、面部特征提取子模块相连。信息接收模块主要负责接收用户(消息发送者)发送的原始消息(即为文本或语音消息)、人像图片。当接收到消息上传请求后,首先调用面部特征提取子模块进行信息转换处理流程,最后向消息发送者返回结果。
[0049]而面部特征提取子模块与信息接收模块、面部表情生成子模块相连。面部特征提取子模块主要负责从用户上传的图片中提取面部特征,然后调用面部表情生成子模块。
[0050]面部表情生成子模块与面部特征提取子模块、信息转换子模块相连。面部表情生成子模块主要负责根据面部特征生成面部表情,然后调用信息转换子模块。
[0051]信息转换子模块与面部表情生成子模块,主要负责将发送者的原始消息息、面部表情合成为新的动态视频信息。其根据词语库将文本或语音消息拆为单个词语,根据词语分析语境、情感,根据语境、情感从生成的面部表情中选择相应的面部表情图片,将面部表情图片与文本或语音消息合成为动态视频。也就是说,信息转换子模块生成的动态视频可反应出原始的文本或者语音消息的内容,以用户通过动态画面也可以获取消息内容。
[0052]需要说明的是,本实施例中的装置可以置于语音消息系统侧,此时,其还可以包括信息储存模块和信息下发模块,该信息储存模块与信息接收模块、信息转换模块、信息下发模块相连(此时整个装置架构如图4所示)。信息储存模块主要负责保存生成的动态视频信息以及对应的接收方上、以便信息下发模块查询用户消息。优选地,该信息储存模块,还可以存储消息发送方发送的原始消息和人像图片。此时,信息下发模块,将信息储存模块存储的动态视频信息下发给对应的接收方即可。
[0053]具体地,信息下发模块在探测到用户(即接收方)开机后,调用信息储存模块查询出该用户的语音消息(即本实施例中的动态视频信息),然后下发该消息。
[0054]以下以用户发送信息流程、用户接收信息流程为例,对本实施例的装置中信息发送进行详细说明:
[0055]如图5所示为本实施例提供的装置中用户发送信息流程,包括如下步骤:
[0056]步骤501、用户发送信息的同时,发送人像图片。
[0057]该步骤中,用户发送原始消息后,在一设定时间内发送人像图片均可。
[0058]步骤502、语音消息系统侧的语音消息可视化的实现装置接收消息。
[0059]步骤503、面部特征提取子模块根据图片提取发送者的面部特征。
[0060]步骤504、面部表情生成子模块根据发送者的面部特征生成相应的面部表情。
[0061]步骤505、信息转换子模块将发送者的原始信息、面部表情合成为新的视频信息。
[0062]其中,生成的面部表情与原始消息内容相对应。即生成的动态视频可反应出原始的文本或者语音消息的内容,以用户通过动态画面也可以获取消息内容。
[0063]步骤506、信息存
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1