一种带个性化语音实现方法及其平台与流程

文档序号：16774735发布日期：2019-02-01 18:38阅读：259来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本发明涉及实用工具技术领域，具体涉及一种带个性化语音实现方法及其平台。

背景技术：

通常表情符号都以文本或图像的形式表示用户的感受，目前，表情符号可具有快闪图像或电影的形式。这些表情符号基本上用在在其中发送方和接收方传输和接收文本的环境中并且主要用于表达通信者的感受而不是用于递送信息。

这些表情符号基于文本或图像产生并被提供给接收方的便携式终端，但是用户的感受可不仅利用图像形式而且作为语音或声音来表达。

技术实现要素：

为至少在一定程度上克服相关技术中存在的问题，本申请提供一种带个性化语音实现方法及其平台。

本发明的目的是采用下述技术方案实现的：

一种带个性化语音实现方法，其改进之处在于，所述方法包括

(1)通过平台获取用户语音信息；

(2)分析语音信息的特征变化；

(3)根据所述特征变化生成对应的表情帧或结合已创作流行的表情包；

(4)平台将声音信号加面部表情或声音信号与平台中的表情进行合成；

(5)输出带语音的表情包。

进一步的，所述步骤(2)包括将所述语音信息分割为多个语音片段，计算出基本发音的权重，获取所述语音片段的特征。

进一步的，所述步骤(3)中根据所述特征变化生成对应的表情帧包括根据所述特征变化生成对应的面部表情，根据所述面部表情生成对应的表情帧，根据所述表情帧生成动画表情。

进一步的，所述根据所述特征变化生成对应的面部表情包括对获取的所述特征变化进行滤波处理，得到滤波后的语音信号；根据相等声波，中和所述滤波后的语音信号进行去燥处理，得到声音信号；将所述声音信号转化为对应的面部表情。

进一步的，所述步骤(4)包括平台根据有效的声音信号加面部表情或声音信号与平台表情素材库中的表情进行合成，通过分类器进行表情素材的选择并融合，生成对应的新表情素材，逐帧呈现为带语音的动态表情；其中，平台表情素材库中的表情包括原始形态表情和已创作流行的表情包。

进一步的，所述步骤(5)将带语音的动态表情通过平台人机交互生成带语音的表情包并输出至用户。

本发明基于另一目的还提供一种带个性化语音实现平台，其改进之处在于，所述平台包括：

获取单元：用于获取用户语音信息；

分析单元：用于分析语音信息的特征变化；

生成单元：用于根据所述特征变化生成对应的表情帧或结合已创作流行的表情包；

合成单元：用于将声音信号加面部表情或声音信号与平台中的表情进行合成；

输出单元：用于输出带语音的表情包。

进一步的，将所述语音信息分割为多个语音片段，计算出基本发音的权重，获取所述语音片段的特征。

进一步的，所述生成单元根据所述特征变化生成对应的面部表情，根据所述面部表情生成对应的表情帧，根据所述表情帧生成动画表情。

进一步的，所述根据所述面部表情生成对应的表情帧包括平台根据有效的声音信号和面部表情与平台表情素材库中的表情进行合成，调取分类器进行表情素材的选择并融合，生成对应的新表情素材，逐帧呈现为带语音的动态表情。

为了对披露的实施例的一些方面有一个基本的理解，下面给出了简单的概括。该概括部分不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念，以此作为后面的详细说明的序言。

与最接近的现有技术相比，本发明提供的技术方案具有的优异效果是：

本发明通过多种信号综合获取用户的面部表情特征，提高了获取用户面部表情的准确性；本发明带语音的表情展示，可以准确地根据用户的情绪展示表情，增强了用户的互动性和实用性，进而提高了用户的体验度。

为了上述以及相关的目的，下面的说明以及附图详细说明某些示例性方面，并且其指示的仅仅是各个实施例的原则可以利用的各种方式中的一些方式。其它的益处和新颖性特征将随着下面的详细说明结合附图考虑而变得明显，所公开的实施例是要包括所有这些方面以及它们的等同。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是本发明提供的一种带个性化语音实现方法流程示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步的详细说明。

以下描述和附图充分地示出本发明的具体实施方案，以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求，否则单独的组件和功能是可选的，并且操作的顺序可以变化。实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围，以及权利要求书的所有可获得的等同物。在本文中，本发明的这些实施方案可以被单独地或总地用术语“发明”来表示，这仅仅是为了方便，并且如果事实上公开了超过一个的发明，不是要自动地限制该应用的范围为任何单个发明或发明构思。

如图1所示，本发明提出一种带个性化语音实现方法，所述方法包括

(1)通过平台获取用户语音信息；

(2)分析语音信息的特征变化；

(3)根据所述特征变化生成对应的表情帧或结合已创作流行的表情包；

(4)平台将声音信号加面部表情或声音信号与平台中的表情进行合成；

(5)输出带语音的表情包。

其中，可通过手机app，小程序和/或电脑程序制作并发布本发明带个性化语音的表情包。

上述技术方案中，所述步骤(2)包括将所述语音信息分割为多个语音片段，计算出基本发音的权重，获取所述语音片段的特征。其中，可根据需要生成的动画的帧率来对语音片段进行分割；当生成的动画为30帧/秒时，每个语音片段的长度为1/30秒；当生成的动画为60帧/秒时，每个语音片段的长度为1/60秒；或根据语言特征和/或语气特征进行分割；例如，当用户的语音信息为“高兴”时，该用户的声音信号中可能会有“开心”、“高兴”的语言，且声调较为高亢；还可以进一步通过声音的强度来分离语音信息，因为人的语音一般在40db至60db之间，因此可以根据声音的db来对音频信息进行过滤，分离出强度在在40db至60db之间的音频信息。

上述技术方案中，所述步骤(3)包括根据所述特征变化生成对应的面部表情，根据所述面部表情生成对应的表情帧，根据所述表情帧生成动画表情。其中，面部表情包括面部嘴部表情，根据所述特征变化生成对应的嘴部表情，根据所述嘴部表情生成对应的表情帧，根据所述表情帧生成动画表情。

上述技术方案中，根据所述特征变化生成对应的面部表情包括对获取的所述特征变化进行滤波处理，得到滤波后的语音信号；根据相等声波，中和所述滤波后的语音信号进行去燥处理，得到声音信号；将所述声音信号转化为对应的面部表情。通常来说，人的语音的频率范围在300hz至4000hz之间，因此可以通过对音频信息进行滤波，分离出频率范围在300hz至4000hz之间的信息作为人的语音信息。上述方式可以通过多种信号综合获取用户的面部表情特征，提高了获取用户面部表情的准确性。

上述技术方案中，平台根据有效的声音信号加面部表情或声音信号与平台表情素材库中的表情进行合成，通过分类器进行表情素材的选择并融合，生成对应的新表情素材，逐帧呈现为带语音的动态表情。；其中，平台表情素材库中的表情包括原始形态表情和已创作流行的表情包。

其中，预先建立的表情素材库中保存了用户表情特征的数值范围与表情参数的对应关系；包括6种基本表情(高兴、吃惊、悲伤、愤怒、厌恶和恐惧)，以及多种复合表情(悲伤且恐惧、悲伤且吃惊、愤怒且恐惧等)，并对每种表情赋予唯一的表情参数。表情参数与人脸的表情种类一一对应；将表情参数发送至平台，以平台从预先建立的表情素材库中查找与表情参数对应的表情表达数据；根据表情表达数据进行动态表情展示；其中，动态表情展示包括人脸面部五官的动作控制数据。

上述技术方案中，将带语音的动态表情通过手机app，小程序和/或电脑程序制作并生成带语音的表情包并输出至用户。本发明带语音的表情展示，可以准确地根据用户的情绪展示表情，增强了用户的互动性和实用性，进而提高了用户的体验度。

本发明还包括一种带个性化语音实现平台，所述平台包括：

获取单元：用于获取用户语音信息；

分析单元：用于分析语音信息的特征变化；

生成单元：用于根据所述特征变化生成对应的表情帧或结合已创作流行的表情包；

合成单元：用于将声音信号加面部表情或声音信号与平台中的表情进行合成；

输出单元：用于输出带语音的表情包。

上述技术方案中，将所述语音信息分割为多个语音片段，计算出基本发音的权重，获取所述语音片段的特征。

上述技术方案中，所述生成单元根据所述特征变化生成对应的嘴部表情，根据所述嘴部表情生成对应的表情帧，根据所述表情帧生成动画表情。

上述技术方案中，所述根据所述面部表情生成对应的表情帧包括平台根据有效的声音信号和嘴部表情与平台表情素材库中的表情进行合成，调取分类器进行表情素材的选择并融合，生成对应的新表情素材，逐帧呈现为带语音的动态表情。；其中，平台表情素材库中的表情包括原始形态表情和已创作流行的表情包。

在上述的详细描述中，各种特征一起组合在单个的实施方案中，以简化本公开。不应该将这种公开方法解释为反映了这样的意图，即，所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反，如所附的权利要求书所反映的那样，本发明处于比所公开的单个实施方案的全部特征少的状态。因此，所附的权利要求书特此清楚地被并入详细描述中，其中每项权利要求独自作为本发明单独的优选实施方案。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换，这些未脱离本发明精神和范围的任何修改或者等同替换，均在申请待批的本发明的权利要求保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：严瑾
技术所有人：郭素英
我是此专利的发明人

上一篇：基于光纤传感技术的蠕变试验装置及其夹具的制作方法
上一篇：家庭自用梅子酒制作方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。