根据汉字自动实现音唇同步的方法

文档序号：6482896阅读：303来源：国知局

专利名称：根据汉字自动实现音唇同步的方法
技术领域：
本发明涉及一种音唇同步的方法，具体涉及一种根据汉字自动实现音唇同步的方法。
背景技术：
传统的口形动画是先获取到说话的内容，然后由专业的美术制作人员使用三维建模软件，如3ds max或者Maya等。目前，一种现有技术的源虚拟角色上的口形动画生成方法，包括下列步骤1)接收文本，将文本切分为单个字，将所述字拆分为文本的音素；2)根据音素口形对应库将音素转化为对应的口形命令，其中所述音素口形对应库设定了音素对应的起始口形和终止口形；3)根据音素时长表，缩放所述口形命令中的文本的音素对应口形，其中所述音素时长表包含口形幅度的标识；4)根据所述音素时长表，计算文本的音素对应的起始口形和终止口形分别对应的起始帧和结束帧，设置所述口形命令的执行时间，其中，所述音素时长表包括音素对应口形的时长；5)执行所述口形命令，生成所述源虚拟角色上的口形动画。这些现有技术的缺点是1、这些现有技术由于在获取说话内容后制作动画，不能确保动画的实时性。2、这些现有技术制作时间周期较长，难度较大。3、这些现有技术成本高，精确度较低，不易于普及应用。

发明内容
本发明的目的是提供一种根据汉字自动实现音唇同步的方法，能通过简单的输入所要表达的内容，生成完美的口型动画，具有使用简单，调整方便，实时性强的特性。本发明根据汉字自动实现音唇同步的方法的目的是通过以下技术方案实现的一种根据汉字自动实现音唇同步的方法，应用于由输入模块、解析处理模块、汉字转成拼音模块、拼音转成动画序列信息模块、动画序列信息解析模块及动画应用模块组成的系统中；该方法至少包括以下步骤步骤1，用户输入文本。步骤2，解析处理模块对输入的文本进行解析，将输入统一格式的单个汉字及汉字发音时间长短的数据序列信息；判断文本解析是否成功步骤2. 1，解析处理模块对输入的文本进行解析，解析成功，则继续执行步骤3 ；步骤2. 2，解析失败，则返回执行步骤1。步骤3，汉字转成拼音模块根据《汉字_拼音对应表格》进行数据转换，生成统一格式的汉字拼音及汉字发音时间长短的数据序列信息；判断汉字转成拼音是否成功步骤3. 1，汉字转成拼音模块根据《汉字_拼音对应表格》进行数据转换，转换成功，则继续执行步骤4;步骤3. 1，转换失败，则返回执行步骤1。
步骤4，拼音转成动画序列信息模块根据《拼音_动画序列对应表格》进行数据转换，生成统一格式的动画序列信息及汉字发音时间长短的数据序列信息；判断拼音转成动画序列结构是否成功步骤4. 1，拼音转成动画序列信息模块根据《拼音_动画序列对应表格》进行数据转换，转换成功，则继续执行步骤5 ；步骤4. 2，转换失败，则返回执行步骤1。步骤5，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，生成统一格式的单个动画序列信息及动画播放时间，单个动画序列信息及动画播放时间，和下一个单个动画序列信息的融合时间的最终数据序列信息；判断最终数据序列信息转换是否成功；步骤5. 1，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，转换成功，则继续执行步骤6 ；步骤5. 2，转换失败，则返回执行步骤1。步骤6，动画应用模块将最终数据序列信息应用到渲染引擎中。上述的根据汉字自动实现音唇同步的方法，其中，所述的步骤1中用户直接输入的文本是汉字或使用工具编辑的音乐电视字幕。上述的根据汉字自动实现音唇同步的方法，其中，所述的步骤4中还包括所述的统一格式的动画序列信息及汉字发音时间长短的数据序列信息是每个音节的动画唇形及其相对应的播放时间。上述的根据汉字自动实现音唇同步的方法，其中，所述的步骤5中还包括所述的融合时间是汉字与汉字之间的间隔停顿时间。本发明根据汉字自动实现音唇同步的方法由于采用了上述方案，使之与现有技术相比，具有以下的优点和积极效果1、本发明根据汉字自动实现音唇同步的方法能够通过说话的内容，直接由汉字自动实时的实现音唇同步。2、本发明根据汉字自动实现音唇同步的方法实时性强，使用简单，调整方便。3、本发明根据汉字自动实现音唇同步的方法是目前市场上唯一一款能够通过汉字自动生成音唇同步的软件。

图1是本发明根据汉字自动实现音唇同步的方法的流程图。图2是本发明根据汉字自动实现音唇同步的方法的一个实施例。
具体实施例方式请参见附图1所示，本发明根据汉字自动实现音唇同步的方法应用于由由输入模块、解析处理模块、汉字转成拼音模块、拼音转成动画序列信息模块、动画序列信息解析模块及动画应用模块组成的系统中，该方法的具体步骤如下步骤1，用户直接输入文本，直接输入的文本可以是汉字或使用工具编辑的音乐电视(MTV)字幕。
步骤2，解析处理模块对输入的文本进行解析，将输入归一化为统一格式的单个汉字及汉字发音时间长短的数据序列信息；判断文本解析是否成功；解析成功，继续执行步骤3 ；解析失败，则返回执行步骤1 ；因为中文是单字节发音的语言，输入文本的格式分为勻速发音及变速发音，普通说话时勻速发音，唱歌等是变速发音。步骤3，汉字转成拼音模块根据《汉字_拼音对应表格》进行数据转换，生成统一格式的汉字拼音及汉字发音时间长短的数据序列信息；判断汉字转成拼音是否成功；转换成功，继续执行步骤4 ；转换失败，则返回执行步骤1。步骤4，拼音转成动画序列信息模块根据《拼音_动画序列对应表格》进行数据转换，生成统一格式的动画序列信息及汉字发音时间长短的数据序列信息；判断拼音转成动画序列结构是否成功；转换成功，继续执行步骤5 ；转换失败，则返回执行步骤1 ；统一格式的动画序列信息及汉字发音时间长短的数据序列信息是每个音节的动画唇形及其相对应的播放时间。步骤5，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，生成统一格式的单个动画序列信息及动画播放时间，单个动画序列信息及动画播放时间，和下一个单个动画序列信息的融合时间的最终数据序列信息；判断最终数据序列信息转换是否成功；转换成功，继续执行步骤6 ；转换失败，则返回执行步骤1 ；
根据上一模块的结果，计算出单个动画播放时间的长短，在汉字与汉字之间加入融合时间blend_time ο
步骤6，动画应用模块将最终数据序列信息应用到渲染引擎中。
本发明根据汉字自动实现音唇同步的方法包括《汉字_拼音对应表格》
{
啊a
阿ae
埃ai
挨ai
哎ai
唉ai
哀ai
}
及《拼音__动画序列对应表格》
{
a lips_a
lips_a
ai lips_a
lips_i
an lips_a
lips_n
ang lips_a
lips_ng
ao lips_a
lips_o
}
6
根据上述表格，请参见附图2所示，本发明根据汉字自动实现音唇同步的方法根据《汉字_拼音对应表格》将输入的文本内容“冰冻娱乐”转换成拼音及播放时间{“bing，0.3”“dong，0.3”"yu,0. 3"‘‘le，0.3，，}进而根据《拼音-动画序列对应表格》转化为口形动画{“0. 3(lips_b，0. 1)，(lips_ing，0. 9)，，“0. 3(lips_d，0. 1)，(lips_ong，0. 9)，，“0. 3(lips_y，0. 1)，(lips_u，0. 9)，，“0. 3(lips_l，0. 1)，(lips_e，0. 9)，，}再在汉字与汉字之间加上融合时间，输出{“0. 3(lips_b，0. 1)，(lips_ing，0. 9)blend_time，，“0. 3(lips_d，0. 1)，(lips_ong，0. 9)blend_time，，“0. 3(lips_y，0. 1)，(lips_u，0· 9)blend_time，，“0. 3(lips_l，0. 1)，(lips_e，0. 9)blend_time，，}最后在渲染引擎中渲染出三维效果。综上所述，本发明根据汉字自动实现音唇同步的方法能够通过说话的内容，直接由汉字自动实时的实现音唇同步；本发明根据汉字自动实现音唇同步的方法实时性强，使用简单，调整方便；本发明根据汉字自动实现音唇同步的方法是目前市场上唯一一款能够通过汉字自动生成音唇同步的软件。
权利要求
一种根据汉字自动实现音唇同步的方法，应用于由输入模块、解析处理模块、汉字转成拼音模块、拼音转成动画序列信息模块、动画序列信息解析模块及动画应用模块组成的系统中；其特征在于该方法至少包括以下步骤步骤1，用户输入文本；步骤2，解析处理模块对输入的文本进行解析，将输入统一格式的单个汉字及汉字发音时间长短的数据序列信息；判断文本解析是否成功；步骤3，汉字转成拼音模块根据《汉字拼音对应表格》进行数据转换，生成统一格式的汉字拼音及汉字发音时间长短的数据序列信息；判断汉字转成拼音是否成功；步骤4，拼音转成动画序列信息模块根据《拼音动画序列对应表格》进行数据转换，生成统一格式的动画序列信息及汉字发音时间长短的数据序列信息；判断拼音转成动画序列结构是否成功；步骤5，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，生成统一格式的单个动画序列信息及动画播放时间，单个动画序列信息及动画播放时间，和下一个单个动画序列信息的融合时间的最终数据序列信息；判断最终数据序列信息转换是否成功；步骤6，动画应用模块将最终数据序列信息应用到渲染引擎中。
2.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于所述的步骤1中用户直接输入的文本是汉字或使用工具编辑的音乐电视字幕。
3.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于所述的步骤4中还包括所述的统一格式的动画序列信息及汉字发音时间长短的数据序列信息是每个音节的动画唇形及其相对应的播放时间。
4.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于所述的步骤5中还包括所述的融合时间是汉字与汉字之间的间隔停顿时间。
5.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于所述的步骤2中还包括步骤2. 1，解析处理模块对输入的文本进行解析，解析成功，则继续执行步骤3 ；步骤2. 2，解析失败，则返回执行步骤1。
6.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于所述的步骤3中还包括步骤3. 1，汉字转成拼音模块根据《汉字_拼音对应表格》进行数据转换，转换成功，则继续执行步骤4 ；步骤3. 1，转换失败，则返回执行步骤1。
7.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于所述的步骤4中还包括步骤4. 1，拼音转成动画序列信息模块根据《拼音_动画序列对应表格》进行数据转换，转换成功，则继续执行步骤5;步骤4. 2，转换失败，则返回执行步骤1。
8.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于所述的步骤5中还包括步骤5. 1，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，转换成功，则继续执行步骤6 ；步骤5. 2，转换失败，则返回执行步骤1。
全文摘要
一种根据汉字自动实现音唇同步的方法，该方法至少包括以下步骤用户输入文本的步骤，对输入的文本进行解析，将输入统一成标准的数据序列信息的步骤，根据《汉字-拼音对应表格》进行数据转换，生成标准的数据序列信息的步骤，根据《拼音-动画序列对应表格》进行数据转换，生成标准的数据序列信息，根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，生成标准的最终数据结构的步骤，将最终数据序列信息应用到具体的渲染引擎中。本发明能通过说话的内容，直接由汉字自动实时的实现音唇同步，实时性强，使用简单，调整方便，是目前市场上唯一一款能够通过汉字自动生成音唇同步的软件。
文档编号G06F17/21GK101968894SQ20091005553
公开日2011年2月9日申请日期2009年7月28日优先权日2009年7月28日
发明者娄郭梁, 孙涛申请人:上海冰动信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙涛;娄郭梁
技术所有人：上海冰动信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。