一种有声图片的计算机实现方法

文档序号：6374620阅读：205来源：国知局

专利名称：一种有声图片的计算机实现方法
技术领域：
一种有声图片的计算机实现方法。
背景技术：
电脑技术突飞猛进，已经走过了多媒体时代，进入了互联网时代，人们能够很方便的在网络上搜索查看图片、音频或者是影音。如今，互联网逐渐进入互动与分享时代，国外风靡的脸谱网facebook,推特twitter和国内风靡的人人网、微博、微信等已经大面积得到用户的认可和喜爱，很多人甚至成了“人人控”、“微博控”，用户有着强烈的自我展示意识或者分享情结，今天吃的午饭会拍下来发到微博叫朋友围观，或者分享一首好听的歌给大家，更或者是发送一条微信给亲密的人。有声图片的发明人意在为人们提供一种“照片配音”的多媒体形式，用于人们在互联网上分享自己拍下的瞬间以及记录的音频，这比传统的影音更有意义。现有的视频拍摄技术结合了图片和声音，但是拍摄与制作过程复杂，分享也不方便。拍摄过后的视频原始数据需要经过编码，目前有AVI、RM等主流视频编码，制作视频文件的设备和软件许可使用费用昂贵，对制作者的专业技能要求高，制作出的视频文件数据量大，可编辑性差，而且带音频的视频文件在电视、电影等媒体播放载体上为人们所熟知，吸引力减弱。此外，视频文件通常很难直接在网页上播放，现有的主流网页浏览器通常是使用FLASH播放器插件来播放视频，而许多格式的视频文件，如AVI，RM格式的视频文件都不能利用FLASH播放器播放。

发明内容
本发明提供一种有声图片的计算机实现方法。本发明的技术方案包括如下步骤
a.数据准备步骤准备需要合成的图像数据和音频数据；如果这些图像和音频数据已经是二进制格式，则跳过步骤b直接进入步骤c ;如果不是，则进入步骤b;
b.第一编码步骤将图像数据和音频数据编码为二进制原始信息，即图像二进制原始信息和音频二进制原始信息；
c.第二编码步骤将a或b步骤中得到的图像二进制原始信息和音频二进制原始信息进行编码和压缩，得到待输入图像数据Pi和待输入音频数据Si ；
d.合成压缩步骤创建一个字节数组BI，将文件头字符串、图片标识字符串、C步骤中得出的待输入图像数据PU音频判断有效数据、音频标识字符串、C步骤中得出的待输入音频数据SI按预先设定的地址和数据的对应关系输入这个字节数组BI ;输入完成后压缩该字节数组；所述文件头字符串为定义输出文件格式的二进制数据，图片标识字符串为描述图像数据格式的二进制数据，音频判断有效数据为判断有音频文件的二进制数据，音频标识字符串为标识音频数据格式的二进制数据；e.输出数据步骤将d步骤中压缩后的字节数组输出为有声图片的数据文件B3并存
储；
f.解压播放步骤将e步骤中得到的有声图片的数据文件B3进行解压和解码播放。利用上述步骤即可得到本发明所述的有声图片的输出文件，并对有声图片的输出文件进行播放。优选的，在c.第二编码步骤中将a或b步骤中得到的图像二进制原始信息进行编码和压缩以得到待输入图像数据Pl的实现过程为通过PNG或者JPEG编码器编码压缩为PNG或者JPEG格式的待输入图像数据Pl。对音频二进制原始信息进行编码和压缩以得到待输入音频数据SI的实现过程为通过WAV编码器编码为WAV格式的数据，再将WAV格式的数据通过MP3编码器压缩为MP3格式的待输入音频数据SI。通过使用PNG，JPEG, WAV，MP3等业内公知的成熟的软件压缩技术可以提高本发明所述的有声图片文件的压缩效率，减小数据存储空间。也可以使用OBJECTIVE-C计算机语言编程实现，0BJECTIVE-C是扩充C语言的面向对象编程语言，目前美国苹果公司的IPhone和iPad开发应用的编程语言
另一种优选的实施方式d.合成压缩步骤和/或f.解压播放步骤是使用计算机语言JAVA或C++编程实现的。C++编程效率闻,而JAVA语目具有跨平台性,方便移植。使用这些计算机语言编程时，只要在f.解压播放步骤中对应的进行计算机语言编程解压解码，就可以实现既在本地或者服务器上播放，也可以在装有解压解码软件的网页浏览器上播放。d.合成压缩步骤和/或f.解压播放步骤也可以使用Objective-C计算机语言编程实现，Objective-C是扩充C语言的面向对象编程语言，也是目前美国苹果公司的IPhone和iPad开发应用的编程语言，使用Objective-C语言编写，便于在IPhone和iPad上使用。再一种优选的实施方式d.合成压缩步骤是使用计算机语言Action Script3. O编程实现的，f.解压播放步骤直接使用FLASH播放器软件实现。由于FLASH播放器软件在主流网页浏览器软件中的广泛使用，本实施例实际实现了本发明所述的有声图片文件在网页上的直接播放。当用户没有音频文件或者不希望播放图片时有声音同时播放时，本发明提供的有声图片的计算机实现方法的d.合成压缩步骤为创建一个字节数组B2，将文件头字符串、图片标识字符串、c步骤中得出的待输入图像数据P2、音频判断无效数据按预先设定的地址和数据的对应关系输入这个字节数组B2 ;输入完成后压缩该字节数组；所述文件头字符串为定义输出文件格式的二进制数据，图片标识字符串为描述图像数据格式的二进制数据，所述音频判断无效数据为判断无音频文件的二进制数据。由此得到的是只有图片而没有声音的数据和播放效果。本发明关于有声图片的计算机实现方法简单，对软硬件要求环境均不高，使用各种计算机语言都可以编程实现对本发明所述的有声图片数据文件的制作和播放，操作简便，由于对图片和音频文件进行合成压缩步骤，得到的有声图片的数据量小，不仅占用存储空间小，而且有利于在网速有限的网络上快速传输和播放。在f.解压播放步骤中，使用任意一种计算机语言编写的软件程序对有声图片的数据进行解压解码播放，既可以在计算机上本地播放，也可以在网络上播放，只要在网页浏览器上携带了这种用于解压解码的软件插件，就可以实现在网页浏览器上的播放。
优选的，本发明所述的技术方案当d步骤采用Action Script3. O语言编程实现时，得到的有声图片的输出文件可以直接在带有FLASH播放器插件的网页上直接播放。

说明书附图示出本发明所述有声图片的计算机实现方法的步骤框图。
具体实施例方式下面结合附图，对本发明的具体实施方式
作进一步的详细说明。附图示出本发明所述的有声图片的计算机实现方法，包括如下步骤
a.数据准备步骤准备需要合成的图像数据和音频数据；如果这些图像和音频数据已经为二进制格式，则跳过步骤b直接进入步骤c ;如果不是，则进入步骤b;
b.第一编码步骤将图像数据和音频数据编码为二进制原始信息，即图像二进制原始信息和音频二进制原始信息；
c.第二编码步骤将a或b步骤中得到的图像二进制原始信息和音频二进制原始信息进行编码和压缩，得到待输入图像数据Pi和待输入音频数据Si ；
d.合成压缩步骤创建一个字节数组BI，将文件头字符串、图片标识字符串、C步骤中得出的待输入图像数据PU音频判断有效数据、音频标识字符串、C步骤中得出的待输入音频数据SI按预先设定的地址和数据的对应关系输入这个字节数组BI ;输入完成后压缩该字节数组；所述文件头字符串为定义输出文件格式的二进制数据，图片标识字符串为描述图像数据格式的二进制数据，音频判断有效数据为判断有音频文件的二进制数据，音频标识字符串为标识音频数据格式的二进制数据；
e.输出数据步骤将d步骤中压缩后的字节数组输出为有声图片的数据文件B3并存
储；
f.解压播放步骤将e步骤中得到的有声图片的数据文件B3进行解压和解码播放。下面对本发明的具体实施方式
以及优选技术方案进行阐述
a.数据准备步骤中可以通过各种方式，例如扫描、数码拍摄、数码录音或者选择以任意格式保存的图片文件和音频文件来作为需要合成的图片数据和音频数据。由于后续c步骤需要二进制格式的文件，因此如果a步骤中得到的不是二进制格式的图片和音频数据，那么进入b步骤将其转化为二进制格式，如果a步骤中得到的已经是二进制格式的图片和音频数据，那么不需要进行b步骤而直接进入c步骤。二进制格式的数据存储方式是计算机对数据进行存储的基本存储方式，在几乎所有计算机上都可以实现所述b.第一编码步骤，即将图像数据和音频数据编码为二进制原始信息，即图像二进制原始信息和音频二进制原始信息
c.第二编码步骤可以采用各种常用的压缩处理格式对图像和音频数据进行编码压缩，得到待输入图像数据Pl和待输入音频数据Si，对数据的压缩处理希望压缩量越大、保真度越高越好。对图像数据优选的选用PNG和JPEG格式进行编码压缩，可以实现对图像数据的最大压缩量和高保真度，对图像数据的处理选择PNG还是JPEG编码决定于要处理的图像是否有透明通道，即PNG格式可以处理有透明背景的图片，而JPEG则不能处理透明背景的图片。出于同样的原因，优选采用WAV编码器对音频数据编码为WAV格式的数据，再将所述WAV格式的数据通过MP3编码器压缩为MP3格式以最大化压缩数据。PNG和JPEG都是一种对图像数据按照一定规律进行编码压缩后输出的一种文件存储格式，具备高压缩量和高保真度。WAV为微软公司开发的一种声音文件压缩软件，也用来命名压缩后的文件格式，即WAV格式，MP3是一种音频压缩技术，其全称是Moving Picture Experts Group Audio LayerIII，简称为MP3，可以将音频文件大幅压缩成数据量小的文件，压缩后的文件也称为MP3，本发明利用这些公知成熟的软件技术来提高文件压缩效果。d.合成压缩步骤中，将图片和音频数据的格式，也就是图片标识字符串和音频标识字符串；和数据本身的信息，也就是待输入图像数据Pi和待输入音频数据Si以及输出文件的文件头信息等存储进一个字节数组，存储这些信息时，需要按照一定的地址对应关系将上述各种数据输入进这个数组，以便在后续的解压解码步骤中能够从这个字节数组按照地址位置准确的读出图片和音频数据信息，并定义输出文件的扩展名。在d.合成压缩步骤中，如果不需要音频文件，那么不再输入音频判断有效数据，而改为输入音频判断无效数据，并且后续的音频标识字符串和待输入音频数据也不再输入。这样最终得到的文件在播放时将只有图片显示而没有音频播放。例如当需要输入音频文件时，音频判断有效数据输入1，而不需要输入音频文件时，输入音频判断无效数据O。数据合成完毕后，输出的数据就是本发明所述的有声图片数据文件，将这个数据存储在本地计算机的硬盘上或者服务器上，用户播放这个文件时，只需要对这个输出的数据文件进行解压解码即可，解压解码的过程在f.解压播放步骤通过计算机语言编程来实现。d.合成压缩步骤和f.解压播放步骤分别对输入的文件进行编码压缩和解压解码播放，这个过程可以利用各种主流计算机语言编程实现，例如使用目前大量使用的JAVA和C++计算机语目，使用C++语目编程效率闻,使用JAVA语目则可以在多种设备上实现编码，具有跨平台性。d步骤和f步骤可以采用相同的计算机语言编程，但也可以采用不同的计算机语言实现，只要能对数据进行编码和解压解码即可。例如d步骤采用JAVA，f步骤采用C++编程实现。d.合成压缩步骤和/或f.解压播放步骤也可以使用Objective-C计算机语言编程实现，Objective-C是扩充C语言的面向对象编程语言，也是目前美国苹果公司的数码产品IPhone和iPad开发应用的编程语言,使用Objective-C语言编写,便于在IPhone和iPad上使用。对应的，在f.解压播放步骤中，使用任意一种计算机语言编写的软件程序对有声图片的数据进行解压解码播放，既可以在计算机上本地播放，也可以在网络上播放，只要在网页浏览器上携带了这种用于解压解码的软件插件，就可以实现在网页浏览器上的播放。本发明优选的在d.合成压缩步骤中使用Action Script3. O计算机语言，简称AS3. O语目进彳了编程实现,AS3. O语目是针对Adobe Flash Player软件程序，也就是通常简称的FLASH播放器软件运行环境的编程语言，它在Flash内容和应用程序中实现了交互性、数据处理以及其它许多功能。在d.合成压缩步骤中使用AS3. O语言编程实现，在f.解压播放步骤中就无须另外使用解码器，而直接使用FLASH播放器软件播放即可，而FLASH播放器插件目前在主流的网页浏览器中大量使用，用户直接通过带有FLASH播放器插件的网页就可以播放本发明所述的有声图片的数据文件，方便使用。本发明实现了一种多媒体展示形式，即在计算机上显示带声音的图片的实现方法，本发明关于有声图片的计算机实现方法简单，对软硬件要求环境均不高，使用各种计算机语言都可以编程实现对本发明所述的有声图片数据文件的制作和播放，操作简便，所得到的合成后的带图片和音频信息的数据文件由于采用高压缩比的图像以及音频编码格式，再进行合成压缩处理，编码后数据体积很小，例如当画面分辨率1000x600以上、10秒声音时只有不到300KB，不仅存储空间小，而且易于在网速一定的网络上快速传输以及播放。
以上所述的仅为本发明的优选实施例，所述实施例并非用以限制本发明的专利保护范围，因此凡是运用本发明的说明书及附图内容所作的原理相同，具体实现方式不同的变化，同理均应包含在本发明的保护范围内。
权利要求
1.一种有声图片的计算机实现方法，包括如下步骤 a.数据准备步骤准备需要合成的图像数据和音频数据；如果这些图像和音频数据已经是二进制格式，则跳过步骤b直接进入步骤c ;如果不是，则进入步骤b; b.第一编码步骤将图像数据和音频数据编码为二进制原始信息，即图像二进制原始信息和音频二进制原始信息； c.第二编码步骤将a或b步骤中得到的图像二进制原始信息和音频二进制原始信息进行编码和压缩，得到待输入图像数据Pi和待输入音频数据Si ； d.合成压缩步骤创建一个字节数组BI，将文件头字符串、图片标识字符串、C步骤中得出的待输入图像数据P1、音频判断有效数据、音频标识字符串、C步骤中得出的待输入音频数据SI按预先设定的地址和数据的对应关系输入这个字节数组BI ;输入完成后压缩该字节数组；所述文件头字符串为定义输出文件格式的二进制数据，图片标识字符串为描述图像数据格式的二进制数据，音频判断有效数据为判断有音频文件的二进制数据，音频标识字符串为标识音频数据格式的二进制数据； e.输出数据步骤将d步骤中压缩后的字节数组输出为有声图片的数据文件B3并存储； f.解压播放步骤将e步骤中得到的有声图片的数据文件B3进行解压和解码播放。
2.如权利要求I所述的一种有声图片的计算机实现方法，其特征在于所述c.第二编码步骤中将a或b步骤中得到的图像二进制原始信息进行编码和压缩以得到待输入图像数据Pl的实现过程为通过PNG或者JPEG编码器编码压缩为PNG或者JPEG格式的待输入图像数据Pl。
3.如权利要求I所述的一种有声图片的计算机实现方法，其特征在于所述c.第二编码步骤中将a或b步骤中得到的音频二进制原始信息进行编码和压缩以得到待输入音频数据SI的实现过程为通过WAV编码器编码为WAV格式的数据，再将WAV格式的数据通过MP3编码器压缩为MP3格式的待输入音频数据SI。
4.如权利要求I所述的有声图片的计算机实现方法，其特征在于所述d.合成压缩步骤和/或f.解压播放步骤是使用计算机语言JAVA或C++或Objective-C编程实现的。
5.如权利要求I所述的有声图片的计算机实现方法，其特征在于所述d.合成压缩步骤是使用计算机语言Action Script3. O编程实现的,所述f.解压播放步骤直接使用FLASH播放器软件实现。
6.如权利要求1-5任意一项所述的一种有声图片的计算机实现方法，其特征在于所述d.合成压缩步骤为创建一个字节数组B2，将文件头字符串、图片标识字符串、c步骤中得出的待输入图像数据P2、音频判断无效数据按预先设定的地址和数据的对应关系输入这个字节数组B2 ;输入完成后压缩该字节数组；所述文件头字符串为定义输出文件格式的二进制数据，图片标识字符串为描述图像数据格式的二进制数据，所述音频判断无效数据为判断无音频文件的二进制数据。
全文摘要
本发明涉及一种有声图片的计算机实现方法，包括如下步骤:a.数据准备步骤；b.第一编码步骤；c.第二编码步骤；d.合成压缩步骤；e.数据输出步骤；f.解压播放步骤。利用上述步骤即可得到本发明所述的有声图片的输出文件，并对有声图片的输出文件进行播放。所述合成压缩步骤和解压播放步骤可以采用各种不同的计算机语言编程实现，都可以实现在计算机本地或者网络上的有声图片的播放。
文档编号G06T9/00GK102819851SQ20121028030
公开日2012年12月12日申请日期2012年8月8日优先权日2012年8月8日
发明者王敬, 龚书申请人:成都思珩网络科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王敬;龚书
技术所有人：成都思珩网络科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。