语音涂鸦的实现方法、装置以及终端的制作方法

文档序号:6488503阅读:335来源:国知局
语音涂鸦的实现方法、装置以及终端的制作方法
【专利摘要】本发明提供一种语音涂鸦的实现方法、装置以及终端,用于通过语音生成涂鸦画面,该语音涂鸦的实现方法包括:获取一段音频数据;根据预先设定的音频帧与所述显示屏像素点的对应关系将所述音频数据的每一音频帧对应为所述显示屏上的像素点;对所述像素点进行颜色处理;以及将处理后的像素点在所述显示屏上显示,使得所述音频数据转换为一副涂鸦作品。采用本发明的技术方案,可以通过讲话在手机或其他终端上涂鸦,形成画面。
【专利说明】语音涂鸦的实现方法、装置以及终端
【技术领域】
[0001]本发明属于终端产品领域,更具体的,涉及一种语音涂鸦的实现方法、装置以及终端。
【背景技术】
[0002]随着通信技术的发展,手机应用层出不穷,目前有很多手机系统的涂鸦应用程序,但这些涂鸦功能的基本原理就是通过画笔在手机屏幕上画画,然后形成涂鸦,或者,实时收集用户在触摸屏上的触摸动作所形成的轨迹并显示在该触摸屏上形成涂鸦。但是这种都是局限于文字或者书写的涂鸦方法,用户体验不高。

【发明内容】

[0003]本发明公开一种语音涂鸦的实现方法、装置以及终端,用于解决现有技术中局限于文字或者书写的涂鸦方法而导致的用户体验不高的问题。
[0004]为实现上述目的,根据本发明的第一方面,提供一种语音涂鸦的实现方法,并采用以下技术方案:
[0005]语音涂鸦的实现方法,应用于带有显示屏的终端,包括获取一段音频数据;根据预先设定的音频帧与所述显示屏像素点的对应关系将所述音频数据的每一音频帧对应为所述显示屏上的像素点;对所述像素点进行颜色处理;以及将处理后的像素点在所述显示屏上显示,使得所述音频数据转换为一副涂鸦作品。
[0006]进一步地,所述音频帧与所述显示屏的显示区域像素点的对应关系至少为如下一种:所述显示区域的像素点个数大于等于音频帧最大量化值的时候,一个音频帧对应I个或多个显示区域像素点;所述显示区域像素点个数小于音频帧最大量化值的时候,一个或多个音频帧对应一个显示区域像素点。
[0007]进一步地,所述对所述像素点进行颜色处理包括:获取所述像素点的当前RGB值;调用系统的随机函数计算出一预设范围内的随机值;将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值,并将所述新RGB值赋予所述像素点。
[0008]进一步地,所述将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值包括:判断所述像素点的标志位的赋值为O还是1,并得出第一判断结果;在所述第一判断结果为O时,将所述当前RGB值与所述随机值相加;在所述第一判断结果为I时,将所述当前RGB值与所述随机值相减。
[0009]进一步地,所述标志位的赋值根据所述像素点的新RGB值进行转换,在所述像素点的新RGB值由所述当前RGB值与所述随机值相加达到第一阈值时,将所述标志位的赋值置为1,在所述像素点的新RGB值由所述当前RGB值与所述随机值相减达到第二阈值时,将所述标志位的赋值置为O。
[0010]进一步地,在所述获取一段音频数据之后,所述语音涂鸦的实现方法还包括:将所述音频数据放入一存储单元;并将所述音频数据以所述音频帧为单位输出。[0011]进一步地,在将处理后的像素点在所述显示屏上进行显示之后,所述语音涂鸦的实现方法还包括:判断所述存储单元是否为空,并得出第三判断结果;在所述第三结果为所述存储单元不为空时,重复执行所述对所述像素点进行颜色处理至所述将处理后的像素点在所述显示区域上显示,使得所述音频数据转换为一副涂鸦作品。
[0012]根据本发明的另外一个方面,提供一种语音涂鸦的实现装置,并采用以下技术方案:
[0013]语音涂鸦的实现装置,应用于带有显示屏的终端,包括:第一获取模块,用于获取一段音频数据;对应模块,用于根据预先设定的音频帧与所述显示屏像素点的对应关系将所述音频数据的每一音频帧对应为所述显示屏上的像素点;处理模块,用于对所述像素点进行颜色处理;以及显示模块,用于将处理后的像素点在所述显示屏上显示,使得所述音频数据转换为一副涂鸦作品。
[0014]进一步地,所述处理模块包括:第二获取模块,用于获取所述像素点的当前RGB值;调用模块,用于调用系统的随机函数计算出一预设范围内的随机值;计算模块,用于将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值,并将所述新RGB值赋予所述像素点。
[0015]进一步地,所述计算模块包括:第一判断模块,用于判断所述像素点的标志位的赋值为O还是1,并得出第一判断结果;相加模块,用于在所述第一判断结果为O时,将所述当前RGB值与所述随机值相加;相减模块,用于在所述第一判断结果为I时,将所述当前RGB值与所述随机值相减。
[0016]进一步地,所述语音涂鸦的实现装置还包括:存储模块,用于将所述音频数据放入一存储单元;输出模块,用于将所述音频数据以所述音频帧为单位输出。
[0017]根据本发明的又一个方面,提供一种终端,并采用以下技术方案:
[0018]该终端包括上述的语音涂鸦的实现装置。
[0019]通过本发明的上述技术方案,采集用户的一段讲话或者其他语言来源的一段音频,就会呈现出一幅很随意的涂鸦作品,当然用户也可以固定某个声音频率说话,那么就会显示一段区域内的一幅图画作品,提高了终端的用户体验。
[0020]除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
【专利附图】

【附图说明】
[0021]附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0022]图1表示本发明实施例所述的语音涂鸦的实现方法流程图;
[0023]图2表示本发明实施例所述的显示屏上像素点分布示意图;
[0024]图3表示本发明实施例所述的音频数据采集方法流程图;
[0025]图4表示本发明实施例所述的语音涂鸦系统工作流程图;以及
[0026]图5表示本发明实施例所述的语音涂鸦的实现装置的结构示意图。
【具体实施方式】[0027]以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
[0028]图1表示本发明实施例所述的语音涂鸦的实现方法流程图。
[0029]参见图1所示,语音涂鸦的实现方法,应用于带有显示屏的终端,具体可包括如下步骤:
[0030]a:获取一段音频数据;
[0031]b:根据预先设定的音频帧与所述显示屏像素点的对应关系将所述音频数据的每一音频帧对应为所述显示屏上的像素点c:对所述像素点进行颜色处理;以及
[0032]d:将处理后的像素点在所述显示屏上显示,使得所述音频数据转换为一副涂鸦作品O
[0033]在本实施例的上述技术方案中,步骤a中的获取一段音频数据,可以是用户的一段讲话,带有显示屏的终端的音频采集系统可以实时的不停的采集该段讲话,当然,音频数据的来源可以有很多,并不限于用户的一段讲话,例如可以是一段音乐,一位歌手演唱的一首歌曲等等,这些,通过本发明的技术方案均可以形成涂鸦作品;在步骤b中,是将上述采集的音频数据转换为显示屏上的像素点,具体的方法是通过预先设置音频数据的音频帧与显示屏像素点的关系来将音频数据转换为显示屏上的像素点,然后通过步骤c对该像素点进行颜色处理,并在步骤d中将经过颜色处理的像素点在显示屏上对应的位置上进行显示,数个像素点连起来形成了一副涂鸦作品。通过上述过程,即可以通过语音的方法在手机或其他终端的屏幕上形成涂鸦画面,提高了使用者的用户体验。
[0034]优选地,所述音频帧与所述显示屏像素点的对应关系为:所述显示屏像素点个数为所述音频帧最大量化值的整数倍或1/2倍。
[0035]图2表示本发明实施例所述的显示屏上像素点分布示意图。
[0036]参见图2所示,以一手机终端为例,由于各种移动终端的屏幕像素是不一样的,而通常标准的配置的屏幕为480*800分辨率,也就是说,这种屏幕总共有38400个像素点。本实施例就以一个480*800的表格来模拟屏幕的像素点,每一个格子就代表屏幕上的一个像素点,然后从上往下,从左往右排序,最左上方是O,最右下方是38400。
[0037]另外,如图2所示,音频数据的采集通过该手机终端的麦克采集,目前音频数据是20ms采集一次,每次采集会包含160个音频帧,每个音频帧是2个字节,即16位。按照换算,每个音频帧可以用0-65535的整数来表示。
[0038]由于音频帧是0-65535,所以为了方便,不需要使用全部的屏幕像素点,设计的时候取其中的32768个像素点就可以了。这样正好是音频帧最大数值的一半。这样,就可以预先设置音频帧与显示屏像素点的对应关系为音频帧数值每两位就对应一个屏幕像素点。
[0039]通过本实施例的上述技术方案,对音频帧每次采集的时候,由于人讲话的声音不同,每次采集到的音频帧的数值大小也会不同。这样根据音频帧的不同就可以对应到不同的屏幕像素点上面,最终形成不同的涂鸦画面。
[0040]优选地,所述对所述像素点进行颜色处理包括:获取所述像素点的当前RGB值;调用系统的随机函数计算出一预设范围内的随机值;将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值。
[0041]通过上个实施例可以完成音频帧到像素点的转换,而在本实施例中,要对各个像素点进行颜色处理,首先,需要了解一个色阶的概念,色阶是表示液晶显示屏亮度强弱的指数标准,也就是通常所说的色彩指数。各种屏幕的色阶不同,目前市面上常用的1600W色阶。一般手机显示屏是以RGB来表示颜色的,从纯黑色#000000,到纯白&#FFFFFF,对应整数是 0-16777215。
[0042]在本实施中仍以具有32768个像素点的显示屏为例,每个像素点的RGB颜色初始状态都置为#000000,即一开始都是纯黑色的。
[0043]像素点的初始RGB值是0,每一个像素点在被一音频帧对应后,均调用随机函数算出一个0-50000以内的数值,用这个数值与RGB初始值相加形成一新的RGB值作为该像素点处理后的颜色值。此处的50000这个值可以在系统设计的时候动态调整,也可以是500000或者其他值,具体可根据效果来调节。如果某个像素点被对应了多次,因此累加后的值就可能超过#FFFFFF,那么就开始做减法用#FFFFFF值减去该像素点当前的RGB值,作为该像素点的新的RGB值,如此不停的循环,直到讲话完毕。
[0044]这样一段话讲下来,就会呈现出一幅很随意的涂鸦作品,当然用户也可以固定某个声音频率说话,那么就会显示一段区域内的一幅图画作品。
[0045]优选地,所述将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值包括:判断所述像素点的标志位的赋值为O还是1,并得出第一判断结果;在所述第一判断结果为O时,将所述当前RGB值与所述随机值相加;在所述第一判断结果为I时,将所述当前RGB值与所述随机值相减。
[0046]在将一段音频数据的一个一个的音频帧向显示屏上的像素点进行转换的过程中,一个像素点可以被一个以上的音频帧所对应,此时用该像素点的当前RGB值与随机值是进行相加还是相减要根据该像素点所设定的标志位来进行判断,即在计算出随机值后,就读取该标志位,该标志位可以设置为B,如果B为O就把随机值和像素点的当前RGB值相加,如果B为1,就用像素点的当前RGB值减去随机值,如此来得到一个像素点新的RGB值。
[0047]在该像素点在下一次又被一个音频帧对应时,此时用该像素点的当前RGB值与随机值是进行相加还是相减要仍要根据该像素点所设定的标志位来进行判断,只是,该标志位会根据上一次的像素点新的RGB值进行变换。
[0048]优选地,所述标志位的赋值根据所述像素点的新RGB值进行转换,在所述像素点的新RGB值由所述当前RGB值与所述随机值相加达到第一阈值时,将所述标志位的赋值置为1,在所述像素点的新RGB值由所述当前RGB值与所述随机值相减达到第二阈值时,将所述标志位的赋值置为O。
[0049]在本实施例的上述技术方案中,可设置第一阈值为#FFFFFF( 16777215),第二阈值为O,也就是说,这个新像素点值如果小于等于O,那么把标志位B置O,并把这个新像素点置设置为O ;这个像素点值如果大于等于#FFFFFF (16777215),就把标志位B置1,并把这个新像素点值设置为#FFFFFF。
[0050]本实施例的上述技术方案,设置了像素点的颜色处理方法,通过随机函数计算出随机值,并与该像素点的当前RGB值相加或相减得出该像素点的新RGB值,并将该新RGB值赋给该像素点并在显示屏上显示出来,但是这种颜色处理方法并不唯一,而且调用系统的随机函数计算出的随机值区间也是可以根据实际效果进行调节的,因此任何允许的能对像素点颜色进行处理的方法均涵盖在本发明保护范围之内。[0051]优选地,在所述获取一段音频数据之后,所述语音涂鸦的实现方法还包括:将所述音频数据放入一存储单元;并将所述音频数据以所述音频帧为单位输出。
[0052]图3表示本发明实施例所述的音频数据采集方法流程图。
[0053]本实施例给出的是音频数据采集的方法,具体可参见图3所示,音频数据采集的方法可按如下步骤进行:
[0054]步骤301:初始化线程和各参数状态;
[0055]在本步骤中,需要初始化的线程有:初始化音频采集线程以及涂鸦线程,即音频采集线程以及涂鸦线程均准备开始工作;需要初始的参数有:设置显示屏方块区域中的像素点RGB值为全0,即纯黑色。
[0056]步骤302:音频采集系统启动;
[0057]在本步骤中,音频采集线程启动工作,并且可以设置为每20ms采集一次,一次采集160个音频帧,每个音频帧是16位,即0-65535。
[0058]步骤303:每20ms采集音频数据;
[0059]根据上述设置,音频采集线程实时的不停采集音频数据,并且每20ms采集一次,一次采集160个音频帧,每个音频帧是16位,即0-65535。
[0060]步骤304:采集数据存放在Buff缓存中;
[0061]在本步骤中,用户开始讲话,音频采集系统实时的不停采集音频数据,采集到的数据放在一个缓存buff中。
[0062]步骤305:是否结束;
[0063]本步骤的是指判断是否有音频可供采集,若是,结束音频采集工作,若否,返回执行步骤303。
[0064]通过本实施例的上述技术方案在系统的缓存buff中,就采集了一定音频数据,同时另外一个涂鸦线程开始工作,具体可参见图4。
[0065]图4表示本发明实施例所述的语音涂鸦系统工作流程图。
[0066]参见图4所示,语音涂鸦系统具体工作流程可包括如下步骤:
[0067]步骤401:初始化线程和各参数状态;
[0068]步骤402:涂鸦线程启动;
[0069]在本步骤中,涂鸦线程开始从buff中获取一个个音频帧数据,比如15634,3789,23456等,每次根据获取的数据除以2后取整,然后根据这个数值去找到显示屏对应的方块区域中的像素点。此处,除以2后取整是根据本发明所采用的实施例中的音频帧与像素点对应关系决定的,但是,该对应关系不是唯一的,根据具体情况而定,即根据音频帧与像素点设置的对应关系而定。
[0070]步骤403:buff中是否有数据;
[0071]判断buff中是否有数据,若是,执行步骤404,若否返回继续执行步骤403 ;
[0072]步骤404:取其中一个数据,根据屏幕比例操作后(除以2)找到对应的方块区域;
[0073]在本步骤中,找到某个具体的像素点后,先获取该像素点的当前RGB数值。
[0074]步骤405:调用系统随机函数得到一个随机值;
[0075]在本步骤中,调用系统的随机函数计算出一个0-50000之间的值出来,如果系统的随机函数生成器是0-1的值,那么再乘以50000。此处的50000这个值可以在系统设计的时候动态调整,也可以是500000或者其他值,具体可根据效果来调节。
[0076]步骤406:读取标准位B ;
[0077]计算出随机值后,再读取标志位B,如果标志位B为O就把随机值和像素点原来的值相加,如果标志位B为1,就把原来的像素点值减去随机值,这样就得到一个新的像素点值。至于标志位B,在系统设置时,每一个像素点都设置了一个标志位,并且给该标志位B赋了初始值,即O或1,但是在该像素点被音频帧对应后,该标志位B的赋值会发生变化,这一点在随后的实施例中会具体说明。
[0078]步骤407:根据标志位做相应的加法或减法;
[0079]在步骤406中,已经说明如果标志位B为O就把随机值和像素点原来的值相加,如果标志位B为1,就把原来的像素点值减去随机值。但是随着该像素点被对应的次数增加,其累加值或累减值可能会达到系统设置的阈值,如O或#FFFFFF (16777215),因此,在本实施例中,设置这个新像素点值如果小于等于0,那么把标志位B置0,并把这个新像素点置设置为O ;这个像素点值如果大于等于#FFFFFF (16777215),就把标志位B置1,并把这个新像素点值设置为#FFFFFF。
[0080]步骤408:把新得到的值(RGB值)写入对应的像素点,并显示在屏幕上;
[0081]步骤409:是否结束;
[0082]不停的重复上述步骤,直到buff缓存中为空,那么停止等待buff中的数据到来,并且按下停止结束按钮,所有线程停止操作,画面上显示出来的色彩图案就是用户的语音涂鸦作品,这个作品用户可以进行保存,或者共享操作。
[0083]图5表示本发明实施例所述的语音涂鸦的实现装置的结构示意图。
[0084]参见图5所示,语音涂鸦的实现装置,应用于带有显示屏的终端,包括:第一获取模块50,用于获取一段音频数据;对应模块52,用于根据预先设定的音频帧与所述显示屏像素点的对应关系将所述音频数据的每一音频帧对应为所述显示屏上的像素点;处理模块,用于对所述像素点进行颜色处理;处理模块54,用于对所述像素点进行颜色处理;以及显示模块56,用于将处理后的像素点在所述显示屏上显示,使得所述音频数据转换为一副涂鸦作品。
[0085]优选地,所述处理模块54包括:第二获取模块(图中未示),用于获取所述像素点的当前RGB值;调用模块(图中未示),用于调用系统的随机函数计算出一预设范围内的随机值;计算模块(图中未示),用于根据预设标志位的赋值将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值。
[0086]优选地,所述计算模块(图中未示)包括:第一判断模块(图中未示),用于判断所述预设标志位的赋值为O还是1,并得出第一判断结果;相加模块(图中未示),用于在所述第一判断结果为O时,将所述当前RGB值与所述随机值相加;相减模块(图中未示),用于在所述第一判断结果为I时,将所述当前RGB值与所述随机值相减。
[0087]优选地,所述语音涂鸦的实现装置还包括:存储模块(图中未示),用于将所述音频数据放入一存储单元;输出模块(图中未示),用于将所述音频数据以所述音频帧为单位输出。
[0088]本发明提供的终端包括上述的语音涂鸦的实现装置。
[0089]通过本发明的以上实施例,可以看出,一段讲话、一段录音以及任何一段音频,通过本发明提供的技术方案,就会呈现出一幅很随意的涂鸦作品,而且没有任何的复杂操作,没有任何硬件上的投入,只是通过音频采集系统就会在显示屏上显示一段区域内的一幅图画作品,提高了使用者的用户体验。
[0090]以上所述是本发明的优选实施方式,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【权利要求】
1.一种语音涂鸦的实现方法,应用于带有显示屏的终端,其特征在于,包括: 获取一段音频数据; 根据预先设定的音频帧与所述显示屏的显示区域像素点的对应关系将所述音频数据的每一音频帧对应为所述显示屏上的像素点; 对所述像素点进行颜色处理;以及 将处理后的像素点在所述显示区域上显示,使得所述音频数据转换为一副涂鸦作品。
2.如权利要求1所述的语音涂鸦的实现方法,其特征在于,所述音频帧与所述显示屏的显示区域像素点的对应关系至少为如下一种: 所述显示区域的像素点个数大于等于音频帧最大量化值的时候,一个音频帧对应I个或多个显示区域像素点; 所述显示区域像素点个数小于音频帧最大量化值的时候,一个或多个音频帧对应一个显示区域像素点。
3.如权利要求1所述的语音涂鸦的实现方法,其特征在于,所述对所述像素点进行颜色处理包括: 获取所述像素点的当前RGB值; 调用系统的随机函数计算出一预设范围内的随机值; 将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值,并将所述新RGB值赋予所述像素点。
4.如权利要求3所述的语音涂鸦的实现方法,其特征在于,所述将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值包括: 判断所述像素点的标志位的赋值为O还是1,并得出第一判断结果; 在所述第一判断结果为O时,将所述当前RGB值与所述随机值相加; 在所述第一判断结果为I时,将所述当前RGB值与所述随机值相减。
5.如权利要求4所述的语音涂鸦的实现方法,其特征在于,所述标志位的赋值根据所述像素点的新RGB值进行转换,在所述像素点的新RGB值由所述当前RGB值与所述随机值相加达到第一阈值时,将所述标志位的赋值置为1,在所述像素点的新RGB值由所述当前RGB值与所述随机值相减达到第二阈值时,将所述标志位的赋值置为O。
6.如权利要求1所述的语音涂鸦的实现方法,其特征在于,在所述获取一段音频数据之后,所述语音涂鸦的实现方法还包括: 将所述音频数据放入一存储单元; 并将所述音频数据以所述音频帧为单位输出。
7.如权利要求6所述的语音涂鸦的实现方法,其特征在于,在将处理后的像素点在所述显示屏上进行显示之后,所述语音涂鸦的实现方法还包括: 判断所述存储单元是否为空,并得出第三判断结果; 在所述第三结果为所述存储单元不为空时,重复执行所述对所述像素点进行颜色处理至所述将处理后的像素点在所述显示区域上显示,使得所述音频数据转换为一副涂鸦作品O
8.一种语音涂鸦的实现装置,应用于带有显示屏的终端,其特征在于,包括: 第一获取模块,用于获取一段音频数据;对应模块,用于根据预先设定的音频帧与所述显示屏像素点的对应关系将所述音频数据的每一音频帧对应为所述显示屏上的像素点; 处理模块,用于对所述像素点进行颜色处理;以及 显示模块,用于将处理后的像素点在所述显示屏上显示,使得所述音频数据转换为一副涂鸦作品。
9.如权利要求8所述的语音涂鸦的实现装置,其特征在于,所述处理模块包括: 第二获取模块,用于获取所述像素点的当前RGB值; 调用模块,用于调用系统的随机函数计算出一预设范围内的随机值; 计算模块,用于将所述当前RGB值与所述随机值进行计算获取所述像素点的新RGB值,并将所述新RGB值赋予所述像素点。
10.如权利要求9所述的语音涂鸦的实现装置,其特征在于,所述计算模块包括: 第一判断模块,用于判断所述像素点的标志位的赋值为O还是1,并得出第一判断结果; 相加模块,用于在所述第一判断结果为O时,将所述当前RGB值与所述随机值相加; 相减模块,用于在所述第一判断结果为I时,将所述当前RGB值与所述随机值相减。
11.如权利要求9所述的语音涂鸦的实现装置,其特征在于,还包括: 存储模块,用于将所述音频数据放入一存储单元; 输出模块,用于将所述音频数据以所述音频帧为单位输出。
12.—种终端,其特征在于,包括权利要求8-11任一项所述的语音涂鸦的实现装置。
【文档编号】G06F3/14GK103685683SQ201210321276
【公开日】2014年3月26日 申请日期:2012年9月3日 优先权日:2012年9月3日
【发明者】周煜申 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1