视频应用中视频资源的过滤方法、终端及存储介质与流程

文档序号:17926236发布日期:2019-06-15 00:26阅读:215来源:国知局
本发明涉及视频处理
技术领域
:,更具体地说,涉及一种视频应用中视频资源的过滤方法、终端及存储介质。
背景技术
::随着互联网技术的发展,网络视频的数量越来越多,人们在观看视频应用中的视频时,可能会遇到包含有自己不喜欢的音频内容的视频,这就需要对视频进行过滤。但是相关技术中,对于视频的过滤方式主要是基于视频标题的过滤方法最大限度的去除标题的相似度高的视频,这导致带有用户不喜欢的音频的视频并未被过滤,影响用户观看视频的体验,降低了用户的体验度。例如,当前智能终端上一些短视频播放应用,当用户使用这些短视频播放应用时,有些视频的配乐比较俗套,用户不想观看具有俗套配乐的视频的,但是相关技术没有针对视频资源中的音频的过滤方法,导致用户重复刷到俗套配乐视频,影响了用户体验。技术实现要素:本发明要解决的技术问题在于:现有技术不能基于视频资源中的音频信息过滤视频资源,针对该技术问题,提供一种视频应用中视频资源的过滤方法、终端及存储介质。为解决上述技术问题,本发明提供一种视频应用中视频资源的过滤方法,所述视频应用中视频资源的过滤方法包括:获取视频应用中待识别的视频资源中的音频识别信息;判断获取的所述音频识别信息是否在预设的识别信息库中,所述信息库中包括需要进行过滤处理的目标音频识别信息;如是,对视频进行过滤处理。可选的,所述视频应用中待识别的视频资源中的音频识别信息包括所述视频应用中待识别的视频的背景音的音频信息。可选的,所述视频应用中待识别的视频资源中的音频识别信息包括所述视频应用中待识别的视频之视频内容的音频识别信息。可选的,所述音频识别信息包括以下两种信息中的至少一种:音频特征值;音频类型识别标识。可选的,预设所述识别信息库包括以下两种方式中的至少一种:接收音频识别设置指令,将上述音频识别设置指令所指示的音频识别信息作为目标音频识别信息添加到识别信息库中;检测当前播放视频的播放状态,当播放状态与预设的目标播放状态相同时,获取该当前播放视频的音频识别信息作为目标音频识别信息添加到识别信息库中。可选的,所述预设所述识别信息库包括接收音频识别设置指令时,上述音频设置指令包括第一音频设置指令和第二音频设置指令中的至少一个:第一音频设置指令为在视频播放过程中接收到的用于指示该视频的音频识别信息作为目标音频识别信息的指令;第二音频设置指令为在视频过滤设置界面接收到的,用于指示视频过滤设置界面上所呈现出的音频识别信息中哪些音频识别信息作为目标音频识别信息的指令。可选的,上述预设所述识别信息库包括检测当前播放视频的播放状态时,当前播放视频的播放状态包括第一视频的播放状态和第二视频的播放状态中的至少一个:上述第一视频播放状态为当前视频的视频播放有效时长小于预设播放时长阈值的状态;上述第二视频播放状态为当前视频播放过程中存在预设的快进播放方式的状态。可选的,上述视频进行过滤处理包括以下两种方式中的任意一种:将当前被识别的视频应用中的视频资源直接过滤;将当前被识别的视频应用中的视频资源对应的音频内容进行替换。进一步地,本发明还提供一种终端,包括终端包括处理器、存储器以及通信总线;通信总线用于实现所述处理器与上述存储器之间的通信连接;处理器用于执行存储器中存储的一个或者多个程序,以实现上述的视频应用中视频资源的过滤方法的步骤。进一步地,本发明还提供了一种计算机可读存储介质,计算机存储介质存储有一个或者多个程序,上述一个或者多个程序可被一个或者多个处理器执行,以实现上述的视频应用中视频资源的过滤方法的步骤。有益效果本发明提供一种视频应用中视频资源的过滤方法、终端及存储介质,针对现有,用户观看视频时,不能过滤带有用户不喜欢音频的视频问题,通过获取视频应用中待识别的视频资源中的音频识别信息;判断获取的所述音频识别信息是否在预设的识别信息库中,预设识别信息库中包括但不限于音频特征值、音频类型识别标识中的至少一种,当检测到待识别视频资源中的音频识别信息在识别信息库时,对上述视频资源进行过滤处理。解决了相关技术不能基于视频资源中的音频信息过滤视频资源的问题,如,用户观看视频时,出现不喜欢的音频,则将该音频的识别信息添加到识别信息库中,当检测到该音频的识别信息时,则过滤带该音频的视频,提升了用户体验的满意度。附图说明下面将结合附图及实施例对本发明作进一步说明,附图中:图1为实现本发明各个实施例一个可选的移动终端的硬件结构示意图。图2为如图1所示的移动终端的无线通信系统示意图;图3为本发明实施例一中的视频应用中视频资源的过滤方法的基本流程图;图4为本发明实施例一中的视频应用中预设识别信息添加的基本流程图;图5为本发明实施例一中的音频识别标识结构示意图;图6为本发明实施例一中的识别信息库结构示意图;图7为本发明第三实施例中的终端的结构示意图。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(personaldigitalassistant,pda)、便捷式媒体播放器(portablemediaplayer,pmp)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字tv、台式计算机等固定终端。后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:rf(radiofrequency,射频)单元101、wifi模块102、音频输出单元103、a/v(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。下面结合图1对移动终端的各个部件进行具体的介绍:射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于gsm(globalsystemofmobilecommunication,全球移动通讯系统)、gprs(generalpacketradioservice,通用分组无线服务)、cdma2000(codedivisionmultipleaccess2000,码分多址2000)、wcdma(widebandcodedivisionmultipleaccess,宽带码分多址)、td-scdma(timedivision-synchronouscodedivisionmultipleaccess,时分同步码分多址)、fdd-lte(frequencydivisionduplexing-longtermevolution,频分双工长期演进)和tdd-lte(timedivisionduplexing-longtermevolution,分时双工长期演进)等。wifi属于短距离无线传输技术,移动终端通过wifi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了wifi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或wifi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。a/v输入单元104用于接收音频或视频信号。a/v输入单元104可以包括图形处理器(graphicsprocessingunit,gpu)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或wifi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板1061。用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。为了便于理解本发明实施例,下面对本发明的移动终端所基于的通信网络系统进行描述。请参阅图2,图2为本发明实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的lte系统,该lte系统包括依次通讯连接的ue(userequipment,用户设备)201,e-utran(evolvedumtsterrestrialradioaccessnetwork,演进式umts陆地无线接入网)202,epc(evolvedpacketcore,演进式分组核心网)203和运营商的ip业务204。具体地,ue201可以是上述终端100,此处不再赘述。e-utran202包括enodeb2021和其它enodeb2022等。其中,enodeb2021可以通过回程(backhaul)(例如x2接口)与其它enodeb2022连接,enodeb2021连接到epc203,enodeb2021可以提供ue201到epc203的接入。epc203可以包括mme(mobilitymanagemententity,移动性管理实体)2031,hss(homesubscriberserver,归属用户服务器)2032,其它mme2033,sgw(servinggateway,服务网关)2034,pgw(pdngateway,分组数据网络网关)2035和pcrf(policyandchargingrulesfunction,政策和资费功能实体)2036等。其中,mme2031是处理ue201和epc203之间信令的控制节点,提供承载和连接管理。hss2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过sgw2034进行发送,pgw2035可以提供ue201的ip地址分配以及其它功能,pcrf2036是业务数据流和ip承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。ip业务204可以包括因特网、内联网、ims(ipmultimediasubsystem,ip多媒体子系统)或其它ip业务等。虽然上述以lte系统为例进行了介绍,但本领域技术人员应当知晓,本发明不仅仅适用于lte系统,也可以适用于其他无线通信系统,例如gsm、cdma2000、wcdma、td-scdma以及未来新的网络系统等,此处不做限定。基于上述移动终端硬件结构以及通信网络系统,提出本发明方法各个实施例。第一实施例图3为本实施例提供的视频应用中视频资源的过滤方法的基本流程图,该视频应用中视频资源的过滤方法包括:s301、获取视频应用中待识别的视频资源中的音频识别信息;s302、判断获取的音频识别信息是否在预设的识别信息库,如是,转至s303;否则,转至s304;s303、对该音频识别信息对应的视频资源进行过滤处理;s304、不做处理。在本实施例中,上述的视频应用中待识别的视频资源中的视频应用可以为以下应用但不限于以下应用中的至少一种:离线视频应用,如:优酷、爱奇艺、腾讯视频、影音先锋、迅雷看看、potplayer等;在线视频应用,如:优酷,爱奇艺、腾讯视频、抖音、快手、暴风影音等;短视频应用,如:抖音、快手、美拍、微视、好看视频、秒拍视频等;长视频应用,如:优酷、爱奇艺、腾讯视频、暴风影音等。获取视频应用中待识别的视频资源中的音频识别信息中获取包括但不限于以下方式中的至少一种:视频资源内获取,即该待识别资源视频所带的信息,如,视频背景音、视频主体内容音、视频音频关键帧等;视频资源外获取,如,为视频音频所做分类,标识,序列号等。获取视频应用中待识别的视频资源中的音频识别信息中的音频识别信息包括但不限于以下识别信息中的至少一种:视频应用中待识别的视频的背景音的音频识别信息;视频应用中待识别视频之视频内容的音频识别信息。其中视频应用中待识别的视频的背景音可以为伴乐、配乐等用于调节气氛的一种音乐,作为背景衬托的音乐;也可以是与主体的意识行为无直接关系的背景音。其中视频应用中待识别的视频的视频内容可以为与主体的意识行为相关的声音。视频应用中视频资源之中的过滤方法中的识别信息库可以存放在以下至少一个地方:终端本地存储;服务器存储。如图5所示,视频应用中待识别的视频资源中的音频识别信息包括但不限于以下信息中的至少一种:音频特征值;音频类型识别标识。音频识别信息包括音频特征值特征时,该音频特征值包括但不限于以下中的至少一种:频谱质心、频谱差分幅度、频谱截止频谱、频谱峰度、梅尔频率倒谱系数、线性预测倒谱系数、线性预测倒谱系数、短时能量均方值、过零率、高过零帧比率、低能帧比率、噪音帧比率、谱矩。另外,应当理解的是,音频特征值的获取方式不受限定,每一种音频特征值可以有不同的获取方式,例如,一种示例中,梅尔频率倒谱系数的获取步骤可包括但不限于以下步骤:预加重:目的是为了对语音的高频部分进行加重,使信号的频谱变得平坦,移除频谱倾斜,来补偿语音信号受到发音系统所抑制的高频部分,同时,也是为了消除发生过程中声带和嘴唇的效应;分帧:根据语音的短时平稳特性,语音可以以帧为单位进行处理;加窗:采用哈明窗对一帧语音加窗,以减小吉布斯效应的影响;快速傅里叶变换:将时域信号变换成为信号的功率谱;三角窗滤波:用一组mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,一次来模拟人耳的掩蔽效应;求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变化的结果;经离散余弦变换(discretecosinetransformation,dct):得到梅尔频率倒谱(mfcc)系数。音频识别信息包括音频类型识别标识时,该音频类型识别标识包括但不限于以下标识中的至少一种:主题:ktv热歌、网络歌曲、现场音乐、背景音乐、经典、情歌、古风、中国风、儿歌、acg、综艺、影视、游戏、乐器、城市、厂牌专区;场景:夜店、学习工作、咖啡馆、运动、睡前、旅行、跳舞、派对、婚礼、约会、校园;心情:伤感、安静、快乐、励志、治愈、思念、甜蜜、寂寞、宣泄;年代:00年代、90年代、80年代、70年代;流派:流行、电子、轻音乐、民谣、说唱、摇滚、爵士、r&b、布鲁斯、古典、后摇、乡村、金属、新世纪、世界音乐、中国传统;语种:英语、粤语、韩语、日语、国语、闽南语、小语种、法语、拉丁语。需要说明的是一个音频可以具有多个音频类型标识。如图6所示,预设上述识别信息库包括但不限于以下两种方式中的至少一种:第一种预设信息库方式:接收音频识别设置指令,将接收到的音频识别设置指令所指示的音频识别信息作为目标音频识别信息添加到识别信息库中;第二种预设信息库方式:检测当前播放视频的播放状态,当播放状态与预设的目标播放状态相同时,获取该当前播放视频的音频识别信息作为目标音频识别信息添加到识别信息库中。当预设上述识别信息库为第一种预设信息库方式时,第一种预设信息库方式的接收音频识别设置指令包括但不限于以下两种中的至少一种:第一种接收音频识别设置指令为:在视频应用中设置过滤界面设置音频识别指令,初次打开视频应用时在设置过滤界面设置音频识别指令,也可以在任何时候进入设置过滤界面设置音频识别指令,上述音频识别设置指令所指示的音频识别信息作为目标音频识别信息添加到识别信息库中;如,用户第一次打开视频应用时,终端可以发出询问,询问可以以视频过滤设置界面展出,视频过滤设置界面中可以包含:音频类型识别标识,用户可以选择多个音频类型识别标识,当接收到用户的设置指令时,添加用户指令对应的音频类别识别标识作为目标添加到识别信息库中。该视频过滤设置界面还可以包含:音频特征值,用户可以选择自己不想听到的音频作为目标文件添加到该界面,该界面可以将目标文件的音频识别信息作为目标添加到识别信息库中。用户也可在任何时候进入视频过滤设置界面,如,当用户观看视频时,发现该视频的音频类别为不喜欢的音频类别,则可以进入视频过滤设置界面添加该视频的音频识别信息到识别信息库中。第二种接收音频识别设置指令为:用户在观看视频时,不喜欢当前视频的音频,发出设置音频识别设置指令将当前视频的音频的识别信息添加到识别信息库中,发出音频设置指令的方式包括但不限于以下方式中的至少一种:如,用户在观看视频时,不喜欢当前视频的音频,则点击特定的按钮,将该视频的音频识别信息添加到识别信息库中,该音频识别信息可以为音频特征值,也可以为音频类别识别标识;如,当用户观看视屏时,不喜欢当前视频的音频,则发出语音指令将该视频的音频识别信息添加到识别信息库中;当预设上述识别信息库为第二种预设信息库方式时,第二种预设信息库方式包括但不限于以下方式中的至少一种:第一视频播放状态;第二视频播放状态。第一视频播放状态为:用户观看当前视频时,当前视频播放有效时长小于当前视频预设播放时长阈值的状态,即,用户观看视频时,检测用户观看该视频的有效时长与该视频预设播放时长阈值是否相符合,用户观看该视频的有效时长小于该视频预设播放时长阈值的状态为第一视频播放状态;当视频的播放状态符合第一视频播放状态时,可以直接添加该视频的音频识别信息到识别信息库,也可以收集用户反馈信息判断是否将该视频的音频识别信息添加到识别信息库,即,当用户观看该视频的有效时长小于该视频预设播放时长阈值的状态时,发出询问信息,询问用户是否将该视频的音频识别信息添加到识别信息库,用户反馈添加则添加该视频的音频识别信息到识别信息库。如,用户观看视频时,观看视频有效时长为10秒,预设该视频播放视频时长为15秒钟时,可以直接添加该视频的音频识别信息到识别信息库中,也可以询问用户是否将该视频的音频识别信息添加到识别信息库,如用户反馈添加则添加该视频的音频识别信息到识别信息库。用户观看视频有效时长与预设该视频播放时长包括但不限于以上示例。第二视频播放状态为:当前视频播放过程中存在预设的快进播放方式的状态。预设的快进播放方式的状态包括但不限于以下状态中的至少一种:当前视频播放过程中,多次跳过相同音频关键帧;当前视频播放过程中,出现快进行为。出现第二视频播放状态时,可以直接添加该视频的音频识别信息到识别信息库,也可以收集用户反馈信息判断是否将该视频的音频识别信息添加到识别信息库,当用户观看该视频出现第二视频播放状态时,发出询问信息,询问用户是否将出现第二视频播放状态的视频的音频识别信息添加到识别信息库,如用户选择添加,则将出现第二视频播放状态的视频的音频的识别信息添加到识别信息库。如,当用户观看视频时,该视频存在多个背景音,当用户多次跳过相同背景音的关键帧信息时,则判定用户不喜欢该视频的该音频,可以将该音频的识别信息添加到识别信息库;也可在用户观看完该视频时,发出询问,询问用户是否添加多次跳过相同音频的关键帧的音频识别信息到识别信息库中,用户选择添加,则将该多次跳过相同音频的关键帧信息的音频的识别信息添加到识别信息库中。当用户观看视频时,多次存在快进行为,则标记被快进时长中的音频,当标记达到一定次数时,添加该音频的识别信息到识别信息库中,或,当标记达到一定次数时,询问用户是否将该音频的识别信息添加到识别信息库中。s303、对该音频识别信息对应的视频资源进行过滤处理包括但不仅限于以下处理方式中的至少一种:将识别信息对应的视频直接过滤处理;将识别信息对应的音频内容进行替换。替换有包括但不仅限以下方式中的至少一种:将识别信息库中对应的音频内容屏蔽处理,保留不在识别信息库中的音频;将识别信息库中对应的音频内容更换处理。例如,当前观看视频的背景音的音频识别信息在识别信息库中,则对视频的背景音做屏蔽处理,但保留视频内容的声音。如,当前观看视频的背景音的音频识别信息在识别信息库中,则对视频的背景音做替换处理,但保留视频内容的声音;视频应用中视频资源的过滤方法可以用在包括但不限于以下场景中的至少一种:当用户打开视频应用时,界面加载的视频,此时可以直接对该界面的视频进行过滤处理;当用户打开播放列表时,用户查看列表视频但未播放视频时,比对第一个未播放视频,如第一个未播放视频的音频识别信息在音频识别信息库中则对该视频进行过滤处理,然后继续对比下一个未播放视频,直到比对完该视频播放列表,更新比对完的视频列表;当用户观看视频时,有下一个未播放视频时,则识别下一个未播放视频,如下一个未播放视频的音频识别信息在音频识别信息库中则屏蔽该未播放视频,然后继续对比下一个未播放视频,直到比对到下一个未播放视频的音频识别信息不在音频识别信息库中为止。例如,当用户在打开视频应用时,该视频资源的过滤方法直接开始获取当前界面上的视频的音频识别信息,如发现带有识别信息库中识别信息的音频,则直接将该视频过滤,重新加载新的视频,直到该界面的任一视频的音频识别信息不再识别信息库中;如,当用户打开播放列表时,当前第一个未播放视频为b,获取视频b的音频,获取其音频的识别信息,与识别信息库中的识别信息做对比,如果b的音频识别信息和识别信息库中的识别信息相符合就继续对比下一个视频的音频,直至下一个视频的识别信息与识别信息库中的识别信息不一致,此时更新视频列表,把之前与识别信息库中相符合的视频从列表中去掉,显示与视频识别信息库中识别信息不相同的视频;如,当视频已经播放时,下一个未播放视频为c,获取视频c的音频,获取其音频的识别信息,与识别信息库中识别信息做对比,如果c的识别信息值和识别信息库中相符合就跳过c,继续对比下一个视频的配乐音频,直至下一个视频的音频识别信息与识别信息库中不一致。此外,需要说明的是,如果目标视频资源具有多个背景音和/或内容音,可以发出询问,询问用户是否添加该视频的音频的识别信息到识别信息库。如用户讨厌的视频具有a、b、c背景音,d、e、f视频内容音,则用户可以分别选择背景音a、b、c和/或d、e、f视频内容的音频识别信息作为目标添加到识别信息库。第二实施例为了更好的理解本发明,本实施例提供一种更加具体的应用场景来理解本发明。用户打开视频应用时,出现视频过滤设置界面,用户选择音频识别标识作为目标添加到识别信息库中,音频识别标识包括但不限于以下标识:ktv热歌、网络歌曲、现场音乐、古风、acg、综艺、夜店、派对、跳舞、约会、伤感、快乐、安静。该识别信息库为本地识别信息库,即该识别信息库存储在终端。当用户进入视频应用界面时,开始匹配该界面具有识别信息库中音频识别信息的视频,如匹配到具有识别信息库中音频识别信息的视频则替换该视频,更新该视频界面,直到将该界面的视频不在有具有识别信息库中音频识别信息的视频。此外,需要说明的是,视频应用界面可以为进入应用时的界面,也可以是任意带有视频资源的界面。此外,需要说明的是,如视频中存在多个背景音时,或多个视频内容时,如视频前半部分背景音乐为a音乐,后半部分为b音乐时,而a音乐的识别信息在识别信息库时,则可以过滤a音乐而保留b音乐和视频内容音频,或过滤a和b音乐保留视频内容,或可以直接过滤该视频。当用户在视频应用观看视频时,发现不喜欢该视频的背景音,则发出音频识别设置指令,将该视频的背景音的特征值作为目标添加到识别信息库中;或用户不喜欢该类背景音,也可以将该视频的背景音的识别标识作为目标添加到识别信息库。此处设置方法可以为:直接在观看视频界面添加该音背景音的识别标识到识别信息库;或在视频过滤设置界面添加该背景音的识别标识到识别信息库。此外,需要说明的是,除了视频的背景音可以做为识别目标外,也可以是视频内容的声音的作为识别目标。当用户观看视频存在下一个未播放视频时,后台识别下一个未播放视频,如该视频的音频的识别信息在识别信息库中时,则屏蔽该视频,然后识别下一个未播放视频,直到识别到视频的音频的识别信息不在识别信息库中的视频为止。当用户打开播放列表时,识别该列表中的视频的音频识别信息,当识别完成时,更新该播放列表,更新的播放列表可以是:将不具有识别信息库中识别信息的音频的视频排在具有识别信息库中识别信息的音频的视频的前面,也可以是直接屏蔽具有识别信息库中识别信息的音频的视频,保留不具有识别信息库中识别信息的音频的视频,也可以是将具有识别信息库中识别信息的音频的视频的音频做过滤处理。当用户观看视频出现快进时,如,十分钟的视频用户只花了三十秒就跳到该视频结尾时,可以对该视频的音频内容做标记,多次检测到用户跳过标记音频,则可以将该视频的音频识别信息作为目标添加到识别信息库。识别信息库中的识别信息用户可以自行选择删除,如,识别信息库中有流行识别标识作为识别信息时,当用户想将流行识别标识从识别信息中移出时,可以选择将流行作为识别信息目标从识别信息库中移出。第三实施例本实施例还提供了一种视频应用中视频资源的过滤终端,终端可以是手机、平板电脑、笔记本电脑、掌上电脑、pda等移动终端,也可以是诸如数字tv、台式计算机等固定移动终端。参见图7所示,其包括处理器71、存储器72、及通信总线73,其中:通信总线73用于实现处理器71和存储器72之间的连接通信;处理器71用于执行存储器72中存储的视频应用中视频资源的过滤方法程序。本实施例提供了一种计算机存储介质,该计算机存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如上述各实施例中所述的视频应用中视频资源的过滤方法的步骤,这里不再赘述。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1