一种处理视频文件的方法及电子设备与流程

文档序号:20512359发布日期:2020-04-24 18:41阅读:118来源:国知局
一种处理视频文件的方法及电子设备与流程

本申请涉及通信技术领域,尤其涉及一种处理视频文件的方法及电子设备。



背景技术:

随着移动终端的普及,用户对相机应用的使用也越来越频繁。于是,移动终端中存储有大量的视频文件,有用户自己使用相机应用拍摄的视频,有其他用户发送的视频、还有从网上下载的视频等。

然而,这些视频中的内容对用户的意义和价值各不相同。换句话来说,用户可能只关注视频中的某部分内容。例如:幼儿园老师给家长们发送的大量视频中,用户可能只关注有自己家孩子的视频或者片段。

目前,有一些视频应用能够提供了人工剪裁视频的功能。但这需要用户播放每一个视频,并通过滑动播放进度条来查找并剪辑出自己关注的片段。由于用户关注的片段在视频中的位置具有未知性,用户极可能会不停的来回滑动播放进度条,以查找关注的片段。显然,用户操作复杂,效率低,且容易错过一些关注的片段,用户体验差。



技术实现要素:

本申请提供的一种处理视频文件的方法及电子设备,可以智能的抽取视频中特定元素的片段和/或图片,简化了用户的操作,提升了用户体验。

第一方面,本申请提供的方法,包括:电子设备获取第一视频信息,第一视频信息包含目标视频或目标图片的至少部分;电子设备识别第一视频信息中包含的目标元素;电子设备根据第一视频信息生成含有目标元素的目标视频或目标图片。

由此可见,本申请实施例提供的方法,电子设备可以自动识别出这些视频文件中特定的元素,例如:用户关注的人、用户关注的建筑物、用户关注的宠物等,并从视频文件中自动提取这些特定元素所在片段的信息,避免了用户手动去查找和剪辑视频,提高了用户和终端的交互效率,提升了用户体验。

一种可能的实现方式中,电子设备识别第一视频信息中包含的目标元素包括:电子设备对第一视频信息进行抽帧,得到至少一个第一图像;电子设备对至少一个第一图像聚类分析,确定至少一个第二图像,其中,第二图像为包含有目标元素的图像。

一种可能的实现方式中,该方法还包括:电子设备按照预设优先级显示目标视频或目标图片的图标,优先级为目标视频或目标图片的显示顺序。

一种可能的实现方式中,预设优先级包括目标元素与用户的紧密度的顺序,其中,目标元素与用户的紧密度,正相关于电子设备中存储目标元素的图片或视频的数量。

一种可能的实现方式中,电子设备中存储目标元素的图片或视频为图库应用中图片或视频、社交网络应用中的图片或视频、用户头像中的任一项或任几项。

一种可能的实现方式中,电子设备根据第一视频信息生成含有目标元素的目标视频或目标图片包括:电子设备根据第一视频信息,以及目标元素与用户的紧密度,生成含有目标元素的目标视频或目标图片;其中,目标视频的时长正相关于目标元素与用户的紧密度;或者,目标图片的数量,正相关于目标元素与用户的紧密度。

一种可能的实现方式中,电子设备获取第一视频信息包括:电子设备自动获取视频文件中的视频信息,或者;

检测到电子设备正在播放视频文件时,电子设备自动获取视频文件中的视频信息,或者;检测到电子设备正在录制视频文件时,电子设备获取视频文件中已经录制的视频信息,或者;检测到用户的第一操作,第一操作为选择对视频文件进行处理的操作,电子设备获取视频文件中的视频信息。

一种可能的实现方式中,目标元素包括人像、动作、建筑物、动物、物品中任一项。

第二方面、一种电子设备,包括:处理器、存储器和触摸屏,存储器、触摸屏与处理器耦合,存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,当处理器从存储器中读取计算机指令,以使得电子设备执行如下操作:获取第一视频信息,第一视频信息包含目标视频或目标图片的至少部分;识别出第一视频信息中包含的目标元素;根据第一视频信息生成含有目标元素的目标视频或目标图片。

一种可能的实现方式中,在处理器识别出第一视频信息中包含的目标元素,确定出目标元素对应的目标视频或目标图片的过程中,处理器,具体用于对第一视频信息进行抽帧,得到至少一个第一图像;对至少一个第一图像聚类分析,确定出至少一个第二图像,其中,第二图像为包含有目标元素的图像。

一种可能的实现方式中,触摸屏,用于按照预设优先级显示目标视频或目标图片的图标,优先级为目标视频或目标图片的显示顺序。

一种可能的实现方式中,预设优先级包括目标元素与用户的紧密度的顺序,其中,目标元素与用户的紧密度,正相关于电子设备中存储目标元素的图片或视频的数量。

一种可能的实现方式中,电子设备中存储目标元素的图片或视频为图库应用中图片或视频、社交网络应用中的图片或视频、用户头像中的任一项或任几项。

一种可能的实现方式中,在处理器根据第一视频信息生成含有目标元素的目标视频或目标图片的过程中,处理器,还具体用于根据第一视频信息,以及目标元素与用户的紧密度,生成含有目标元素的目标视频或目标图片;其中,目标视频的时长正相关于目标元素与用户的紧密度;或者,目标图片的数量,正相关于目标元素与用户的紧密度。

一种可能的实现方式中,在处理器获取第一视频信息的过程中,处理器,具体用于自动获取视频文件中的视频信息,或者;

检测到电子设备正在播放视频文件时,自动获取视频文件中的视频信息,或者;检测到电子设备正在录制视频文件时,获取视频文件中已经录制的视频信息,或者;检测到用户的第一操作,第一操作为选择对视频文件进行处理的操作,获取视频文件中的视频信息。

一种可能的实现方式中,目标元素包括人像、动作、建筑物、动物、物品中任一项。

第三方面、一种计算机存储介质,包括计算机指令,当计算机指令在终端上运行时,使得终端执行如第一方面及其中任一种可能的实现方式中所述的方法。

第四方面、一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如第一方面中及其中任一种可能的实现方式中所述的方法。

附图说明

图1为本申请实施例提供的一种电子设备的结构示意图一;

图2为本申请实施例提供的一种电子设备的结构示意图二;

图3为本申请实施例提供的一些电子设备的用户界面示意图;

图4为本申请实施例提供的又一些电子设备的用户界面示意图;

图5为本申请实施例提供的一种处理视频文件的方法的流程示意图;

图6为本申请实施例提供的一种处理视频文件的方法的过程示意图;

图7为本申请实施例提供的又一些电子设备的用户界面示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,a/b可以表示a或b;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。

以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。

本申请实施例提供的一种处理视频文件的方法,电子设备可以针对正在录制的视频文件,或者正在播放的视频文件,或者已经保存的视频文件,或者在线播放的视频文件等进行处理。具体的,电子设备可以自动识别出这些视频文件中特定的元素,例如:用户关注的人、用户关注的建筑物、用户关注的宠物等,并从视频文件中自动提取这些特定元素所在片段的信息。还可以对一个或多个视频文件中的相同的元素所在片段的信息进行合并等处理。这样,用户可以直接查看某个元素对应的片段或图片集,该片段可以是一个视频文件中有该元素的所有片段或图片集,也可以是多个视频文件中有该元素的所有片段或图片集。

示例性的,本申请中的电子设备可以为手机、平板电脑、个人计算机(personalcomputer,pc)、个人数字助理(personaldigitalassistant,pda)、智能手表、上网本、可穿戴电子设备、增强现实技术(augmentedreality,ar)设备、虚拟现实(virtualreality,vr)设备、车载设备、智能汽车、智能音响、机器人等,本申请对该电子设备的具体形式不做特殊限制。

图1示出了电子设备100的结构示意图。

电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universalserialbus,usb)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriberidentificationmodule,sim)卡接口195等。其中传感器模块180可以包括压力传感器180a,陀螺仪传感器180b,气压传感器180c,磁传感器180d,加速度传感器180e,距离传感器180f,接近光传感器180g,指纹传感器180h,温度传感器180j,触摸传感器180k,环境光传感器180l,骨传导传感器180m等。

可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。

处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(applicationprocessor,ap),调制解调处理器,图形处理器(graphicsprocessingunit,gpu),图像信号处理器(imagesignalprocessor,isp),控制器,存储器,视频编解码器,数字信号处理器(digitalsignalprocessor,dsp),基带处理器,和/或神经网络处理器(neural-networkprocessingunit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。

其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。

处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。

在本申请实施例中,处理器110可以读取视频文件的信息,对视频文件进行抽帧,得到多个第一图像帧,然后采用图像识别技术,对第一图像帧中是否包含某个特定类型的元素(例如人脸等)进行判断。进一步确定出包含有特定类型的元素的第二图像帧。然后根据该特定类型的元素对第二图像帧进行聚类,即第二图像帧进行分类,为具有相同元素的第二图像帧标记有相同的标识,为具有不同元素的第二图像帧标记不同的标识。而后,确定出各个元素对应的片段信息,并存储在存储器中。当用户查看某个特定元素对应的片段时,处理器从存储器中读取出该特定元素对应的片段信息,并进行播放。在一些实施例中,涉及图像处理的步骤可以在npu中进行,以较快系统处理效率。

在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integratedcircuit,i2c)接口,集成电路内置音频(inter-integratedcircuitsound,i2s)接口,脉冲编码调制(pulsecodemodulation,pcm)接口,通用异步收发传输器(universalasynchronousreceiver/transmitter,uart)接口,移动产业处理器接口(mobileindustryprocessorinterface,mipi),通用输入输出(general-purposeinput/output,gpio)接口,用户标识模块(subscriberidentitymodule,sim)接口,和/或通用串行总线(universalserialbus,usb)接口等。

i2c接口是一种双向同步串行总线,包括一根串行数据线(serialdataline,sda)和一根串行时钟线(derailclockline,scl)。在一些实施例中,处理器110可以包含多组i2c总线。处理器110可以通过不同的i2c总线接口分别耦合触摸传感器180k,充电器,闪光灯,摄像头193等。例如:处理器110可以通过i2c接口耦合触摸传感器180k,使处理器110与触摸传感器180k通过i2c总线接口通信,实现电子设备100的触摸功能。

i2s接口可以用于音频通信。在一些实施例中,处理器110可以包含多组i2s总线。处理器110可以通过i2s总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过i2s接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。

pcm接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过pcm总线接口耦合。在一些实施例中,音频模块170也可以通过pcm接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述i2s接口和所述pcm接口都可以用于音频通信。

uart接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,uart接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过uart接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过uart接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。

mipi接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。mipi接口包括摄像头串行接口(cameraserialinterface,csi),显示屏串行接口(displayserialinterface,dsi)等。在一些实施例中,处理器110和摄像头193通过csi接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过dsi接口通信,实现电子设备100的显示功能。

gpio接口可以通过软件配置。gpio接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,gpio接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。gpio接口还可以被配置为i2c接口,i2s接口,uart接口,mipi接口等。

usb接口130是符合usb标准规范的接口,具体可以是miniusb接口,microusb接口,usbtypec接口等。usb接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如ar设备等。

可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。

充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过usb接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。

电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。

电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。

天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。

移动通信模块150可以提供应用在电子设备100上的包括2g/3g/4g/5g等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(lownoiseamplifier,lna)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。

调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170a,受话器170b等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。

无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocalareanetworks,wlan)(如无线保真(wirelessfidelity,wi-fi)网络),蓝牙(bluetooth,bt),全球导航卫星系统(globalnavigationsatellitesystem,gnss),调频(frequencymodulation,fm),近距离无线通信技术(nearfieldcommunication,nfc),红外技术(infrared,ir)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。

在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(globalsystemformobilecommunications,gsm),通用分组无线服务(generalpacketradioservice,gprs),码分多址接入(codedivisionmultipleaccess,cdma),宽带码分多址(widebandcodedivisionmultipleaccess,wcdma),时分码分多址(time-divisioncodedivisionmultipleaccess,td-scdma),长期演进(longtermevolution,lte),bt,gnss,wlan,nfc,fm,和/或ir技术等。所述gnss可以包括全球卫星定位系统(globalpositioningsystem,gps),全球导航卫星系统(globalnavigationsatellitesystem,glonass),北斗卫星导航系统(beidounavigationsatellitesystem,bds),准天顶卫星系统(quasi-zenithsatellitesystem,qzss)和/或星基增强系统(satellitebasedaugmentationsystems,sbas)。

电子设备100通过gpu,显示屏194,以及应用处理器等实现显示功能。gpu为图像处理的微处理器,连接显示屏194和应用处理器。gpu用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个gpu,其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquidcrystaldisplay,lcd),有机发光二极管(organiclight-emittingdiode,oled),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganiclightemittingdiode的,amoled),柔性发光二极管(flexlight-emittingdiode,fled),miniled,microled,micro-oled,量子点发光二极管(quantumdotlightemittingdiodes,qled)等。在一些实施例中,电子设备100可以包括1个或n个显示屏194,n为大于1的正整数。

电子设备100可以通过isp,摄像头193,视频编解码器,gpu,显示屏194以及应用处理器等实现拍摄功能。

isp用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给isp处理,转化为肉眼可见的图像。isp还可以对图像的噪点,亮度,肤色进行算法优化。isp还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,isp可以设置在摄像头193中。

摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(chargecoupleddevice,ccd)或互补金属氧化物半导体(complementarymetal-oxide-semiconductor,cmos)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给isp转换成数字图像信号。isp将数字图像信号输出到dsp加工处理。dsp将数字图像信号转换成标准的rgb,yuv等格式的图像信号。在一些实施例中,电子设备100可以包括1个或n个摄像头193,n为大于1的正整数。

数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(movingpictureexpertsgroup,mpeg)1,mpeg2,mpeg3,mpeg4等。

npu为神经网络(neural-network,nn)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过npu可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。

外部存储器接口120可以用于连接外部存储卡,例如microsd卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。

内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universalflashstorage,ufs)等。

在本申请实施例中,内部存储器121中可以存储采用本申请实施例提供的方法,从视频文件中抽取出的各个元素的信息,以及各个元素对应的片段信息。还可以存储从视频文件中抽取出的各个元素与电子设备中已有的一些元素的关联信息,例如视频文件中抽取的人物与图库应用中与该人物相关的图片信息等,具体的参考下文的描述。

电子设备100可以通过音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,以及应用处理器等实现音频功能。例如音乐播放,录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。

扬声器170a,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170a收听音乐,或收听免提通话。

受话器170b,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170b靠近人耳接听语音。麦克风170c,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170c发声,将声音信号输入到麦克风170c。电子设备100可以设置至少一个麦克风170c。在另一些实施例中,电子设备100可以设置两个麦克风170c,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170c,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。耳机接口170d用于连接有线耳机。耳机接口170d可以是usb接口130,也可以是3.5mm的开放移动电子设备平台(openmobileterminalplatform,omtp)标准接口,美国蜂窝电信工业协会(cellulartelecommunicationsindustryassociationoftheusa,ctia)标准接口。

压力传感器180a用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180a可以设置于显示屏194。压力传感器180a的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180a,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180a检测所述触摸操作强度。电子设备100也可以根据压力传感器180a的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。

陀螺仪传感器180b可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180b确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180b可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180b检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180b还可以用于导航,体感游戏场景。

气压传感器180c用于测量气压。在一些实施例中,电子设备100通过气压传感器180c测得的气压值计算海拔高度,辅助定位和导航。

磁传感器180d包括霍尔传感器。电子设备100可以利用磁传感器180d检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180d检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。

加速度传感器180e可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。

距离传感器180f,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180f测距以实现快速对焦。

接近光传感器180g可以包括例如发光二极管(led)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180g检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180g也可用于皮套模式,口袋模式自动解锁与锁屏。

环境光传感器180l用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180l也可用于拍照时自动调节白平衡。环境光传感器180l还可以与接近光传感器180g配合,检测电子设备100是否在口袋里,以防误触。

指纹传感器180h用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。

温度传感器180j用于检测温度。在一些实施例中,电子设备100利用温度传感器180j检测的温度,执行温度处理策略。例如,当温度传感器180j上报的温度超过阈值,电子设备100执行降低位于温度传感器180j附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。

触摸传感器180k,也称“触控面板”。触摸传感器180k可以设置于显示屏194,由触摸传感器180k与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180k用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180k也可以设置于电子设备100的表面,与显示屏194所处的位置不同。

骨传导传感器180m可以获取振动信号。在一些实施例中,骨传导传感器180m可以获取人体声部振动骨块的振动信号。骨传导传感器180m也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180m也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180m获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180m获取的血压跳动信号解析心率信息,实现心率检测功能。

按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。

马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。

指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。

sim卡接口195用于连接sim卡。sim卡可以通过插入sim卡接口195,或从sim卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或n个sim卡接口,n为大于1的正整数。sim卡接口195可以支持nanosim卡,microsim卡,sim卡等。同一个sim卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。sim卡接口195也可以兼容不同类型的sim卡。sim卡接口195也可以兼容外部存储卡。电子设备100通过sim卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用esim,即:嵌入式sim卡。esim卡可以嵌在电子设备100中,不能和电子设备100分离。

电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本发明实施例以分层架构的android系统为例,示例性说明电子设备100的软件结构。

图2是本发明实施例的电子设备100的软件结构框图。

分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(androidruntime)和系统库,以及内核层。

应用程序层可以包括一系列应用程序包。

如图2所示,应用程序层可以包括相机,图库,日历,通话,地图,导航,wlan,蓝牙,音乐,视频,短信息等应用程序包。

应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramminginterface,api)和编程框架。应用程序框架层包括一些预先定义的函数。

本申请实施例中,涉及到的应用程序可以包括图库、相机、视频、浏览器等可以播放视频文件的应用程序。

如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。

窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。

内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。

在本申请实施例中,用于播放视频文件的应用可以通过内容提供器来获取电子设备中存储的视频文件的信息。

视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。

在本申请实施例中,用于播放视频文件的应用可以通过视图系统,显示从视频文件中抽取出的各个元素的图标等。

电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。

资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。

通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。

androidruntime包括核心库和虚拟机。androidruntime负责安卓系统的调度和管理。

核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。

应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。

系统库可以包括多个功能模块。例如:表面管理器(surfacemanager),媒体库(medialibraries),三维图形处理库(例如:opengles),2d图形引擎(例如:sgl)等。

表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2d和3d图层的融合。

媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:mpeg4,h.264,mp3,aac,amr,jpg,png等。

三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。

2d图形引擎是2d绘图的绘图引擎。

内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。

以下实施例中所涉及的技术方案均可以在具有上述硬件架构和软件架构的电子设备100中实现。

下面结合附图对本申请实施例提供的技术方案进行详细说明。

如图5所示,为本申请实施例提供的一种处理视频文件的方法的流程图,具体如下:

s101、获取第一视频信息。

通常,视频文件在制作时,是将视频原始数据和音频原始数据独立进行编码,得到分开的视频压缩数据和音频压缩数据。而后,为了传输方便将分开的视频压缩数据和音频压缩数据进行封装得到视频文件的。因此,在播放视频文件时,需要将视频文件进行解封装,得到分开的视频压缩数据和音频压缩数据,然后分别对视频压缩数据和音频压缩数据进行解码,得到视频原始数据和音频原始数据,然后将视频原始数据一帧一帧送到显示设备中进行显示,将音频原始数据送到音频设备中进行播放。在本申请实施例中,电子设备可以获取到是视频文件中的视频原始数据和音频原始数据。

在一些实施例中,第一视频为用户正在录制的视频时,也就是说,当检测到电子设备正在录制第一视频时,电子设备可以直接获取录制时已经生成的第一视频的部分视频原始数据,作为第一视频信息。当然,电子设备可以持续的获取录制第一视频时不断生成的视频原始数据,直到第一视频录制完成,获取到第一视频的全部视频原始数据。

在另一些实施例中,第一视频为用户播放的视频时,也就是说,当检测到电子设备正在播放第一视频时,电子设备可以直接获取播放时已经解码后的第一视频的部分视频原始数据,作为第一视频信息。当然,电子设备可以持续的获取播放第一视频时不断解码得到的视频原始数据,直到获取到第一视频的全部视频原始数据。

可以理解的是,用户播放的视频可以是本地存储的视频,也可以是在线视频。无论是哪类视频,在播放时,播放器都会对第一视频进行解封装和解码,所以都会得到视频原始数据。

在又一些实施例中,第一视频为存储在电子设备中的视频时,通常第一视频存储在电子设备的sd卡或存储卡上。也就是说,当检测到电子设备中存储有第一视频文件时,电子设备对第一视频进行解封装,得到视频压缩数据和音频压缩数据,然后将视频压缩数据进行解码,得到视频原始数据。

在又一些实施例中,电子设备可以预先对是否需要抽取出包含特定元素的片段进行判断,也就是说,若需要对第一视频抽取出特定元素的片段,则执行步骤s102以及之后的步骤,否则,不执行步骤s102。示例性的,可以根据第一视频的信息中的一些字段信息进行判断,例如:时长、帧率、分辨率等。示例性的,若第一视频的时长过短,则没有必要再从中抽取片段了。或者,第一视频的时长过长,抽取的工作量较大,效率不高,可以不从中抽取片段。若第一视频的帧率过慢,例如慢动作,抽取片段后的观看效果不佳,可以不抽取片段。若第一视频的分辨率较低,视频的效果不好,也就没必要再抽取片段了。

在一些实施例中,电子设备可以自动的对电子设备中存储的全部的视频文件,或者特定应用中存储的全部视频文件(例如图库应用、微信应用、浏览器应用等)等执行本申请实施例提供的抽取视频中包含特定元素的片段或视频的方法。在又一些实施例中,电子设备也可以根据用户的选择,针对用户选择的视频文件执行本申请实施例提供的抽取方法。例如:如图7中(1)所示,界面701为一种视频文件的浏览界面。用户可以在该界面701中览界面中选中相应的视频文件,然后选择执行抽取功能(例如可以是在选项菜单702中选择“抽取片段”功能,也可以是在界面中点击抽取功能关联的控件等)。那么,电子设备响应于用户的操作,开始针对选中视频文件执行本申请实施例提供的对视频文件的处理方法。用户也可以在录制第一视频的界面或者播放第一视频的界面中选择执行抽取功能。又例如:如图7中(2)所示,界面703为一种播放视频文件的界面,电子设备可以通过选择菜单704中的“抽取片段”功能。可选的,用户还可以通过在子菜单705中选择“人物”选项,那么电子设备对第一视频中包含的人物进行抽取。本申请实施例对用户选择执行抽取功能的具体操作不做限定。

s102、对第一视频信息进行抽帧,得到至少一个第一图像帧。

电子设备可以周期性或非周期性的从第一视频中抽取一定数量的第一图像帧,以便对抽取的第一图像帧进行分析。电子设备抽取第一图像帧之间间隔的时间长度可以根据用户对抽取片段的精确度确定。如用户对抽取片段的精确度要求较高,则确定间隔的时间段较小。如果对抽取片段的精确度要求较低,则确定间隔的时间段较大。

如图6中(1)所示,假设0至t时刻为第一视频的时间轴示意图。1至t时刻包含有第一视频中的多个图像帧。电子设备从这多个图像帧间隔一定时间(例如:t1时刻、t2时刻、t3时刻等)抽取一部分的图像帧,作为第一图像帧。

s103、采用图像识别技术,从至少一个第一图像帧中确定出至少一个第二图像帧,其中,第二图像帧包含有目标类型的元素。

其中,目标类型元素可以为人脸、表情、动作、物品、建筑物、宠物、和用户自定义类型中的任一种或任几种,可以根据用户对第一视频中关注的内容确定。例如:若用户关注视频中某个或某些人时,则可以将目标类型的元素设置为人脸。又例如:若用户关注视频中相关建筑物或地点时,可以将目标类型的元素设置为建筑物或地点等。

如图6中(2)所示,电子设备可以采用图像识别技术,例如可以基于计算机视觉(computervision,cv)引擎对图像进行处理,对抽取的第一图像帧中是否包含有目标类型的元素进行确认,将包含有目标类型的元素的第一图像帧确定为第二图像帧(图中以带有箭头的线条示出),第二图像帧中包含用户关注的那个类型的元素。

以人脸为目标元素为例进行举例说明。电子设备例如可以采用图像识别技术中的人脸检测(facedetection)算法,去判断每一个第一图像帧中是否存在人脸。常见的人脸检测算法是一个“扫描”加“判别”的过程,即算法在每一个第一图像帧的图像范围内扫描,再逐个判定候选区域是否是人脸的过程。若确定有候选区域是人脸,则认为该第一图像帧为第二图像帧。

在本申请的一些实施例中,电子设备在确定出包含有第一类型的元素的第二图像帧后,可以对各个第二图像帧进行美学打分。当然,可以在电子设备全部确定出第二图像帧后,进行美学打分,也可以是在电子设备确定出一个或多个第二图像帧的同时,对已经确定的第二图像帧进行美学打分。具体的,可以采用美学评分算法,该算法所评估的分数,不仅能对第二图像帧的失焦、抖动等技术因素进行评价,还可以从歪斜、色彩、构图等角度评判主观“美”的感受。可简单理解为,美学打分的分数越高,图像帧的画面质量越好。这样,电子设备在显示相关片段或图片时,可以向用户推荐画面质量较好的一些片段和画面,可认为是精选片段或精选图片。需要说明的是,对第二图像帧进行美学打分的步骤,可以与后续的对第二图像帧的聚类等步骤并行处理或者串行处理,本申请实施例对此不做限定。

可以理解的是,电子设备也可以在步骤s102之后,开始对从第一视频中抽取后的第一图像帧进行美学打分。在另一些实施例中,若第一图像帧中没有目标元素的第二图像帧时,也就是第一图像帧中没有用户关注的元素时,电子设备也可以抽取美学打分分数较高的一些片段或图片集。

s104、根据第二图像帧中包含的目标类型的元素进行聚类分析,确定目标类型的元素中各个目标元素对应的第二图像帧。

在步骤s103中,电子设备确定出包含有第一类型的元素的第二图像帧,由于第一类型的元素可能有多个元素,所以一个第二图像帧中可能包含有一个或多个元素。为此,电子设备可以进一步提取各个第二图像帧中包含的元素的特征,并据此对第二图像帧进行分类。同一类的第二图像帧包含有相同的元素。分类是采用的聚类算法可参考现有技术,这里不再赘述。

在本申请的一些实施例中,电子设备可以为含有同一元素的图像帧标记有相同的标识,为含有不同元素的图像帧标记有不同的标识。需要注意的是,同一个图像帧中可以包含有多个元素,因此,同一个图像帧可以有多个标识。本申请实施例对具体的标记方式不做限定。如图6中(3)所示,t2、t3、t4、t10、t11、t12和t13时刻的第二图像帧包含有元素1,t6、t7、t12、t13、t14、t15和t16时刻的第二图像帧包含有元素2。其中,t12和t13时刻的第二图像帧中均包含有元素1和元素2。

仍然以目标元素为人脸为例进行举例说明。假设根据步骤s103以及之前的步骤,已经确认出m个第二图像帧中包含有人脸。进一步的,电子设备可以采用人脸提特征(facefeatureextraction)算法,将这m个第二图像帧中包含的人脸都转化为相应的一串固定长度的数值的过程,这个数值可称为“人脸特征”,具有表征这个人脸特点的能力。若一个第二图像帧中包含有多个人脸,则每个人脸都需要提取人脸特征。而后,采用人脸比对(facecompare)算法,将不同的第二图像帧中人脸特征进行两两比对,计算出相似度。当相似度达到预设阈值时,可以确定这两个人脸为同一人。换言之,根据第二图像帧中包含的人脸的特征,按照不同的人(可称为不同的主角)对第二图像帧进行分类。

s105、针对目标类型中各个目标元素,分别确定各个目标元素对应的目标视频或目标图片。

其中,各个元素对应的目标视频,可以是连续的视频片段,也可以是多个图片组成的图片集,还可以是视频片段和图片集的组合,本申请实施例中对目标视频的形式不做限定。

示例性的,可以根据各个目标元素对应的图像帧,确定目标视频或目标图片的信息,该信息可以包括目标视频中各个片段的开始时刻和结束时刻,也可以包括各个片段中开始的图像帧和结束的图像帧在第一视频中的位置,还可以包括特定图像帧在第一视频中的时刻或位置信息等。本申请实施例对此不作限定。在一些实施例中,在某个元素在第一视频中对应有多个不连续的片段时,可以在播放不连续片段之间增加一些转场特效,这样,有利于避免不连续片段播放时的卡顿感,有利于提升用户体验。在另一些实施例中,片段信息还可以包括各个美学打分的分数,电子设备可以根据该美学打分的分数,抽取分数较高的图像帧片段组合成精选片段,或者分数较高的图像帧组合成精选图片集。

举例来说,如图6中(3)所示,电子设备执行步骤s104之后,可知:元素1对应于t2、t3、t4、t10、t11、t12和t13时刻的第二图像帧。那么,元素1对应的片段信息可以包括t2时刻至t4时刻,以及t10时刻至t13时刻。或者,元素1对应的片段信息也可以包括其他能够表示t2、t4时刻图像帧在第一视频中的位置的信息,以及t10、t13时刻图像帧在第一视频中的位置的信息。这样,电子设备可以据此片段信息播放元素1对应的视频片段。元素1对应的片段信息还可以包括t2、t3、t4、t10、t11、t12和t13时刻的第二图像帧中任一个或任几个图像帧在第一视频中的时间信息或位置信息。这样,电子设备可以据此片段信息播放元素2对应的图片集。

s106、针对目标类型中各个目标元素,分别生成包含各个目标元素的目标视频或目标图片。

示例的,电子设备可以根据步骤s105中确定出的目标视频的信息或目标图片的信息,生成包含各个元素的目标视频或目标图片。电子设备可以将第一视频直接剪辑为目标视频,或目标图片。也就是说,第一视频被替换为目标视频或目标图片。电子设备也可以根据步骤s105确定出的这些信息,生成新的视频或图片,作为目标视频或目标图片。也就是说,未对第一视频进行修改。本申请实施例对目标视频或目标图片的生成方式不做限定。

电子设备还可以在步骤s105后,即确定出目标视频的信息或目标图片的信息后,就生成目标视频或目标图片。电子设备也可以在确定出目标视频的信息或目标图片的信息后,将该信息存储在例如图库应用对应的数据库或视频播放器的数据库中。当用户需要查看某个元素时,电子设备可以从相应的数据库中,查找到该元素对应的目标视频的信息或目标图片的信息,再生成目标视频或目标图片。本申请实施例对目标视频或目标图片的生成时机不做限定。

在一些实施例中,电子设备可以根据第一视频中识别出的各个元素,从包含有各个元素的第二图像帧中抽取出各个元素对应的图标(例如:人脸缩略图、宠物头像、建筑物缩略图、表情图等),将各个元素对应的图标与各个元素对应的片段信息(例如:目标视频或目标图片)进行关联。这样,用户可以通过操作各个元素对应的图标,来查看各个元素对应的片段。可选的,电子设备也可以直接显示各个元素对应的目标视频或目标图片的图像,用户可以直接通过该目标视频或目标图片的图像,查看目标视频或目标图片。

可选的,电子设备可以按照预设的优先级显示着各个元素对应的图标,该优先级可以理解为目标视频或目标图片的显示顺序。例如:可以按照目标视频的时长的顺序,或目标图片的数量的大小顺序,或者元素的名称的顺序等。其中,各个元素的名称可以为电子设备的默认设置,也可以是用户设置的。本申请实施例不做限定。

在另一些实施例中,电子设备可以根据第一视频中识别出的各个元素,与电子设备中其他图片或其他文件中识别出的元素进行关联。其中,其他图片或其他文件例如可以是图库应用中的照片、通讯录中的头像、即时通信应用(例如:微信、qq、skype、msn等)中联系人的头像等。

也就是说,第一视频中识别出的元素与其他图片或文件中识别出的相同的元素进行关联。例如:一些图库应用中可以将具有相同人物的照片聚合在一起的功能(可简称为人物功能)。在该功能下,当用户操作某个人物对应的图像(例如:人脸缩略图)时,电子设备显示包含该人物的所有照片。本申请实施例中,当元素为人物时,将从第一视频中识别出的人物与图库应用中的人物进行关联,这样,当用户操作某个人物对应的图像时,电子设备还可以显示包含该人物的视频片段。

可选的,电子设备还可以显示各个元素的名称,该名称可以为其他应用中相应的备注。例如可以是通讯录中相应的联系人名称,还可以是即时通信应用中联系人的备注名称等等。若第一视频中识别出的某个元素,没有关联到其他图片或文件中的元素,那么,也可以提示用户对该元素的名称进行命名,或者设置默认的名称。本申请实施例对此不做限定。

可选的,电子设备可以按照预设的优先级显示着各个元素对应的图标,例如还可以按照从第一视频中识别出的元素与用户的紧密度关系来排序,这样,可以突出用户关注和重视的元素,有利于提升用户体验。其中,元素与用户的紧密度关系可以与电子设备中包含该元素的视频文件或图片文件的数量成正相关。该元素的视频文件或图片文件可以电子设备中存储的所有的视频文件或图片文件,也可以是特定应用中的视频文件或图片文件,例如:可以是图库应用中视频文件或图片文件、或浏览器应用中视频文件或图片文件、或社交网络应用中的图像等。元素与用户的紧密度关系还可以根据元素的名称来确定。例如:爸、妈等亲人的紧密度高于朋友等。元素与用户的紧密度关系还可以根据用户设置的紧密度来确定。本申请实施例对此不做限定。

举例来说,假设从第一视频中识别出人物a和人物b,以图库应用中包含人物的图片或视频的数量来表示人物与用户紧密度为例,进行说明。若存在包含有人物b的图片文件或视频文件,而不存在包含有人物a的图标文件或视频文件。则可认为相比较于人物a,人物b与用户的紧密度更强。在电子设备显示人物b对应的图标时,可以排列在人物a对应的图片前面,以便突出人物b相对于用户的重要性。

在又一些实施例中,电子设备在抽取各个元素对应的目标视频或目标图片时,还可以某些规则确定目标视频的时长或目标图片的数量。例如:目标视频的时长可以正相关于元素与用户的紧密度,或者目标图片的数量可以正相关于元素与用户的紧密度。也就是说,用户关注和重视的元素,可以抽取多一些目标视频或目标图片。用户不关注和不重视的元素,可以抽取少一些目标视频或目标图片。

由此可见,本申请实施例提供的方法,电子设备可以自动识别出这些视频文件中特定的元素,例如:用户关注的人、用户关注的建筑物、用户关注的宠物等,并从视频文件中自动提取这些特定元素所在片段的信息,避免了用户手动去查找和剪辑视频,提高了用户和终端的交互效率,提升了用户体验。而且,由于电子设备采用图像识别技术中的相关算法,从视频中抽取出包含特定元素的片段,避免了人工错误,有利于提高电子设备抽取片段的可靠性和准确性。

示例性的,图3和图4中示出了本申请实施例涉及到的一些用户界面(userinterface,ui)图。

用户可以进入视频文件的浏览界面,选择查看相应的视频文件。例如:用户可以通过文件管理应用,或者相册应用(或称为图库应用)查看视频文件。用户还可以通过播放器应用、浏览器应用等查看视频,本申请实施例对用户查看视频的方式不做限定。

举例来说,如图3中(1)所示,为电子设备显示的一种界面300,该界面300可以包括状态栏301、停靠栏303,以及多个应用的图标,例如:文件管理应用的图标302。用户可以通过点击图标302,进入文件管理应用的主界面。如图3中(2)所示,界面310为一种文件管理应用的主界面。用户可以点击选择“视频”按钮,进入视频文件的浏览界面。如图3中(3)所示,界面304为一种视频文件的浏览界面。用户可以通过选择或点击相应的视频文件的图标,例如:图标305,进入该视频的查看界面。如图3中(6)所示,界面400为一个视频(例如:视频1)的查看界面,用户可以通过点击播放控件401,来播放该视频。该界面400上还可以显示有“编辑”、“收藏”、“删除”、“更多”等功能按钮,用户可通过这些功能按钮对该视频进行编辑、收藏、删除以及其他操作,这里不再详述。

可选的,如图3中(4)所示,用户也可以通过点击界面300中的图标306,进入相册应用的浏览界面。如图3中(5)所示,界面307为相册应用中的一种浏览界面。该界面307显示有图片的缩略图,例如图标308,和视频的缩略图,例如图标309。用户可以通过选择或点击相应的视频文件的图标,例如:图标309,进入该视频的查看界面,例如界面400。

如图3中(6)所示,在界面400上,用户可以通过例如在特定区域中向上滑动,以进入如图4中(1)所示的界面402。其中,上述特定区域例如可以是界面400中显示视频1图像的区域。需要说明是,用户也可以通过其他的方式,从界面400进入界面402,例如界面400显示有特定按钮,用户可以通过点击该特定按钮进入界面402,界面400还可以显示有特定的菜单,用户通过选定特定的选项进入界面402,用户还可以通过在界面400上采用其他特定手势进入界面402,本申请实施例对此不做限定。

其中,界面402中可以显示有视频1的图像403,该图像403上显示有播放控件,用户可以通过点击该控件来播放视频1。界面402中还可以显示有该视频文件中包含的各个元素关联的图标,例如:显示有人物a(或称为主角a)的头像的图标404,显示有人物b(或称为主角b)头像的图标405。一些示例中,界面402中可以显示从视频文件中确定的所有元素的图标,或者特定数量的元素的图标(例如:对确定出的所有元素按照一定优先级进行排序,选取前几位的元素)。另一些示例中,界面402中还可以显示用户选择的特定元素的图标。例如:在电子设备从视频文件中确定出各个元素后,可以显示一个界面,该界面可以用于提示用户选择自己关注的特定元素。本申请实施例对此不做限定。

其中,元素可以为人脸、表情、动作、物品、建筑物、宠物、和用户自定义类型中的任一种或任几种,具体可以根据用户对视频1中关注的内容确定。各个元素关联的图标可以按照一定顺序进行排列。例如:可以根据各个元素出现在视频1中的时间顺序进行排列,也可以根据从视频1中抽取的各个元素对应的片段时长进行排列。若从视频1抽取出的各个元素与电子设备已有的元素进行了关联,那么也可以根据各个元素的名称的顺序,或者各个元素出现的频繁程度,或者各个元素与用户的紧密度关系等进行排列,本申请实施例中对各个元素的排列顺序不做限定。图4中仅示出元素为人物的情况,也就是说,是以用户关注视频1中的人物为例进行说明的。

可选的,元素的名称可以是电子设备默认设置的,也可以是在确定出视频文件中各个元素后,提示用户分别输入各个元素的名称。可选的,若从视频文件中确定出的元素与电子设备已有的相同元素进行关联的,该元素也可以直接使用相关联的已有的元素的名称。若电子设置中已有的元素中没有可以与该元素进行关联的,则电子设备默认设置该元素名称或提示用户进行设置。本申请实施例不做限定。

在一些实施例中,响应于用户点击图标404,电子设备显示有视频1中包含有人物a的片段、图片集、或者片段和图片集的组合中任一项或任几项对应的图标。其中,包含人物a的片段是指从视频1中抽取的包含人物a的视频片段,通常,该视频片段的时长小于视频1的时长。换言之,包含人物a的片段中每一帧画面中具有人物a。具体的抽取方法请参考上述实施例的描述。包含人物a的片段具体可以包括视频1中包含人物a的精选片段和全部片段。其中,视频1中包含人物a的精选片段是指从视频1中抽取的包含人物的视频片段中美学打分的分数较高的一些片段。其中,包含人物a的图片集,是指从视频1中抽取的包含人物a的多张图片。响应于用户点击该图片集对应的图标,电子设备可以显示这多张图片,也可以以幻灯片的形式动态播放这些图片。具体的实现请参考上述实施例的描述,这里不再赘述。在另一些实施例中,电子设备也可以先默认显示排列在第一位或其他位置的元素对应的片段、图片集或片段和图片集的组合。

响应于用户点击图标405,电子设备显示有视频1中包含有人物b的片段、图片集、或者片段和图片集的组合。

在界面402中,还可以显示有与视频1中提取的各个元素与电子设备中其他图片或其他文件相关联的信息。例如:界面402中还可以图库应用中人像(或称为人物)相关的人物头像的图标(例如:图标406、图标407、图标408和图标409)。其中,图标406和图标407对应的人物,在视频1中有出现。图标408和图标409中的人物在视频1中没有出现。

响应于用户点击图标406,电子设备显示如图4中(2)所示的界面410。界面410中可以显示人物a的名称的控件412。用户可以通过点击控件412对人物a的名称进行更改。界面410中还可以显示有包含人物a的视频的图像411。该图像411上可以显示有播放控件,响应于用户点击该播放控件,播放包含人物a的视频片段。该视频片段可以为视频1中包含人物a的片段和/或图片集。该视频片段也可以是电子设备中所有包含人物a的片段和/或图片集。本申请实施例不做限定。界面410还可以显示有该电子设备中包含人物a的图片、精彩片段、全部片段、图片集,以及图片与片段合集中的任一项或任几项。响应于用户对图片或视频片段的点击或选择,电子设备显示相应的图片或播放相应的视频。

需要说明是,以上实施例以在视频文件的查看界面的上滑界面上,查看该视频文件中抽取的相关元素的片段或图片为例进行说明的。可以理解的是,本申请实施例并不限定具体在什么样的界面上显示视频文件中抽取的特定元素的片段或图片,也不限定具体的显示的方式。

可以理解的是,上述终端等为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。

本申请实施例可以根据上述方法示例对上述终端等进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请实施例各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1