一种事件类型预测方法、装置、电子设备及存储介质与流程

文档序号:23501381发布日期:2021-01-01 18:06阅读:58来源:国知局
一种事件类型预测方法、装置、电子设备及存储介质与流程
本申请涉及数据处理
技术领域
,特别是涉及一种事件类型预测方法、装置、电子设备及存储介质。
背景技术
:随着安防技术的快速发展,图像采集设备的应用也越来越广泛。不同监控点位的图像采集设备可以用于对不同事件类型的事件进行监控。以交通场景下的图像采集设备为例,对于架设在人行横道附近的图像采集设备,可以针对车辆不礼让行人等事件类型的事件进行监控;对于架设在交通路口附近的图像采集设备,可以针对车辆闯红灯、行人闯红灯等事件类型的事件进行监控;对于架设在道路中段路侧的图像采集设备,可以针对实线变道、违章停车等事件类型的事件进行监控。现有技术中,在预测不同监控点位的图像采集设备所能够监控的事件的事件类型时,通常需要工作人员观察各个图像采集设备采集的监控视频,人工判断各个图像采集设备所要监控的事件的事件类型。由于不同监控点位的图像采集设备数量庞大,这样由人工预测各个图像采集设备所监控的事件的事件类型效率较低。技术实现要素:本申请实施例的目的在于提供一种事件类型预测方法、装置、电子设备及存储介质,以提高预测图像采集设备能够监控的事件的事件类型的效率。具体技术方案如下:第一方面,本申请实施例提供了一种事件类型预测方法,所述方法包括:获得图像采集设备采集的视频帧;提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合;基于融合后的对象特征,预测所述图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,所述提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合,包括:提取各个视频帧中对象的对象特征,并按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的对象特征进行合并,得到第一特征图;对所述第一特征图中不同通道的特征进行融合,得到第二特征图,其中,所述第二特征图的通道数量小于所述第一特征图的通道数量;对所述第二特征图进行维度转换,得到一维特征向量;对所述一维特征向量中的特征进行特征融合。本申请的一个实施例中,所述提取各个视频帧中对象的对象特征,包括:分别将各个视频帧输入预先训练完成的事件类型预测模型的卷积层,利用所述卷积层对各个视频帧进行卷积变换,得到各个视频帧中对象的特征图,作为各个视频帧中对象的对象特征,其中,所述特征图包括通道维度、高度维度、宽度维度,所述事件类型预测模型包括:特征融合层和全连接层,所述特征融合层包括:特征合并子层、卷积子层、维度转换子层、长短期记忆网络子层;所述按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的对象特征进行合并,得到第一特征图,包括:将各个视频帧中对象的特征图输入所述特征合并子层,利用所述特征合并子层按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的特征图进行合并,得到第一特征图;所述对所述第一特征图中不同通道的特征进行融合,得到第二特征图,包括:将所述第一特征图输入所述卷积子层,利用所述卷积子层按照对所述第一特征图进行卷积变换的方式,对所述第一特征图中不同通道的特征进行融合,得到第二特征图;所述对所述第二特征图进行维度转换,得到一维特征向量,包括:将所述第二特征图输入所述维度转换子层,利用所述维度转换子层在高度维度和宽度维度上对所述第二特征图进行维度转换,得到一维特征向量;所述对所述一维特征向量中的特征进行特征融合,包括:将所述一维特征向量输入所述长短期记忆网络子层,利用所述长短期记忆网络子层对所述一维特征向量中的特征进行特征融合;所述基于融合后的对象特征,预测所述图像采集设备能够监控的事件的事件类型,包括:将融合后的对象特征输入所述全连接层,利用所述全连接层预测所述图像采集设备能够监控的事件的类型。本申请的一个实施例中,所述基于融合后的对象特征,预测所述图像采集设备能够监控的事件的事件类型,包括:基于融合后的对象特征,预测所获得的视频帧对应于各个预设的事件类型的概率,其中,每一事件类型的概率表征:所获得的视频帧反映的场景中发生该事件类型的事件的发生概率;确定对应的概率达到预设的概率阈值的事件类型,将所确定的事件类型作为所述图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,所述获得图像采集设备采集的视频帧,包括:获得图像采集设备采集的视频,按照预设间隔从所述视频中抽取预设数量帧视频帧。本申请的一个实施例中,所述获得图像采集设备采集的视频帧,包括:获得图像采集设备采集的视频帧,并对各个视频帧进行缩放处理,得到预设大小的视频帧。第二方面,本申请实施例提供了一种事件类型预测装置,所述装置包括:视频帧获得模块,用于获得图像采集设备采集的视频帧;事件类型预测模块,用于提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合;基于融合后的对象特征,预测所述图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,所述事件类型预测模块,具体用于:提取各个视频帧中对象的对象特征;按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的对象特征进行合并,得到第一特征图;对所述第一特征图中不同通道的特征进行融合,得到第二特征图,其中,所述第二特征图的通道数量小于所述第一特征图的通道数量;对所述第二特征图进行维度转换,得到一维特征向量;对所述一维特征向量中的特征进行特征融合。本申请的一个实施例中,所述事件类型预测模块,具体用于:分别将各个视频帧输入预先训练完成的事件类型预测模型的卷积层,利用所述卷积层对各个视频帧进行卷积变换,得到各个视频帧中对象的特征图,作为各个视频帧中对象的对象特征,其中,所述特征图包括通道维度、高度维度、宽度维度,所述事件类型预测模型包括:特征融合层和全连接层,所述特征融合层包括:特征合并子层、卷积子层、维度转换子层、长短期记忆网络子层;将各个视频帧中对象的特征图输入所述特征合并子层,利用所述特征合并子层按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的特征图进行合并,得到第一特征图;将所述第一特征图输入所述卷积子层,利用所述卷积子层按照对所述第一特征图进行卷积变换的方式,对所述第一特征图中不同通道的特征进行融合,得到第二特征图;将所述第二特征图输入所述维度转换子层,利用所述维度转换子层在高度维度和宽度维度上对所述第二特征图进行维度转换,得到一维特征向量;将所述一维特征向量输入所述长短期记忆网络子层,利用所述长短期记忆网络子层对所述一维特征向量中的特征进行特征融合;将融合后的对象特征输入所述全连接层,利用所述全连接层预测所述图像采集设备能够监控的事件的类型。本申请的一个实施例中,所述事件类型预测模块,具体用于:基于融合后的对象特征,预测所获得的视频帧对应于各个预设的事件类型的概率,其中,每一事件类型的概率表征:所获得的视频帧反映的场景中发生该事件类型的事件的发生概率;确定对应的概率达到预设的概率阈值的事件类型,将所确定的事件类型作为所述图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,所述视频帧获得模块,具体用于:获得图像采集设备采集的视频,按照预设间隔从所述视频中抽取预设数量帧视频帧。本申请的一个实施例中,所述视频帧获得模块,具体用于:获得图像采集设备采集的视频帧,并对各个视频帧进行缩放处理,得到预设大小的视频帧。第三方面,本申请实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的事件类型预测方法。本申请实施例有益效果:应用本申请实施例提供的方案进行事件类型预测时,首先获得图像采集设备采集的视频帧,提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合,基于融合后的对象特征,预测图像采集设备能够监控的事件的事件类型。这样通过对图像采集设备所采集的视频帧进行分析,得到各个视频帧中对象的对象特征,基于对象特征预测图像采集设备所能够监控的事件的事件类型,无需人工对各个图像采集设备所监控的事件的事件类型进行预测,由此可见,应用本申请实施例提供的事件类型预测方案,可以提高预测图像采集设备能够监控的事件的事件类型的效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。图1为本申请实施例提供的一种事件类型预测方法的流程示意图;图2为本申请实施例提供的一种视频帧;图3a、图3b为本申请实施例提供的另一种视频帧;图4为本申请实施例提供的一种事件类型预测模型的结构示意图;图5为本申请实施例提供的另一种事件类型预测方法的流程示意图;图6为本申请实施例提供的另一种事件类型预测模型的结构示意图;图7为本申请实施例提供的一种事件类型预测装置的结构示意图;图8为本申请实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了提高预测图像采集设备能够监控的事件的事件类型的效率,本申请实施例提供了一种事件类型预测方法、装置、电子设备及存储介质,下面分别进行详细介绍。参见图1,图1为本申请实施例提供的一种事件类型预测方法的流程示意图,该方法可以应用于图像采集设备、电子计算机、手机等电子设备,该方法包括如下步骤101至步骤103。步骤101,获得图像采集设备采集的视频帧。其中,上述图像采集设备可以架设在人行横道、交通路口、道路中段路侧、商场、工厂、学校等场景中。具体的,可以获得图像采集设备采集的监控视频,在所采集的监控视频中抽取得到视频帧。其中,上述视频帧的数量可以是3帧、5帧、10帧等多帧视频帧,可以在视频中抽取连续的多帧视频帧,也可以在视频中选择成像质量较高的多帧视频帧。本申请的一个实施例中,可以获得图像采集设备采集的视频,按照预设间隔从视频中抽取预设数量帧视频帧。上述预设数量可以是10帧、15帧、30帧等。其中,上述预设间隔可以是预设的时间间隔,即按照每间隔预设的时间间隔的方式抽取预设数量帧视频帧,上述时间间隔可以是30毫秒、100毫秒、1秒等,本申请实施例并不对此进行限定。例如,假设预设的时间间隔为1秒、预设数量为15帧,则可以获取不小于15秒的视频,每间隔1秒抽取一视频帧,最终获得15帧视频帧。上述预设间隔还可以是预设的视频帧间隔,即按照每间隔预设的视频帧间隔的方式抽取预设数量帧视频帧,上述视频帧间隔可以是5帧、10帧、20帧等。例如,假设预设的视频帧间隔为5帧、预设数量为10帧,则可以获取不小于50帧的视频,每间隔5帧视频帧抽取一视频帧,最终获得50帧视频帧。这样选择多帧视频帧,在后续根据多帧视频帧进行事件类型预测时,多帧视频帧中包含的信息更加丰富,例如,假设其中一帧视频帧中对象被遮挡,则可以在其他的视频帧中获得关于该对象的信息,这样根据多帧视频帧得到的事件类型的准确度更高。本申请的一个实施例中,可以获得图像采集设备采集的视频帧,并对各个视频帧进行缩放处理,得到预设大小的视频帧。上述预设大小用于表征视频帧的像素值,具体取值可以是300*300、640*480等。这样可以降低视频帧的像素大小,在后续对视频帧进行处理时,可以减小计算的复杂度,提高计算效率。步骤102,提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合。其中,上述对象为图像采集设备所采集的视频帧中包含的对象。对于架设在人行横道处的图像采集设备,其所采集的视频帧中包含的对象可以是人行横道、行人、红绿灯、车辆、减速标识等;对于架设在商场中的图像采集设备,其所采集的视频帧中包含的对象可以是行人、店铺、广告牌、装饰物等。对象的特征可以是对象标签。针对每一视频帧,可以提取该视频帧中一个或多个对象的对象特征。例如,参见图2,图2为本申请实施例提供的一种视频帧。在对象特征为对象标签的情况下,图2中对象特征可以包括:车辆、行人、红绿灯、人行横道等。视频帧中内容的上下文关系用于表征:各个对象特征的语义之间的关联关系,基于内容的上下文关系对各个对象特征进行融合,可以实现对视频帧进行图像描述。例如,参见图3a、图3b,图3a、图3b为本申请实施例提供的另一种视频帧。如图3a所示,视频帧中对象的对象特征包括:击球手、裁判、观察、球场、球杆、挥动,按照视频帧中内容的上下文关系对上述对象特征进行融合,可以得到对该视频帧的图像描述可以是:球场上击球手在准备挥杆,同时裁判在进行观察。如图3b所示,视频帧中对象的对象特征包括:巴士、停车、大楼,按照视频帧中内容的上下文关系对上述对象特征进行融合,可以得到对该视频帧的图像描述可以是:一辆巴士停在大楼旁边。各个视频帧间对象的移动关系用于表征:各个对象在不同视频帧间发生移动的情况,反映了对象在不同时刻的变化信息,即对象在不同视频帧间的时域特征。以对象为车辆为例,车辆在其中一视频帧中处于停车位内,在下一视频帧中跨越停车位,再下一视频帧中车辆驶离停车位,上述视频帧间对象的移动关系可以表征:车辆从停车位开出。具体的,在获得各个视频帧中对象的对象特征后,可以分析各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,并按照所分析的关系对上述对象特征进行融合,所得到的融合特征可以用于对上述各个视频帧之间对象的关系进行描述,也就是可以表征各个视频帧所描述的事件及各个视频帧反映的场景。本申请的一个实施例中,在提取对象特征时,可以利用预先训练完成的特征提取模型,提取各个视频帧中对象的对象特征;还可以利用预先训练完成的标签分类模型,获得各个视频帧中对象的标签,作为各个对象的对象特征。在进行特征融合时,可以利用语义分析算法,对各个视频帧中的各个对象特征进行融合。步骤103,基于融合后的对象特征,预测图像采集设备能够监控的事件的事件类型。具体的,基于上述融合后的对象特征,可以分析上述视频帧所描述的事件及反映的场景,进而可以根据所描述的事件预测图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,可以利用预先训练完成的特征分类模型,对融合后的对象特征进行分类,得到各个视频帧所描述的事件的事件类型。然后可以根据所获得的事件类型预测图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,可以预先建立视频帧所描述的事件的事件类型与图像采集设备所监控的事件的事件类型的对应关系,在获得视频帧所描述的事件的事件类型后,根据上述对应关系,预测图像采集设备所能够监控的事件的事件类型。参见下表1,表1为本申请实施例提供的一种对应关系的示意表。表1例如,在获得各个视频帧所描述的事件的事件类型为道路上有禁止区域后,说明图像采集设备所监控的场景中可能会存在车辆在禁止区域停车的事件,因此可以预测该图像采集设备能够对禁止区域停车的事件进行监控。对于架设在商场收银区场景下的图像采集设备,若获得各个视频帧所描述的事件的事件类型为顾客排队,则说明图像采集设备所监控的场景中可能会存在插队事件,因此可以预测该图像采集设备能够对插队事件进行监控。本申请的一个实施例中,可以基于融合后的对象特征,预测所获得的视频帧对应于各个预设的事件类型的概率,确定对应的概率达到预设的概率阈值的事件类型,将所确定的事件类型作为图像采集设备能够监控的事件的事件类型。其中,对于交通场景下采集的视频帧,预设的事件类型可以是禁止区域停车、道路拥堵、车辆实线变道等;对于工厂场景下采集的视频帧,预设的事件类型可以是员工迟到、员工早退、员工聚集等。每一事件类型的概率表征:所获得的视频帧反映的场景中发生该事件类型的事件的发生概率。具体的,基于融合后的对象特征可以获得上述视频帧反映的场景,上述场景也就是图像采集设备所监控的场景,每一事件类型的概率可以表征上述场景下发生该事件类型的事件的概率。预设的概率阈值可以是0.6、0.8、0.9等。具体的,基于融合后的对象特征,可以预测视频帧反映的场景中各个预设的事件类型的事件的发生的概率,其中,针对概率达到概率阈值的事件类型,表征上述场景下该事件类型的事件发生的概率较大,也就是该图像采集设备所监控的场景中可能会发生上述事件类型的事件,因此可以将图像采集设备所能够监控的事件的事件类型确定为上述事件类型。各个事件类型的概率互不干扰,图像采集设备所能够监控的事件的事件类型可以有1个,也可以有多个。本申请的一个实施例中,基于融合后的对象特征,预测所获得的视频帧对应于各个预设的事件类型的概率可以包括第一概率和第二概率。其中,第一概率表征:所获得的视频帧反映的场景中发生该事件类型的事件的概率;第二概率表征:所获得的视频帧反映的场景中不发生该事件类型的事件的概率。例如,假设事件的事件类型为“车辆在道路上逆行”,该事件类型对应的概率包括上述视频帧反映的场景中能够发生“车辆在道路上逆行”类型的事件的第一概率,以及上述视频帧反映的场景中不会发生“车辆在道路上逆行”类型的事件的第二概率。后续可以确定对应的第一概率达到预设的概率阈值的事件类型,将所确定的事件类型作为图像采集设备能够监控的事件的事件类型参见表2,表2为本申请实施例提供的一种各个事件类型的概率的示意表。表2事件类型第一概率第二概率禁止区域停车0.90.1车辆逆行0.70.3车辆不礼让行人0.250.75道路拥堵0.40.6车辆实线变道0.50.5假设预测得到的视频帧对应于各个预设的事件类型的概率如上表2所示,可知,事件类型为“禁止区域停车”的事件发生的第一概率为0.9,事件类型为“禁止区域停车”的事件不发生的第二概率为0.1,以此类推,事件类型为“车辆实线变道”的事件发生的第一概率为0.5,事件类型为“车辆实线变道”的事件不发生的第二概率为0.5。假设预设的概率阈值为0.6,则可以得到对应的第一概率达到0.6的事件的事件类型包括“禁止区域停车”、“车辆逆行”,因此,可以预测图像采集设备能够针对禁止区域停车和车辆逆行事件类型的事件进行监控。应用上述实施例提供的方案进行事件类型预测时,首先获得图像采集设备采集的视频帧,提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合,基于融合后的对象特征,预测图像采集设备能够监控的事件的事件类型。这样通过对图像采集设备所采集的视频帧进行分析,得到各个视频帧中对象的对象特征,基于对象特征预测图像采集设备所能够监控的事件的事件类型,无需人工对各个图像采集设备所监控的事件的事件类型进行预测,由此可见,应用上述实施例提供的事件类型预测方案,可以提高预测图像采集设备能够监控的事件的事件类型的效率。本申请的一个实施例中,对于上述步骤102在对各个对象特征进行融合时,可以提取各个视频帧中对象的对象特征,并按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的对象特征进行合并,得到第一特征图,对第一特征图中不同通道的特征进行融合,得到第二特征图,对第二特征图进行维度转换,得到一维特征向量,对一维特征向量中的特征进行特征融合。其中,第二特征图的通道数量小于第一特征图的通道数量。具体的,在获得视频帧后,首先对视频帧进行特征提取,可以得到各个视频帧对应的特征图。其中,每一视频帧对应的特征图包含通道维度c、高度为度h和宽度维度w。然后可以按照各个视频帧的采集顺序,对各个视频帧对应的特征图的通道维度c进行合并,得到第一特征图。这样不改变特征图的高度和宽度,可以实现将各个视频帧对应的对象特征合并在一起。针对上述第一特征图,可以对其中不同通道的特征进行融合,得到第二特征图。由于第一特征图的通道维度包含每一视频帧中的各个对象特征,即每一视频帧的空间特征,还包含各个视频帧中的对象特征,即各个视频帧之间的时域特征,这样对第一特征图中通道维度的特征进行融合,即可以理解为对各个视频帧的对象特征在时域和空域维度进行特征融合。之后可以对第二特征图进行降维处理,得到一维特征向量,对一维特征向量中的特征进行进一步的融合,从而可以进一步在时域和空域维度对各个对象特征进行融合,提高所得到的融合特征的准确度。其中,对第二特征图进行降维处理,即可以理解为对第二特征图的高度维度和宽度维度进行合并,从而得到一维特征向量。本申请的一个实施例中,可以利用预设的特征提取算法,分别提取各个视频帧中对象的对象特征。然后利用特征合并算法,按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的对象特征进行合并,得到第一特征图。再利用第一特征融合算法,对第一特征图中不同通道的特征进行融合,得到第二特征图。利用维度转换算法,对第二特征图进行维度转换,得到一维特征向量。最后利用第二特征融合算法,对一维特征向量中的特征进行特征融合。本申请的一个实施例中,对于上述步骤102和103,还可以借助预先训练完成的事件类型预测模型实现,下面进行详细介绍。本申请的一个实施例中,可以分别将各个视频帧输入预先训练完成的事件类型预测模型,根据事件类型预测模型的输出结果确定图像采集设备所监控的事件的事件类型。参见图4,图4为本申请实施例提供的一种事件类型预测模型的结构示意图,事件类型预测模型包括:卷积层、特征融合层和全连接层,特征融合层包括:特征合并子层、卷积子层、维度转换子层、长短期记忆网络子层。其中,卷积层用于:对各个视频帧进行卷积变换,得到各个视频帧中对象的特征图,作为各个视频帧中对象的对象特征,特征图包括通道维度、高度维度、宽度维度,并将各个视频帧对应的特征图输入特征合并子层。上述卷积层所采用的网络模型可以是vgg16网络模型,该卷积层可以包含多个网络层。以上述卷积层包含5个vgg16网络模型为例,可以分别将各个视频帧依次输入上述5个vgg16网络模型,每一vgg16网络模型中包含一卷积模块和一池化模块,用于分别对输入的数据进行卷积处理和池化处理,这样将每一视频帧经过5个vgg16网络模型的卷积处理和池化处理后,可以提取得到每一视频帧中对象的特征图,作为每一视频帧包含的对象的对象特征。其中,各个视频帧可以复用上述卷积层,这样可以减小模型结构,节省网络模型的计算量。特征合并子层用于:按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的特征图进行合并,得到第一特征图,并将第一特征图输入卷积子层。其中,特征合并子层可以是concat层。卷积子层用于:通过对第一特征图进行卷积变换的方式,对第一特征图中不同通道的特征进行融合,得到第二特征图,并将第二特征图输入维度转换子层。其中,上述卷积子层为cnn网络层。维度转换子层用于:基于高度维度、宽度维度对第二特征图进行维度转换,得到一维特征向量,并将一维特征向量输入长短期记忆网络子层,便于长短期记忆网络对一维特征向量进行进一步的特征融合。其中,上述维度转换层可以是flaten层。长短期记忆网络子层用于:对一维特征向量中的特征进行特征融合,并将融合后的特征输入全连接层。其中,上述长短期记忆网络层可以是lstm(longshort-termmemory,长短期记忆)层。全连接层用于:基于特征融合后的特征,预测图像采集设备能够监控的事件的事件类型,其中,上述全连接层可以是fc层。具体的,全连接层可以输出对应的各个事件类型的概率,选择对应的概率达到预设的概率阈值的事件类型,作为图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,全连接层可以输出图像采集设备能够监控的各个事件的事件类型的概率,每一事件类型的概率中包含:图像采集设备能够监控该事件类型的事件的第一概率和不能够监控该事件类型的事件的第二概率。可以选择对应的第一概率达到预设的概率阈值的事件类型,作为图像采集设备所能监控的事件的事件类型。参见图5,图5为本申请实施例提供的另一种事件类型预测方法的流程示意图,该方法包括如下步骤501至步骤507。步骤501,获得图像采集设备采集的视频帧。步骤502,分别将各个视频帧输入预先训练完成的事件类型预测模型的卷积层,利用卷积层对各个视频帧进行卷积变换,得到各个视频帧中对象的特征图,作为各个视频帧中对象的对象特征。其中,特征图包括通道维度、高度维度、宽度维度,事件类型预测模型包括:特征融合层和全连接层,特征融合层包括:特征合并子层、卷积子层、维度转换子层、长短期记忆网络子层;步骤503,将各个视频帧中对象的特征图输入特征合并子层,利用特征合并子层按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的特征图进行合并,得到第一特征图。步骤504,将第一特征图输入卷积子层,利用卷积子层按照对第一特征图进行卷积变换的方式,对第一特征图中不同通道的特征进行融合,得到第二特征图。步骤505,将第二特征图输入维度转换子层,利用维度转换子层在高度维度和宽度维度上对第二特征图进行维度转换,得到一维特征向量。步骤506,将一维特征向量输入长短期记忆网络子层,利用长短期记忆网络子层对一维特征向量中的特征进行特征融合;步骤507,将融合后的对象特征输入全连接层,利用全连接层预测图像采集设备能够监控的事件的类型。应用上述实施例提供的方案,在获得各个图像采集设备采集的视频帧后,可以利用预先训练完成的事件类型预测模型预测图像采集设备所能够监控的事件的事件类型,这样可以进一步提高事件类型预测效率,并且提高事件类型预测的鲁棒性。上述事件类型预测模型在进行训练时,可以选择大量视频帧作为样本,人工根据样本判断图像采集设备所监控的事件的事件类型,并对样本进行标注。然后可以将标注后的样本输入待训练的模型中,得到模型输出结果,计算模型输出结果相对标注的损失,基于上述损失对模型的参数进行调整,然后重新对模型进行训练,直至达到训练结束条件,得到训练完成的事件类型预测模型。其中,可以利用交叉熵损失函数计算模型输出结果相对标注的损失。上述训练结束条件可以是训练次数达到预设的次数阈值,如1000次、10000次、50000次等,上述训练结束条件还可以是模型输出结果相对标注的损失小于预设的损失阈值等,本申请实施例并不对此进行限定。参见图6,图6为本申请实施例提供的另一种事件类型预测模型的结构示意图。该事件类型预测模型包括5个vgg16层、一个concat层、cnn层、flaten层、lstm层和fc层。下面通过具体的实施例对本申请实施例的方案进行说明。可以获得图像采集设备采集的监控视频,按照预设的时间间隔抽取15个视频帧,并对上述15帧视频帧进行压缩处理,得到像素值为300*300的视频帧。依次将上述15帧视频帧输入事件类型预测模型,由5个vgg16层中的卷积模块和池化模块分别对15帧视频帧进行卷积处理,得到15个通道维度c*高度为度h*宽度维度w=512*10*10的特征图;之后可以由concat层按照各个视频帧的采集顺序,在通道维度对上述15个c*h*w=512*10*10的特征图进行合并,得到c*h*w=7680*10*10的第一特征图;然后由cnn层按照高度1*宽度1*通道256的卷积核在通道维度对第一特征图进行特征融合,得到c*h*w=256*10*10的第二特征图;再由flaten层对上述第二特征图在h*w维度进行维度转换,将上述c*h*w=256*10*10的第二特征图转换为通道维度为256、长度为100的一维特征向量;lstm层对上述一维特征向量中的特征进行特征融合;fc层基于融合后的特征输出图像采集设备能够监控的各个事件的事件类型的概率,每一事件类型的概率中包含:图像采集设备能够监控该事件类型的事件的第一概率和不能够监控该事件类型的事件的第二概率。本申请的一个实施例中,在预测得到图像采集设备能够监控的事件的事件类型后,可以在该图像采集设备中部署用于对上述事件类型的事件进行识别的识别模型。具体的,在预测得到图像采集设备能够监控的事件的事件类型后,说明该图像采集设备采集的监控视频中可能会存在上述事件类型的事件,为了实现对上述事件类型的事件进行识别,可以针对性地在该图像采集设备中部署用于识别上述事件类型的事件的识别模型。例如,在预测得到图像采集设备能够监控车辆逆行的事件后,可以在该图像采集设备中部署车辆逆行识别模型,该车辆逆行识别模型可以识别道路中的逆行车辆,并获得逆行车辆的车牌号等信息。这样可以针对性地在图像采集设备上部署识别模型,对于图像采集设备不能监控的事件的事件类型,则无需部署相关的识别模型,从而可以减小图像采集设备的资源占用,节省物力资源。参见图7,图7为本申请实施例提供的一种事件类型预测装置的结构示意图,所述装置包括:视频帧获得模块701,用于获得图像采集设备采集的视频帧;事件类型预测模块702,用于提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合;基于融合后的对象特征,预测所述图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,所述事件类型预测模块702,具体用于:提取各个视频帧中对象的对象特征;按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的对象特征进行合并,得到第一特征图;对所述第一特征图中不同通道的特征进行融合,得到第二特征图,其中,所述第二特征图的通道数量小于所述第一特征图的通道数量;对所述第二特征图进行维度转换,得到一维特征向量;对所述一维特征向量中的特征进行特征融合。本申请的一个实施例中,所述事件类型预测模块702,具体用于:分别将各个视频帧输入预先训练完成的事件类型预测模型的卷积层,利用所述卷积层对各个视频帧进行卷积变换,得到各个视频帧中对象的特征图,作为各个视频帧中对象的对象特征,其中,所述特征图包括通道维度、高度维度、宽度维度,所述事件类型预测模型包括:特征融合层和全连接层,所述特征融合层包括:特征合并子层、卷积子层、维度转换子层、长短期记忆网络子层;将各个视频帧中对象的特征图输入所述特征合并子层,利用所述特征合并子层按照各个视频帧的采集顺序,在通道维度对各个视频帧对应的特征图进行合并,得到第一特征图;将所述第一特征图输入所述卷积子层,利用所述卷积子层按照对所述第一特征图进行卷积变换的方式,对所述第一特征图中不同通道的特征进行融合,得到第二特征图;将所述第二特征图输入所述维度转换子层,利用所述维度转换子层在高度维度和宽度维度上对所述第二特征图进行维度转换,得到一维特征向量;将所述一维特征向量输入所述长短期记忆网络子层,利用所述长短期记忆网络子层对所述一维特征向量中的特征进行特征融合;将融合后的对象特征输入所述全连接层,利用所述全连接层预测所述图像采集设备能够监控的事件的类型。本申请的一个实施例中,所述事件类型预测模块702,具体用于:基于融合后的对象特征,预测所获得的视频帧对应于各个预设的事件类型的概率,其中,每一事件类型的概率表征:所获得的视频帧反映的场景中发生该事件类型的事件的发生概率;确定对应的概率达到预设的概率阈值的事件类型,将所确定的事件类型作为所述图像采集设备能够监控的事件的事件类型。本申请的一个实施例中,所述视频帧获得模块701,具体用于:获得图像采集设备采集的视频,按照预设间隔从所述视频中抽取预设数量帧视频帧。本申请的一个实施例中,所述视频帧获得模块701,具体用于:获得图像采集设备采集的视频帧,并对各个视频帧进行缩放处理,得到预设大小的视频帧。应用上述实施例提供的方案进行事件类型预测时,首先获得图像采集设备采集的视频帧,提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合,基于融合后的对象特征,预测图像采集设备能够监控的事件的事件类型。这样通过对图像采集设备所采集的视频帧进行分析,得到各个视频帧中对象的对象特征,基于对象特征预测图像采集设备所能够监控的事件的事件类型,无需人工对各个图像采集设备所监控的事件的事件类型进行预测,由此可见,应用上述实施例提供的事件类型预测方案,可以提高预测图像采集设备能够监控的事件的事件类型的效率。本申请实施例还提供了一种电子设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信,存储器803,用于存放计算机程序;处理器801,用于执行存储器803上所存放的程序时,实现上述事件类型预测方法的步骤。上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种事件类型的总线。通信接口用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一事件类型预测方法的步骤。在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一事件类型预测方法的步骤。应用上述实施例提供的方案进行事件类型预测时,首先获得图像采集设备采集的视频帧,提取各个视频帧中对象的对象特征,并基于各个视频帧中内容的上下文关系以及各个视频帧间对象的移动关系,对所提取的对象特征进行融合,基于融合后的对象特征,预测图像采集设备能够监控的事件的事件类型。这样通过对图像采集设备所采集的视频帧进行分析,得到各个视频帧中对象的对象特征,基于对象特征预测图像采集设备所能够监控的事件的事件类型,无需人工对各个图像采集设备所监控的事件的事件类型进行预测,由此可见,应用上述实施例提供的事件类型预测方案,可以提高预测图像采集设备能够监控的事件的事件类型的效率。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、电子设备实施例、计算机可读存储介质实施例、计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。以上所述仅为本申请的较佳实施例,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1