基于视频的对象识别方法、装置及电子设备与流程

文档序号:32065000发布日期:2022-11-05 00:27阅读:71来源:国知局
基于视频的对象识别方法、装置及电子设备与流程

1.本发明涉及人工智能领域,具体而言,涉及一种基于视频的对象识别方法、装置及电子设备。


背景技术:

2.数字经济作为数字生产力驱动和推动下的一种经济形态,在国民经济中的关键作用日益凸显,也正对大众的生活方式、思维方式和行为方式带来颠覆性的变革。在这期间,在线生活、服务模式蓬勃发展,进一步提升了数字技术的影响力,推动音频视频技术服务快速进步。在更改重要个人/企业信息、开通某项交易功能或是开立账户等高风险交易业务场景下,用于记录客服与客户的业务办理过程的金融双录视频应用的非常普遍。
3.目前,为保证双录业务场景下交易业务的安全性,需要人工对金融双录视频进行分析以识别相关客服人员的行为是否规范,具有人力成本高的问题。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本发明实施例提供了一种基于视频的对象识别方法、装置及电子设备,以至少解决现有技术中依赖于人工核查业务办理视频以识别对象类型造成的人力成本高的技术问题。
6.根据本发明实施例的一个方面,提供了一种基于视频的对象识别方法,包括:获取目标视频,其中,目标视频用于记录第一目标对象为第二目标对象办理待办业务的办理过程;从目标视频中提取出多个单帧图像,对每个单帧图像进行特征提取,得到与每个单帧图像对应的目标特征序列;基于目标特征序列,确定用于描述目标视频的视频内容的多个目标字幕;基于多个目标字幕识别第一目标对象的对象类型,其中,对象类型用于表征第一目标对象办理待办业务的办理操作是否符合目标规则。
7.进一步地,基于视频的对象识别方法还包括:对多个单帧图像进行特征提取,得到与每个单帧图像对应的特征序列;基于目标步长,对每个单帧图像对应的特征序列进行特征提取,得到与每个单帧图像对应的目标特征序列,其中,目标步长与单帧图像相对应。
8.进一步地,基于视频的对象识别方法还包括:对目标视频的视频内容进行识别,得到与视频内容所对应的待办业务类型;基于待办业务类型将目标视频的视频时长拆分为至少一个时间区间,并确定每个时间区间的重要级别,其中,重要级别至少表征当前时间区间内第一目标对象办理待办业务的办理操作与待办业务之间的关联程度;基于每个时间区间的重要级别,确定对每个时间区间所对应的视频内容的提取帧数;基于提取帧数,从目标视频中提取出多个单帧图像。
9.进一步地,基于视频的对象识别方法还包括:在基于目标步长,对每个单帧图像对应的特征序列进行特征提取,得到与每个单帧图像对应的目标特征序列之前,基于每个时间区间的重要级别,确定与每个时间区间所对应的单帧图像对应的目标步长。
10.进一步地,基于视频的对象识别方法还包括:通过目标模型中的编码器,将目标特征序列转换为预设维度的目标向量;通过目标模型中的解码器,对目标向量进行解码,得到用于描述目标视频的视频内容的多个目标字幕。
11.进一步地,基于视频的对象识别方法还包括:确定每个目标字幕所对应的显示时间信息;基于显示时间信息,从目标视频中确定多个目标单帧图像;基于时间信息,组合多个目标字幕至与该目标字幕对应的至少一个目标单帧图像中,得到待检查视频;基于待检查视频识别第一目标对象的对象类型。
12.进一步地,基于视频的对象识别方法还包括:确定目标存储区域中至少一个视频存入目标存储区域的存储时间;基于存储时间,从至少一个视频中确定目标视频。
13.根据本发明实施例的另一方面,还提供了一种基于视频的对象识别装置,包括:获取模块,用于获取目标视频,其中,目标视频用于记录第一目标对象为第二目标对象办理待办业务的办理过程;提取模块,用于从目标视频中提取出多个单帧图像,对每个单帧图像进行特征提取,得到与每个单帧图像对应的目标特征序列;确定模块,用于基于目标特征序列,确定用于描述目标视频的视频内容的多个目标字幕;识别模块,用于基于多个目标字幕识别第一目标对象的对象类型,其中,对象类型用于表征第一目标对象办理待办业务的办理操作是否符合目标规则。
14.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的基于视频的对象识别方法。
15.根据本发明实施例的另一方面,还提供了一种电子设备,电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的基于视频的对象识别方法。
16.在本发明实施例中,采用生成用于描述目标视频的视频内容的多个目标字幕,以识别第一目标对象的对象类型的方式,通过获取目标视频,然后从目标视频中提取出多个单帧图像,对每个单帧图像进行特征提取,得到与每个单帧图像对应的目标特征序列,接着基于目标特征序列,确定用于描述目标视频的视频内容的多个目标字幕,从而基于多个目标字幕识别第一目标对象的对象类型。其中,目标视频用于记录第一目标对象为第二目标对象办理待办业务的办理过程,对象类型用于表征第一目标对象办理待办业务的办理操作是否符合目标规则。
17.在上述过程中,从目标视频中提取出多个单帧图像,并确定与每个单帧图像对应的目标特征序列,避免了对目标视频中的每一帧图像均进行特征提取造成的工作效率低的问题,进一步地,基于目标特征序列,确定目标字幕,实现了对视频内容的文字转化,从而避免了人工分析视频内容造成的人力成本高、容易漏检等问题,同时避免了对目标视频中的单张截图进行分析造成的缺乏上下文信息所导致的识别准确度低,通过基于目标视频所对应的多个目标字幕,识别第一目标对象的对象类型,更进一步地避免了人工识别目标字幕时由于工作量大造成的效率低下以及人力成本高。
18.由此可见,本技术所提供的方案达到了生成用于描述目标视频的视频内容的多个目标字幕,以识别第一目标对象的对象类型的目的,从而实现了降低人力成本的技术效果,
进而解决了现有技术中依赖于人工核查业务办理视频以识别对象类型造成的人力成本高的技术问题。
附图说明
19.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
20.图1是根据本发明实施例的一种可选的对象识别系统的示意图;
21.图2是根据本发明实施例的一种可选的基于视频的对象识别方法的示意图;
22.图3是根据本发明实施例的一种可选的数据预处理模块的执行示意图;
23.图4是根据本发明实施例的一种可选的视频密集字幕生成模块的执行示意图;
24.图5是根据本发明实施例的一种可选的目标模型的执行示意图;
25.图6是根据本发明实施例的一种可选的结果处理模块的执行示意图;
26.图7是根据本发明实施例的一种可选的基于视频的对象识别装置的示意图;
27.图8是根据本发明实施例的一种可选的电子设备的示意图。
具体实施方式
28.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
29.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
30.需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
31.实施例1
32.根据本发明实施例,提供了一种基于视频的对象识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
33.在本技术中,以一种可选的对象识别系统作为本技术的执行主体,如图1所示,该
对象识别系统可以包括数据预处理模块、视频密集字幕生成模块以及结果处理模块。
34.图2是根据本发明实施例的一种可选的基于视频的对象识别方法的示意图,如图 2所示,该方法包括如下步骤:
35.步骤s201,获取目标视频,其中,目标视频用于记录第一目标对象为第二目标对象办理待办业务的办理过程。
36.可选的,可以通过电子设备、服务器、应用系统等装置获取目标视频,在本技术中,如图3所示,通过对象识别系统中的数据预处理模块获取目标视频。其中,目标视频可以是通过设置在目标金融机构中的图像采集装置所拍摄生成的,目标视频中至少记录有客服(即前述的第一目标对象)为客户(即前述的第二目标对象)办理待办业务的办理过程,且在本技术中,将前述的拍摄有客服与客户的视频(也即目标视频) 确认为双录视频。可选的,预处理模块可以直接与前述的图像采集装置进行信息交互以获取目标视频,预处理模块可以从预设存储区域中获取预先存储好的目标视频。
37.步骤s202,从目标视频中提取出多个单帧图像,对每个单帧图像进行特征提取,得到与每个单帧图像对应的目标特征序列。
38.在步骤s202中,对象识别系统中的数据预处理模块可以基于现有的视频分析模型,从目标视频中提取出多个单帧图像,其中,前述的视频分析模型可以是c3d模型,对象识别系统可以基于目标视频的视频内容或是预设数值确定每个单帧图像之间间隔的帧数,多个单帧图像之间间隔的帧数可以相同,也可以不同。
39.进一步地,当提取出了多个单帧图像之后,对象识别系统可以基于视频分析模型对提取出的每个单帧图像进行特征提取,从而得到与每个单帧图像对应的目标特征序列。
40.需要说明的是,通过从目标视频中提取出多个单帧图像,避免了对目标视频中的每一帧图像均进行特征提取造成的工作效率低的问题,通过对提取出的单帧图像进行特征提取,得到目标特征序列,可以有效去除单帧图像中的噪声,且便于对单帧图像进行处理。
41.步骤s203,基于目标特征序列,确定用于描述目标视频的视频内容的多个目标字幕。
42.在步骤s203中,对象识别系统可以将目标特征序列输入到预设的深度学习模型中,以确定用于描述目标视频的视频内容的密集字幕(dense captioning),密集字幕由前述的多个目标字幕组成,用于将画面中的许多局部细节通过自然语言描述出来。其中,前述的深度学习模型可以是使用全局残差神经网络的transformer深度学习模型。
43.需要说明的是,通过基于目标特征序列,确定目标字幕,实现了对视频内容的文字转化,从而避免了人工分析视频内容造成的人力成本高、容易漏检等问题,同时避免了对目标视频中的单张截图进行分析造成的缺乏上下文信息,从而导致识别准确度低的问题。
44.步骤s204,基于多个目标字幕识别第一目标对象的对象类型,其中,对象类型用于表征第一目标对象办理待办业务的办理操作是否符合目标规则。
45.在步骤s204中,对象识别系统可以基于目标字幕,确定第一目标对象在办理待办业务时的办理操作,并可以将办理操作与目标规则中所规定的办理操作进行比对,从而识别出第一目标对象的对象类型。
46.需要说明的是,通过基于目标视频所对应的多个目标字幕,识别第一目标对象的对象类型,避免了人工识别目标字幕时由于工作量大造成的效率低下以及人力成本高。
47.基于上述步骤s201至步骤s204所限定的方案,可以获知,在本发明实施例中,采用生成用于描述目标视频的视频内容的多个目标字幕,以识别第一目标对象的对象类型的方式,通过获取目标视频,然后从目标视频中提取出多个单帧图像,对每个单帧图像进行特征提取,得到与每个单帧图像对应的目标特征序列,接着基于目标特征序列,确定用于描述目标视频的视频内容的多个目标字幕,从而基于多个目标字幕识别第一目标对象的对象类型。其中,目标视频用于记录第一目标对象为第二目标对象办理待办业务的办理过程,对象类型用于表征第一目标对象办理待办业务的办理操作是否符合目标规则。
48.容易注意到的是,在上述过程中,从目标视频中提取出多个单帧图像,并确定与每个单帧图像对应的目标特征序列,避免了对目标视频中的每一帧图像均进行特征提取造成的工作效率低的问题,进一步地,基于目标特征序列,确定目标字幕,实现了对视频内容的文字转化,从而避免了人工分析视频内容造成的人力成本高、容易漏检等问题,同时避免了对目标视频中的单张截图进行分析造成的缺乏上下文信息所导致的识别准确度低,通过基于目标视频所对应的多个目标字幕,识别第一目标对象的对象类型,更进一步地避免了人工识别目标字幕时由于工作量大造成的效率低下以及人力成本高。
49.由此可见,本技术所提供的方案达到了生成用于描述目标视频的视频内容的多个目标字幕,以识别第一目标对象的对象类型的目的,从而实现了降低人力成本的技术效果,进而解决了现有技术中依赖于人工核查业务办理视频以识别对象类型造成的人力成本高的技术问题。
50.在一种可选的实施例中,在对每个单帧图像进行特征提取,得到与每个单帧图像对应的目标特征序列的过程中,如图3所示,对象识别系统中的数据预处理模块可以利用c3d视频分析模型,先对多个单帧图像进行特征提取,得到与每个单帧图像对应的特征序列并输出特征序列,然后如图4所示,再通过对象识别系统中的视频密集字幕生成模块获取特征序列,并基于目标步长(strides),对每个单帧图像对应的特征序列进行特征提取处理。其中,前述的特征序列由多个向量组成,前述的目标步长与单帧图像相对应,用于表征当前单帧图像所对应的特征序列的当前维度中当前待提取的向量与其后一个待提取的向量之间的向量个数,例如,当某一单帧图像对应的目标步长表征某一维度所对应的步长为2时,则将该单帧图像所对应的特征序列中该维度中的第1、4、7、10...个向量提取出来,以组合成目标特征序列。可选的,所有单帧图像对应的目标步长可以完全相同,也可以完全不同,还可以仅存在部分相同。
51.需要说明的是,通过基于目标步长,对每个单帧图像对应的特征序列进行特征提取,实现了每个单帧图像所对应的特征量的减少,从而可以提高用户识别系统的工作效率,也即提高识别效率。
52.在一种可选的实施例中,根据目标视频中第一目标对象为第二目标对象办理待办业务的不同,可以对目标视频设置不同的提取单帧图像的方法。可选的,在从目标视频中提取出多个单帧图像的过程中,数据预处理模块可以对目标视频的视频内容进行识别,得到与视频内容所对应的待办业务类型,然后基于待办业务类型将目标视频的视频时长拆分为至少一个时间区间,并确定每个时间区间的重要级别,接着基于每个时间区间的重要级别,确定对每个时间区间所对应的视频内容的提取帧数,从而基于提取帧数,从目标视频中提取出多个单帧图像。其中,重要级别至少表征当前时间区间内第一目标对象办理待办业务
的办理操作与待办业务之间的关联程度。
53.具体地,数据预处理模块可以对目标视频中的视频内容进行识别,从而确定目标视频中第一目标对象为第二目标对象办理代表待办业务的待办业务类型。进一步地,数据预处理模块可以从预设的目标存储区域中获取与代办业务类型对应的拆分规则,并基于待办业务类型所对应的拆分规则将目标视频的视频时长拆分为至少一个时间区间。例如,对于a待办业务,其流程分为5个操作环节,则可以基于这5个操作环节所对应的时间时长拆分目标视频的视频时长。
54.再进一步地,当拆分完目标视频的视频时长之后,数据预处理模块可以基于待办业务类型确定每个时间区间的重要级别,例如,对于a待办业务,在第1个操作环节没有第一目标对象的参与,而第2个操作环节需要第一目标对象全程参与,则可以确定第1个操作环节所对应的时间区间的重要级别为第一级别,第2个操作环节所对应的时间区间的重要级别为第二级别,且第二级别高于第一级别,再例如,对于a待办业务,第2个操作环节中第一目标对象所进行的办理操作为打印第二目标对象所提供的材料,而第3个操作环节中第一目标对象所进行的办理操作为帮助第二目标对象填写相关信息,则可以确定第2个操作环节中第一目标对象所进行的办理操作与待办业务之间的关联程度低于第3个操作环节中第一目标对象所进行的办理操作与待办业务之间的关联程度,也即可以确定第2个操作环节所对应的时间区间的重要级别为第三级别,且第三级别高于第二级别。
55.可选的,当确定了目标视频所对应的每个时间区间的重要级别后,数据预处理模块可以从目标存储区域中获取目标提取信息,从而基于目标提取信息确定对每个时间区间所对应的视频内容的提取帧数,其中,目标提取信息用于表征各重要级别与提取帧数的对应关系。可选的,目标提取信息可以是用于限定需要提取出的相邻单帧图像之间的间隔帧数的信息。之后,数据预处理模块可以利用视频分析模型,基于提取帧数,从目标视频中提取出多个单帧图像。
56.需要说明的是,通过根据目标视频中第一目标对象为第二目标对象办理待办业务的不同,对目标视频设置不同的提取单帧图像的方法,可以在保证识别效果的同时,进一步地减少所需要处理的特征量,从而有效提高识别效率。
57.在一种可选的实施例中,在基于目标步长,对每个单帧图像对应的特征序列进行特征提取,得到与每个单帧图像对应的目标特征序列之前,对象识别系统可以基于每个时间区间的重要级别,确定与每个时间区间所对应的单帧图像对应的目标步长。
58.可选的,在确定了每个时间区间的重要级别之后,视频密集字幕生成模块可以目标存储区域中获取与每个时间区间所对应的目标步长,从而实现基于不完全相同的目标步长对与该目标步长所对应的时间区间中的单帧图像进行处理,从而更进一步地在保证识别效果的同时,减少所需要处理的特征量,有效提高识别效率。
59.在一种可选的实施例中,在基于目标特征序列,确定用于描述目标视频的视频内容的多个目标字幕的过程中,如图4、图5所示,视频密集字幕生成模块可以将目标特征序列输入到解码器-编码器框架的transformer视频信息提取模型,(也即目标模型),在目标模型获取到目标特征序列后,目标模型可以利用transformer学习网络,通过该模型中的编码器,将目标特征序列转换为预设维度的目标向量,然后通过该模型中的解码器,对目标向量进行解码,得到并输出用于描述目标视频的视频内容的多个目标字幕。其中,每个目标字幕
均具有与其对应的时间戳,前述的transformer视频信息提取模型可以是使用全局残差神经网络的模型。
60.需要说明的是,通过基于解码器-编码器框架的目标模型对目标特征序列进行处理,实现了对多个目标字幕的准确确定,从而提高了对第一目标对象的对象类型的识别准确率。
61.在一种可选的实施例中,在基于多个目标字幕识别第一目标对象的对象类型的过程中,对象识别系统可以确定每个目标字幕所对应的显示时间信息,然后过基于显示时间信息,从目标视频中确定多个目标单帧图像,接着基于时间信息,组合多个目标字幕至与该目标字幕对应的至少一个目标单帧图像中,得到待检查视频,从而基于待检查视频识别第一目标对象的对象类型。
62.可选的,如图6所示,结果处理模块在获取到用于描述目标视频的多个目标字幕之后,可以基于目标字幕所对应的时间戳确定目标字幕所对应的显示时间信息,然后确定目标视频中与显示时间信息所表征的至少一个时间点中每个时间点所对应的单帧图像,从而得到目标单帧图像。进一步地,结果处理模块可以将当前目标字幕与其所对应的所有目标单帧图像相组合,并在将所有目标字幕均依照前述方法进行组合后,得到标记有目标字幕的待检查视频,从而可以基于待检查视频识别第一目标对象的对象类型。
63.需要说明的是,通过将目标字幕与目标视频相结合,使得对象识别系统可以更快速的识别出第一目标对象的对象类型以及其发生不规范操作的操作环节,从而可以进一步地提高识别效率。
64.在一种可选的实施例中,在获取目标视频的过程中,对象识别系统可以确定目标存储区域中至少一个视频存入目标存储区域的存储时间,从而基于存储时间,从至少一个视频中确定目标视频。
65.可选的,对象识别系统可以在目标存储区域中,按照存入时间顺序,获取距当前时间最早的一个视频进行处理。可选的,对象识别系统也可以对最新存入的视频进行优先处理。
66.需要说明的是,通过根据视频的存入时间确定目标视频,使得本技术在对多个视频文件进行处理时更加合理,从而提高本技术的适用性。
67.由此可见,本技术所提供的方案达到了生成用于描述目标视频的视频内容的多个目标字幕,以识别第一目标对象的对象类型的目的,从而实现了降低人力成本的技术效果,进而解决了现有技术中依赖于人工核查业务办理视频以识别对象类型造成的人力成本高的技术问题。
68.实施例2
69.根据本发明实施例,提供了一种基于视频的对象识别装置的实施例,其中,图7 是根据本发明实施例的一种可选的基于视频的对象识别装置的示意图,如图7所示,该装置包括:
70.获取模块701,用于获取目标视频,其中,目标视频用于记录第一目标对象为第二目标对象办理待办业务的办理过程;
71.提取模块702,用于从目标视频中提取出多个单帧图像,对每个单帧图像进行特征提取,得到与每个单帧图像对应的目标特征序列;
72.确定模块703,用于基于目标特征序列,确定用于描述目标视频的视频内容的多个目标字幕;
73.识别模块704,用于基于多个目标字幕识别第一目标对象的对象类型,其中,对象类型用于表征第一目标对象办理待办业务的办理操作是否符合目标规则。
74.需要说明的是,上述获取模块701、提取模块702、确定模块703以及识别模块 704对应于上述实施例中的步骤s201至步骤s204,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
75.可选的,提取模块还包括:第一提取子模块,用于对多个单帧图像进行特征提取,得到与每个单帧图像对应的特征序列;第二提取子模块,用于基于目标步长,对每个单帧图像对应的特征序列进行特征提取,得到与每个单帧图像对应的目标特征序列,其中,目标步长与单帧图像相对应。
76.可选的,提取模块还包括:第一识别子模块,用于对目标视频的视频内容进行识别,得到与视频内容所对应的待办业务类型;拆分模块,用于基于待办业务类型将目标视频的视频时长拆分为至少一个时间区间,并确定每个时间区间的重要级别,其中,重要级别至少表征当前时间区间内第一目标对象办理待办业务的办理操作与待办业务之间的关联程度;第一确定子模块,用于基于每个时间区间的重要级别,确定对每个时间区间所对应的视频内容的提取帧数;第三提取子模块,用于基于提取帧数,从目标视频中提取出多个单帧图像。
77.可选的,基于视频的对象识别装置还包括:第二确定子模块,用于基于每个时间区间的重要级别,确定与每个时间区间所对应的单帧图像对应的目标步长。
78.可选的,确定模块还包括:第一处理模块,用于通过目标模型中的编码器,将目标特征序列转换为预设维度的目标向量;第二处理模块,用于通过目标模型中的解码器,对目标向量进行解码,得到用于描述目标视频的视频内容的多个目标字幕。
79.可选的,识别模块还包括:第三确定子模块,用于确定每个目标字幕所对应的显示时间信息;第四确定子模块,用于基于显示时间信息,从目标视频中确定多个目标单帧图像;组合模块,用于基于时间信息,组合多个目标字幕至与该目标字幕对应的至少一个目标单帧图像中,得到待检查视频;第二识别子模块,基于待检查视频识别第一目标对象的对象类型。
80.可选的,获取模块还包括:第五确定子模块,用于确定目标存储区域中至少一个视频存入目标存储区域的存储时间;第六确定子模块,用于基于存储时间,从至少一个视频中确定目标视频。
81.实施例3
82.根据本发明实施例的另一方面,还提供了计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的基于视频的对象识别方法。
83.实施例4
84.根据本发明实施例的另一方面,还提供了一种电子设备,其中,图8是根据本发明实施例的一种可选的电子设备的示意图,如图8所示,电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个
或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的基于视频的对象识别方法。
85.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
86.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
87.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
88.作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
89.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
90.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
91.以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1