行为检测方法、装置、设备及可读存储介质与流程

文档序号:30170930发布日期:2022-05-26 10:24阅读:121来源:国知局
行为检测方法、装置、设备及可读存储介质与流程

1.本技术属于计算机视觉领域,尤其涉及一种行为检测方法、装置、设备及可读存储介质。


背景技术:

2.围栏是一种常见的公共防范设施,能够在物理上实现对空间的隔离。但对于未全封闭的围栏,行人可以轻易的通过围栏的间隙进行传递物品等操作,即,发生隔栏递物行为。
3.在一些需要场景中,围栏的分布通常很广泛,目前,通过视频分析技术,已经能够对是否发生隔栏递物的行为做出判断,但是,目前对隔栏递物行为的检测以及识别,仍然存在检测效率不高,场景适应性差的问题。


技术实现要素:

4.本技术实施例提供一种行为检测方法、装置、设备及可读存储介质,能够有效提高检测隔栏递物行为的检测效率,并能够有效适用于不同的检测场景。
5.第一方面,本技术实施例提供一种行为检测方法,包括:
6.获取第一预设时长内的n帧图像,其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧;
7.识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对;
8.将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果;
9.当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,确定第一预设时长内包括目标行为。
10.在第一方面的一些可实现方式中获取第一预设时长内的n帧图像,包括:
11.获取第一预设时长内的n帧图像,其中,每帧图像包括位于目标障碍物任意一侧的第二对象;
12.根据预设识别算法,确定每帧图像中第二对象的位置信息;
13.对应每帧图像,根据第二对象的位置信息和预设位置筛选条件,从第二对象中确定满足预设位置筛选条件的第一对象,其中,预设位置筛选条件为第二对象与目标障碍物的距离小于预设距离阈值。
14.在第一方面的一些可实现方式中预设识别区域包括位于每帧图像中目标障碍物一侧的第一识别区域和位于目标障碍物另一侧的第二识别区域;识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对,包括:
15.对应每帧图像,将位于第一识别区域的第一对象与位于第二识别区域的第一对象分别匹配,得到每帧图像包括的对象匹配对。
16.在第一方面的一些可实现方式中对应每帧图像,将位于第一识别区域的第一对象
与位于第二识别区域的第一对象分别匹配,得到每帧图像包括的对象匹配对,包括:
17.对应每帧图像,获取位于第一识别区域的第一对象对应的第一识别框,以及获取位于第二识别区域的第一对象对应的第二识别框;
18.将第一识别框的目标边框沿第一方向延展预设长度,得到第三识别框,其中,第一方向为由第一识别区域指向第二识别区域的方向;
19.当第三识别框与第二识别框的位置关系满足预设条件时,将第三识别框中的第一对象与第二识别框中的第一对象进行匹配,得到每帧图像包括的对象匹配对。
20.在第一方面的一些可实现方式中当第三识别框与第二识别框的位置关系满足预设条件时,将第三识别框中的第一对象与第二识别框中的第一对象进行匹配,得到每帧图像包括的对象匹配对,包括:
21.根据第三识别框与第二识别框的位置关系,确定每个第三识别框与第二识别框的重叠面积;
22.对应每帧图像,当第三识别框与第二识别框的重叠面积满足预设面积条件时,确定第三识别框中的第一对象与第二识别框中的第一对象匹配为对象匹配对。
23.在第一方面的一些可实现方式中预设面积条件为第三识别框与第二识别框的重叠面积与第二识别框的面积的比值满足预设比例阈值。
24.第二方面,本技术实施例提供一种行为检测装置,包括:
25.获取模块,用于获取第一预设时长内的n帧图像,其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧;
26.识别模块,用于识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对;
27.处理模块,用于将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果;
28.处理模块,还用于当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,确定第一预设时长内包括目标行为。
29.第三方面,本技术提供一种行为检测设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面或者第一方面任一可实现方式中的行为检测方法。
30.第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或者第一方面任一可实现方式中的行为检测方法。
31.第五方面,本技术实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面或者第一方面任一可实现方式中的行为检测方法。
32.本技术实施例提供了一种行为检测方法、装置、设备及可读存储介质。通过获取第一预设时长内的n帧图像,其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧。接下来,识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对,从而可以对发生可能发生交互的用户进行初步判断;之后,将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹
配对的姿态信息确定每帧图像的姿态分类结果;当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,可以快速、准确的确定第一预设时长内包括目标行为。如此一来,能够对不同行人之间的递物行为进行更好的判别,从而能够更好地适应于不同的检测场景。
附图说明
33.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
34.图1是本技术实施例提供的一种行为检测方法的流程示意图;
35.图2是本技术实施例提供的一种采集图像的示意图;
36.图3是本技术实施例提供的一种筛选后的第一对象的示意图;
37.图4是本技术实施例提供的一种移动后的目标边框的示意图;
38.图5是本技术实施例提供的一个对象匹配对的姿态信息的示意图;
39.图6是本技术实施例提供的一种行为检测装置的结构示意图;
40.图7是本技术实施例提供的一种行为检测设备的结构示意图。
具体实施方式
41.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本技术,而不是限定本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
42.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
43.围栏是一种常见的公共防范设施,能够在物理上实现对空间的隔离。但对于未全封闭的围栏,行人可以轻易的通过围栏的间隙进行传递物品等操作,即,发生隔栏递物行为。
44.在一些场景中,围栏的分布通常很广泛,例如,地铁的安检通道通常包括大量的围栏,而隔栏递物行为会为地铁造成未知的安全隐患。示例性的,被递的物品未通过安检,如若被递物品是危险品,则将对乘客的安全造成威胁,由于围栏数量多,依靠人工进行盯防隔栏递物行为非常困难。
45.目前,通过视频分析技术,已经能够对是否发生隔栏递物的行为做出判断,但是,目前对隔栏递物行为的检测以及识别,仍然存在检测效率不高,场景适应性差的问题。
46.针对于此,本技术实施例提供了一种行为检测方法、装置、设备和计算机可读存储介质,通过获取第一预设时长内的n帧图像,可以对发生可能发生交互的用户进行初步判断;之后,将每帧图像输入预设姿态分类模型,确定n帧图像中每帧图像中每个对象匹配对的姿态信息,并得到n帧图像的姿态分类结,从而实现快速、准确确定第一预设时长内包括目标行为。如此一来,能够对不同行人之间的递物行为进行更好的判别,从而能够更好地适应于不同的检测场景。
47.下面结合附图对本技术实施例所提供的行为检测方法进行介绍。图1示出了本技术一个实施例提供的行为检测方法的流程示意图。如图1所示,该方法可以包括以下步骤:
48.步骤110,获取第一预设时长内的n帧图像。
49.其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧。
50.步骤120,识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对。
51.步骤130,将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果。
52.步骤140,当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,确定第一预设时长内包括目标行为。
53.上述各个步骤的具体实现方式将在下文中进行详细描述。
54.根据本技术实施例,通过获取第一预设时长内的n帧图像,其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧。接下来,识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对,从而可以对发生可能发生交互的用户进行初步判断;之后,将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果;当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,可以快速、准确的确定第一预设时长内包括目标行为。如此一来,能够对不同行人之间的递物行为进行更好的判别,从而能够更好地适应于不同的检测场景。
55.下面介绍上述各个步骤的具体实现方式。
56.具体地,涉及步骤110,获取第一预设时长内的n帧图像。其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧。
57.在一些需要对隔栏递物行为进行检测的场景中,可以通过图像采集设备进行图像采集,其中,图像采集设备例如可以是摄像头、视觉传感器的等能够进行图像采集的设备。图像采集设备可以实时获取行为检测场景中的图像,其中,在行为检测场景例如可以是需要进行安检的活动场所,在安检过程中设置有围栏等用于隔离的障碍物。
58.具体地,第一对象是能够执行目标行为的对象,例如,行人、机械手臂等,在此不对第一对象进行具体限定。可以理解的是,第一对象可以位于目标障碍物的其中一侧。例如,当第一对象为行人时,行人所处的位置可以在围栏任意一边。在一些实施例中,可以直接将采集的图像中所有的对象直接进行行为检测。可选地,第一对象可以经过筛选后的对象,以提高行为检测结果的准确性。
59.在一些实施例中,图像采集设备采集到的图像数据可以是视频等数据。可选地,采
集到的图像数据可以缓存在数据库中,以便于在需要行为检测时,提取所需的图像。
60.具体地,根据行为检测需求,可以获取第一预设时长内的n帧图像,其中,n为正整数。
61.以图像数据是视频为例,第一预设时长可以根据具体的检测需求进行设定,例如,第一预设时长可以为5秒,在此不对第一预设时长做具体限定。其中,n个图像可以从视频中提取,例如,对于整个视频数据,可以每隔预设帧数的图像提取一张,从而可以得到用于行为检测的n帧图像。可选地,预设帧数例如可以为5张,在此不对预设帧数做具体限定。如此,可以有效提高数据处理量,提高获取行为检测结果的速度。
62.在一些实施例中,对每帧图像还可以根据预设的图像降噪算法进行降噪处理,以便于提高行为检测的检测结果的准确性。示例性的,预设的降噪算法例如可以是高斯滤波算法,其中,高斯滤波算法可以如公式(1)所示。
[0063][0064]
其中,x代表像素的横坐标,y代表像素的纵坐标,σ为预设常数,示例性的,σ可以取1.5,σ代表高斯函数的宽度。
[0065]
在一些实施例中,为了提高行为检测结果的准确性,具体地,获取筛选后的第一对象可以参考以下步骤:
[0066]
步骤111,获取第一预设时长内的n帧图像。其中,每帧图像包括位于目标障碍物任意一侧的第二对象;步骤112,根据预设识别算法,确定每帧图像中第二对象的位置信息;步骤113,对应每帧图像,根据第二对象的位置信息和预设位置筛选条件,从第二对象中确定满足预设位置筛选条件的第一对象,其中,预设位置筛选条件为第二对象与目标障碍物的距离小于预设距离阈值。
[0067]
具体地,第二对象是能够执行目标行为的对象,例如,行人、机械手臂等,在此不对第二对象进行具体限定。对n帧图像的每帧图像,可以根据预设识别算法进行识别,从而可以得到每帧图像中所包括的第二对象。例如,若第二对象是行人,则可以根据预设行人识别算法识别得到图像中的每个行人。示例性的,预设的行人识别算法可以是yolov5检测算法。
[0068]
根据预设识别算法,可以识别得到图像内包括的第二对象,并得到每个第二对象的位置信息,以第二对象为行人为例,图2是本技术实施例提供的一种采集图像的示意图,在图像中包括目标障碍物201,位于目标障碍物一侧的行人a1、a2、a3,以及位于目标障碍物另一侧的行人b1、b2、b3、b4。可以理解的是,图像内每个行人的识别框为示例性的,在实际采集的图像中并不包括该识别框。
[0069]
在一些实施例中,根据预设识别算法,得到每帧图像中行人的位置信息,可以以行人中心点所在位置的位置信息作为行人的位置信息,也可以选择识别框中的预设边框所在的位置信息作为行人的位置信息,以目标障碍物左侧的行人a2为例,预设边框可以是识别框的右边框a21,以目标障碍物右侧的行人b2为例,预设边框可以是识别框的左边框b23。
[0070]
根据每个第二对象的所在位置的位置信息,可以得到每个第二对象与目标障碍物的距离,结合图2所示,即,在得到每个行人的位置信息后,可以获取到每个行人与目标障碍物201的距离。
[0071]
接下来,可以根据预设位置筛选条件对第二对象进行筛选,具体例如,将与目标障
碍物的距离小于预设距离阈值的第二对象选中,作为用于行为检测的第一对象。其中,预设距离阈值可以根据实际应用场景进行设置,在此不对预设距离阈值进行具体限定。
[0072]
根据本技术实施例,通过预先筛除部分对象,可以明显减少行为检测过程的数据处理量,有利于提到获得行为识别结果的速度,减少数据处理过程中的计算误差,从而提高行为检测结果的准确性。
[0073]
可选地,结合图2所示,其中还包括分别位于目标障碍物201两边的预设警戒线202和203,其中,预设警戒线的所在位置可根据采集图像时的角度、大小等因素进行调整,在此不对警戒线的位置进行具体限定。
[0074]
根据第二对象的位置信息和预设的筛选条件,即,根据第二对象的位置信息与预设警戒线的位置,对第二对象进行筛选,具体例如,当第二对象与警戒线重叠,或者第二对象位于预设警戒线之内时,可以认为第二对象与目标障碍物的距离小于预设距离阈值,从而实现对第二对象的筛选。
[0075]
在确定图像中的第一对象后,接下来,可以执行步骤120。
[0076]
步骤120,识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对。
[0077]
具体地,预设识别区域可以包括位于每帧图像中目标障碍物一侧的第一识别区域和位于目标障碍物另一侧的第二识别区域。因此,对应每帧图像,将位于第一识别区域的第一对象与位于第二识别区域的第一对象分别匹配,得到每帧图像包括的对象匹配对。
[0078]
为了简洁,下面以筛选后得到的第一对象为例,对本技术实施例进行解释。示例性的,图3是本技术实施例提供了一种筛选后的第一对象的示意图。如图3所示,目标障碍物一侧的第一识别区域301包括第一对象a1、a2,目标障碍物另一侧的第二识别区域302包括第一对象b1、b3。在匹配过程中,将位于第一识别区域的第一对象与位于第二识别区域的第一对象分别匹配,可以得到对象匹配对a1-b1、a1-b3、a2-b1和a2-b3。
[0079]
在一些实施例中,为了减少数据处理量,在获取每帧图像包括的对象匹配对时,具体地,还可以执行以下步骤:对应每帧图像,获取位于第一识别区域的第一对象对应的第一识别框,以及获取位于第二识别区域的第一对象对应的第二识别框;将第一识别框的目标边框沿第一方向延展预设长度,得到第三识别框,其中,第一方向为由第一识别区域指向第二识别区域的方向;当第三识别框与第二识别框的位置关系满足预设条件时,将第三识别框中的第一对象与第二识别框中的第一对象进行匹配,得到每帧图像包括的对象匹配对。
[0080]
示例性的,结合图3所示,在第一识别区域301中,第一对象a1对应的第一识别框的目标边框a11、第一对象a2对应的第一识别框的目标边框a21,将目标边框a11和目标边框a21分别向第一方向x移动预设距离,可以得到每个第一对象分别对应的第三识别框。示例性的,目标边框a21移动预设距离后的位置如图4中的a211所示。
[0081]
在一些实施例中,预设距离的大小可以根据原识别框的宽度确定,例如,目标边框延展预设距离后得到的识别框的宽度是原识别框预设倍数,例如,目标边框延展预设距离后得到的识别框的宽度是原识别框2倍,在此不做具体限定。
[0082]
对应每帧图像,将第一识别区域中每个第一对象对应的第一识别框的目标边框沿第一方向延展预设距离后,可以得到每个第一对象对应的第三识别框。可选地,预设条件例如可以第三识别框与第二识别框是否存在重叠,若存在重叠,则将第三识别框中的第一对
象与第二识别框中的第一对象进行匹配,从而可以得到对象匹配对。如此,可以精简每帧图像中对象匹配对的数量,由于计算过程简单,能够有效提高整个行为检测过程的检测速度,以及提高行为检测的应用场景的适应性。
[0083]
在一些实施例中,获取每帧图像包括的对象匹配对,还可以包括以下步骤:根据第三识别框与第二识别框的位置关系,确定每个第三识别框与第二识别框的重叠面积;对应每帧图像,当第三识别框与第二识别框的重叠面积满足预设面积条件时,确定第三识别框中的第一对象与第二识别框中的第一对象匹配为对象匹配对。
[0084]
具体地,在得到第三识别框后,可以计算每个第三识别框与第二识别框的重叠面积,从而可以根据重叠面积与预设面积条件更加精确的确定每帧图像对应的匹配对,具体地,预设面积条件可以为第三识别框与第二识别框的重叠面积与第二识别框的面积的比值满足预设比例阈值。
[0085]
根据本技术实施例,可以更加精简每帧图像中对象匹配对的数量,由于计算过程简单,能够有效提高整个行为检测过程的检测速度。
[0086]
在一些实施例中,可选地,为了提高对象匹配对的准确性,对同一图像中的另一识别区域的第一对象执行对象匹配对的精简步骤,即,在第一识别区域内的第一对象不动的情况下,将第二识别区内的第一对象对应的第二识别框的目标边框向第二方向延展预设距离,得到第四识别框。其中,第二方向可以是从第二识别区域指向第一识别区域的方向;接下来可以根据第四识别框与第一识别框的位置关系确定每帧图像中的对象匹配对。之后,还可以根据预设面积条件,进一步确定图像中的对象匹配对。
[0087]
在对同一图像中的两个识别区域的第一对象分别执行对象匹配对的精简步骤后,对应一帧图像,可以得到两组对象想匹配对,接下来,可以将两组对象匹配对合并,并执行去重操作,从而可以更加准确的对象匹配对。
[0088]
可以理解是,上述第一识别区域和第二识别区域仅是为了便于描述和区分位于目标障碍物两侧的区域,而不作为对本技术实施例目标障碍物两侧区域的具体限定。
[0089]
在得到每帧图像中包括的对象匹配对后,接下来可以执行步骤130,对对象匹配对的姿态信息进行检测。
[0090]
具体地,涉及步骤130,将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果。其中,预设姿态分类模型为能够对对象匹配对的姿态进行检测的模型。
[0091]
示例性的,预设姿态分类模型可以包括骨架检测算法,具体例如alphapose算法。具体地,通过骨架检测算法可以对输入的第一图像进行空间转换,获取更精确的人体候选区域,接下来,可以对人体候选区域进行姿态检测,获取人的骨架图作为对象匹配对的姿态信息。可选地,人体候选区域的姿态可以只保留骨架图的胳膊和臂膀部分,并将其生成最终的骨架图作为对象匹配对的姿态信息,示例性的,图5示出了本技术实施例提供的一个对象匹配对的姿态信息的示意图,其中包括对象匹配对a1-b1的姿态信息,如图所示,姿态信息包括a1的骨架图和b1的骨架图。之后,通过空间转换将估计的骨架图映射回原有的第一图像,并确定根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果。
[0092]
预设姿态分类模型根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果,具体地,当姿态分类结果为目标姿态分类结果时,说明在图像中包括隔栏递物行为,当
姿态分类结果为非目标姿态分类结果,说明在图像中不包括隔栏递物行为。
[0093]
根据本技术实施例,可以快速确定每个图像的初步行为检测结果,为了提高行为检测结果的准确性。接下来还可以执行步骤140。
[0094]
涉及步骤140,当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,确定第一预设时长内包括目标行为。
[0095]
具体地,对于第一预设时长内的n帧图像,可以在n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,确定第一预设时长内包括目标行为,即在第一预设时长内发生了隔栏递物行为。示例性的,预设数量阈值例如为3,当n个姿态分类结果中包括大于3个的目标姿态分类结果时,可以判断第一预设时长内包括隔栏递物行为。在一些实施例中,预设数量阈值可以根据实际检测需求进行设定,例如,可以根据n的大小对预设数量阈值的大小进行调整。
[0096]
根据本技术实施例,可以快速、准确的确定第一预设时长内包括目标行为。如此一来,能够对不同行人之间的递物行为进行更好的判别,从而能够更好地适应于不同的检测场景。
[0097]
基于相同的发明构思,本技术还提供了与上述行为检测方法对应的行为检测装置600,下面具体结合图6进行详细说明。图6是本技术实施例提供的一种行为检测装置的结构示意图,如图6所示,该行为检测装置600可以包括:
[0098]
获取模块610,用于获取第一预设时长内的n帧图像,其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧;
[0099]
识别模块620,用于识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对;
[0100]
处理模块630,用于将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果;
[0101]
处理模块630,还用于当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,确定第一预设时长内包括目标行为。
[0102]
在一些实施例中,获取模块610,还用于获取第一预设时长内的n帧图像,其中,每帧图像包括位于目标障碍物任意一侧的第二对象;
[0103]
处理模块630,还用于根据预设识别算法,确定每帧图像中第二对象的位置信息;
[0104]
处理模块630,还用于对应每帧图像,根据第二对象的位置信息和预设位置筛选条件,从第二对象中确定满足预设位置筛选条件的第一对象,其中,预设位置筛选条件为第二对象与目标障碍物的距离小于预设距离阈值。
[0105]
在一些实施例中,预设识别区域包括位于每帧图像中目标障碍物一侧的第一识别区域和位于目标障碍物另一侧的第二识别区域;
[0106]
识别模块620,还用于对应每帧图像,将位于第一识别区域的第一对象与位于第二识别区域的第一对象分别匹配,得到每帧图像包括的对象匹配对。
[0107]
在一些实施例中,获取模块610,还用于对应每帧图像,获取位于第一识别区域的第一对象对应的第一识别框,以及获取位于第二识别区域的第一对象对应的第二识别框;
[0108]
处理模块630,还用于将第一识别框的目标边框沿第一方向延展预设长度,得到第三识别框,其中,第一方向为由第一识别区域指向第二识别区域的方向;
[0109]
处理模块630,还用于当第三识别框与第二识别框的位置关系满足预设条件时,将第三识别框中的第一对象与第二识别框中的第一对象进行匹配,得到每帧图像包括的对象匹配对。
[0110]
在一些实施例中,处理模块630,还用于根据第三识别框与第二识别框的位置关系,确定每个第三识别框与第二识别框的重叠面积;
[0111]
处理模块630,还用于对应每帧图像,当第三识别框与第二识别框的重叠面积满足预设面积条件时,确定第三识别框中的第一对象与第二识别框中的第一对象匹配为对象匹配对。
[0112]
在一些实施例中,预设面积条件为第三识别框与第二识别框的重叠面积与第二识别框的面积的比值满足预设比例阈值。
[0113]
可以理解的是,本技术实施例的行为检测装置200,可以对应于本技术实施例提供的行为检测方法的执行主体,行为检测装置200的各个模块/单元的操作和/或功能的具体细节可以参见上述本技术实施例图1的行为检测方法中的相应部分的描述,为了简洁,在此不再赘述。
[0114]
本技术实施例的行为检测装置,通过获取第一预设时长内的n帧图像,其中,每帧图像包括目标障碍物和第一对象,第一对象位于目标障碍物的任意一侧。接下来,识别每帧图像中位于目标障碍物两侧的预设识别区域的第一对象为对象匹配对,从而可以对发生可能发生交互的用户进行初步判断;之后,将每帧图像输入预设姿态分类模型,确定每帧图像中每个对象匹配对的姿态信息,并根据每个对象匹配对的姿态信息确定每帧图像的姿态分类结果;当n帧图像的姿态分类结果为目标姿态分类结果的数量满足预设数量阈值时,可以快速、准确的确定第一预设时长内包括目标行为。如此一来,能够对不同行人之间的递物行为进行更好的判别,从而能够更好地适应于不同的检测场景。
[0115]
基于相同的发明构思,本技术还提供了与上述行为检测方法对应的行为检测设备700,下面具体结合图7进行详细说明。图7示出了本技术一个实施例提供的行为检测设备的结构示意图。如图7所示,该设备可以包括处理器701以及存储有计算机程序指令的存储器702。
[0116]
具体地,上述处理器701可以包括中央处理器(central processing unit,cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0117]
存储器702可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器702可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器702可以包括可移除或不可移除(或固定)的介质,或者存储器702是非易失性固态存储器。存储器702可在行为检测设备的内部或外部。
[0118]
存储器可包括只读存储器(rom),随机存取存储器(ram),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
[0119]
处理器701通过读取并执行存储器702中存储的计算机程序指令,以实现本技术实施例所描述的方法,并达到本技术实施例执行其方法达到的相应技术效果,为简洁描述在此不再赘述。
[0120]
在一个示例中,该行为检测设备还可包括通信接口703和总线710。其中,如图7所示,处理器701、存储器702、通信接口703通过总线710连接并完成相互间的通信。
[0121]
通信接口703,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。
[0122]
总线710包括硬件、软件或两者,将在线信息流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(accelerated graphics port,agp)或其他图形总线、增强工业标准架构(extended industry standard architecture,eisa)总线、前端总线(front side bus,fsb)、超传输(hyper transport,ht)互连、工业标准架构(industry standard architecture,isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线710可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0123]
该行为检测设备可以执行本技术实施例中的行为检测方法,从而实现本技术实施例描述的行为检测方法的相应技术效果。
[0124]
另外,结合上述实施例中的行为检测方法,本技术实施例可提供一种可读存储介质来实现。该可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种行为检测方法。可读存储介质的示例可以是非暂态机器可读介质,如电子电路、半导体存储器设备、只读存储器(read-only memory,rom)、软盘、只读光盘(compact disc read-only memory,cd-rom)、光盘、硬盘等。
[0125]
需要明确的是,本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本技术的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本技术的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
[0126]
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(application specific integrated circuit,asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(read-only memory,rom)、闪存、可擦除只读存储器(erasable read only memory,erom)、软盘、只读光盘(compact disc read-only memory,cd-rom)、光盘、硬盘、光纤介质、射频(radio frequency,rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
[0127]
还需要说明的是,本技术中提及的示例性实施例,基于一系列的步骤或者装置描
述一些方法或系统。但是,本技术不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
[0128]
另外,结合上述实施例中的行为检测方法、装置,以及可读存储介质,本技术实施例可提供一种计算机程序产品来实现。所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行上述实施例中的任意一种行为检测方法。
[0129]
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
[0130]
以上所述,仅为本技术的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1