本申请实施例涉及图像识别,特别涉及一种打电话动作识别方法、装置、系统和存储介质。
背景技术:
1、时空动作检测是指对输入图片或视频中的多个目标进行空间定位,并识别出每个目标的实时动作类别。在工业场景中,打手机动作识别具有深刻的意义,可以帮助企业和工厂推进数字化生产、智能化转型,例如对电话客服的工作时长进行统计评估;对工业园区中的打电话行为进行实时告警等。
2、打电话动作识别面临多个难点,例如打电话动作定义模糊、动作幅度小、干扰大,导致打电话动作识别方法的识别准确率低。
技术实现思路
1、本申请实施例的主要目的在于提出一种打电话动作识别方法、装置、系统和存储介质,能够提高打电话动作识别的准确性。
2、为实现上述目的,本申请实施例提供了一种打电话动作识别方法,包括:获取包含目标人物的图像数据或视频数据;确定所述图像数据或所述视频数据中所述目标人物并标记出所述目标人物的人体关键点;根据所述人体关键点确定所述目标人物的动作是否为类打电话动作;在确定所述目标人物的动作为类打电话动作的情况下,识别所述图像数据或所述视频数据中所述目标人物是否手持电话;在识别出所述图像数据或所述视频数据中的所述目标人物手持电话时,输出所述目标人物的工作为打电话动作的识别结果。
3、为实现上述目的,本申请实施例还提供了一种打电话动作检测装置,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述的打电话动作识别方法。
4、为实现上述目的,本申请实施例还提供了一种打电话动作识别系统,包括:输入模块,所述输入模块用于获取包含目标人物的图像数据或视频数据;与所述输入模块连接的第一识别模块,所述第一识别模块用于确定所述图像数据或所述视频数据中所述目标人物,并标记出所述目标人物的人体关键点,并根据所述人体关键点确定所述目标人物的动作是否为类打电话动作;与所述第一识别模块连接的第二识别模块,所述第二识别模块用于在所述第一识别模块确定出所述目标人物的动作为类打电话动作的情况下,识别所述图像数据或所述视频数据中所述目标人物是否手持电话;与所述第二识别模块连接的输出模块,所述输出模块用于在所述第二识别模块识别出所述图像数据或所述视频数据中的所述目标人物手持电话时,输出所述目标人物的工作为打电话动作的识别结果。
5、为实现上述目的,本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述打电话动作识别方法。
6、本申请提出的打电话动作识别方法,先确定图像数据或视频数据中目标人物并标记出目标人物的人体关键点,根据目标人物的人体关键点判断目标人物的动作是否为类打电话动作,在确定目标人物的动作为类打电话动作的情况下,再进一步识别图像数据或视频数据中目标人物是否手持电话,如此,只有动作为类打电话动作且手持电话的目标人物的动作可确定为打电话动作,通过双重识别提高了打电话动作识别的准确性。
1.一种打电话动作识别方法,其特征在于,包括:
2.根据权利要求1所述的打电话动作识别方法,其特征在于,所述人体关键点至少包括所述目标人物的手部关键点和耳部关键点;
3.根据权利要求2所述的打电话动作识别方法,其特征在于,所述确定所述人体关键点中所述手部关键点和耳部关键点之间的距离,包括:
4.根据权利要求2所述的打电话动作识别方法,其特征在于,所述识别所述图像数据或所述视频数据中所述目标人物是否手持电话,包括:
5.根据权利要求4所述的打电话动作识别方法,其特征在于,所述识别所述手部区域图像确定所述目标人物是否手持电话,包括:
6.根据权利要求1所述的打电话动作识别方法,其特征在于,所述输出所述目标人物的工作为打电话动作的识别结果还包括:
7.根据权利要求1所述的打电话动作识别方法,其特征在于,在所述目标人物为多个的情况下;
8.一种打电话动作检测装置,其特征在于,包括:
9.一种打电话动作识别系统,其特征在于,包括:
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的打电话动作识别方法。