基于异构SOC舰船目标检测跟踪功耗优化方法、电子设备与流程

文档序号:33393425发布日期:2023-03-08 12:09阅读:31来源:国知局
基于异构SOC舰船目标检测跟踪功耗优化方法、电子设备与流程
基于异构soc舰船目标检测跟踪功耗优化方法、电子设备
技术领域
1.本发明涉及舰船目标检测技术领域,具体涉及一种基于异构soc舰船目标检测跟踪功耗优化方法、电子设备。


背景技术:

2.随着作战概念与作战体系的不断演变,只有全面快速掌握战场态势,才能快速做出决策形成作战优势。卫星具有全天候、看得远、看的准的特点,通过图像识别技术可以完成对舰船目标的检测与跟踪。但是由于卫星图像数据量大、卫星传输效率低、流转节点多,到达地面的目标检测软件进行检测前已经消耗了大量的时间。由此,为解决目标检测的时效性问题,可以考虑在卫星上进行实时检测、跟踪,鉴于卫星的功耗限制,需要检测设备具有高效、高可靠、低功耗的特点,传统的cpu+gpu的方式已经不能满足这一需求。
3.近年来图像检测识别与跟踪技术得到了广泛研究和应用,但在低功耗情况下设备检测准确性、连续跟踪能力仍旧不足;而检测能力提升又会导致功耗的扩大、检测时间延长的问题。


技术实现要素:

4.鉴于上述技术问题,本发明提出一种基于异构soc舰船目标检测跟踪功耗优化方法、电子设备,具有高可靠性、高效率以及低功耗的优点。
5.实现本发明目的的技术解决方案为:一种基于异构soc舰船目标检测跟踪功耗优化方法,包括以下步骤:
6.步骤s1、通过调整位元精度、神经网络层级,构造多个不同功耗的算法模型矩阵;
7.步骤s2、利用低功耗cpu采集各软件的工作状态,计算软件的功耗变化;
8.步骤s3、根据功耗变化,控制用于目标检测的fpga开启与关闭,控制用于目标跟踪的高性能cpu开启与关闭;
9.步骤s4、根据总功耗及预设功耗阈值,选择算法模型及临时控制运行中的用于目标跟踪的高性能cpu的关闭。
10.根据本发明的一个方面,在所述步骤s1中,具体包括:
11.步骤s11、在卷积神经网络上,将卷积核定点化转换;
12.步骤s12、调整位元精度;
13.步骤s13、调整神经网络层级;
14.步骤s14、在高性能gpu服务器上训练模型;
15.步骤s15、生成ip核,将ip核、模型下载至fpga进行测试,计算功耗;
16.步骤s16、重复执行调步骤s12至步骤s15,构造多个不同功耗的算法模型矩阵。
17.根据本发明的一个方面,在所述步骤s3中,具体包括:
18.步骤s301、判断软件的功耗在一段时间内是否持续小于或等于预设阈值;
19.步骤s302、目标检测软件的功耗小于或等于预设阈值时,确定目标检测软件处于
待机状态,控制fpga关闭;
20.步骤s303、目标跟踪软件的功耗小于或等于预设阈值时,确定目标跟踪软件处于待机状态,控制高性能cpu关闭。
21.根据本发明的一个方面,在所述步骤s4中,根据总功耗及预设功耗阈值,选择算法模型,具体包括:
22.步骤s401、实时计算系统的总功耗;
23.步骤s402、计算系统的总功耗与多个算法模型的功耗和,根据功耗和与预设功耗阈值,确认最佳的算法模型;
24.步骤s403、将步骤s402中确认的算法模型传输至fpga,进行目标检测。
25.根据本发明的一个方面,在所述步骤s402中,包括:
26.按照功耗和由大到小的关系依次与预设功耗阈值对比,至功耗和小于预设功耗阈值,则确认该功耗和对应的算法模型为最佳的算法模型;
27.当最小功耗和大于预设功耗阈值时,则临时控制运行中的高性能cpu的关闭,至目标检测完成后再进行目标跟踪处理。
28.根据本发明的一个方面,提供了一种电子设备,包括:至少一个低性能cpu、至少一个高性能cpu、至少一个fpga、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行如上述技术方案中任一项所述的一种基于异构soc舰船目标检测跟踪功耗优化方法。
29.根据本发明的一个方面,提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,实现如上述技术方案中任一项所述一种基于异构soc舰船目标检测跟踪功耗优化方法。
30.根据本发明的构思,提出一种基于异构soc舰船目标检测跟踪功耗优化方法、电子设备,在fpga上运行的高效检测算法,通过调整位元精度、神经网络层级,构造多个不同功耗的算法模型矩阵,在根据软件的功耗变化、总功耗及预设功耗阈值,选择检测模型,在保证高效地完成舰船目标检测的基础上,通过动态关闭、开启cpu、fpga,动态调整检测算法,来确保系统功耗与计算能力的平衡,大大降低了功耗。
31.根据本发明的一个方面,在卷积神经网络上,将卷积核定点化转换,降低fpga资源的使用,降低卷积神经网络的精度,降低为半精度,从而导致各网络层的输出减少,使其可以存储在fpga内部的存储上,有效加速推理时间,解决了在fpga上浮点数运算能力较弱的问题,设计网络规模、精确度、准确度、功耗多因素决定的算法矩阵问题。
附图说明
32.图1示意性表示根据本发明一种实施方式的基于异构soc舰船目标检测跟踪功耗优化方法的流程示意图。
具体实施方式
33.为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅为本发明的一些
实施方式,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
34.下面结合附图和具体实施方式对本发明作详细地描述,实施方式不能在此一一赘述,但本发明的实施方式并不因此限定于以下实施方式。
35.如图1所示,本发明的一种基于异构soc舰船目标检测跟踪功耗优化方法,其特征在于,包括以下步骤:
36.步骤s1、通过调整位元精度、神经网络层级,构造多个不同功耗的算法模型矩阵;
37.步骤s2、利用低功耗cpu采集各软件的工作状态,计算软件的功耗变化;
38.步骤s3、根据功耗变化,控制用于目标检测的fpga开启与关闭,控制用于目标跟踪的高性能cpu开启与关闭;
39.步骤s4、根据总功耗及预设功耗阈值,选择算法模型及临时控制运行中的用于目标跟踪的高性能cpu的关闭。
40.在该实施例中,在fpga上运行的高效检测算法,通过调整位元精度、神经网络层级,构造多个不同功耗的算法模型矩阵,在根据软件的功耗变化、总功耗及预设功耗阈值,选择检测模型,在保证高效地完成舰船目标检测的基础上,通过动态关闭、开启cpu、fpga,动态调整检测算法,来确保系统功耗与计算能力的平衡,大大降低了功耗。
41.在本发明的一个实施例中,优选地,在所述步骤s1中,具体包括:
42.步骤s11、在卷积神经网络上,将卷积核定点化转换,降低fpga资源的使用;
43.步骤s12、调整位元精度,极限可以调整为一位元,其换算系数为1,可以将浮点系数转为二值化的值;
44.步骤s13、调整神经网络层级;
45.步骤s14、在高性能gpu服务器上训练模型;
46.步骤s15、生成ip核,将ip核、模型下载至fpga进行测试,计算功耗;
47.步骤s16、重复执行调步骤s12至步骤s15,构造多个不同功耗的算法模型矩阵。
48.在该实施例中,降低卷积神经网络的精度,降低为半精度,从而导致各网络层的输出减少,使其可以存储在fpga内部的存储上,有效加速推理时间,解决了在fpga上浮点数运算能力较弱的问题,设计网络规模、精确度、准确度、功耗多因素决定的算法矩阵问题。
49.在本发明的一个实施例中,优选地,在所述步骤s3中,具体包括:
50.步骤s301、判断软件的功耗在一段时间内是否持续小于或等于预设阈值;
51.步骤s302、目标检测软件的功耗小于或等于预设阈值时,则可确定目标检测软件处于待机状态,控制fpga关闭;
52.步骤s303、目标跟踪软件的功耗小于或等于预设阈值时,则可确定目标跟踪软件处于待机状态,控制高性能cpu关闭。
53.在该实施例中,若目标检测软件处于待机状态,则关闭fpga;若目标跟踪软件处于待机状态,则关闭高性能cpu,从而降低系统功耗。
54.在本发明的一个实施例中,优选地,在所述步骤s4中,根据总功耗及预设功耗阈值,选择算法模型,具体包括:
55.步骤s401、实时计算系统的总功耗;
56.步骤s402、计算系统的总功耗与多个算法模型的功耗和,根据功耗和与预设功耗
阈值,确认最佳的算法模型;
57.步骤s403、将步骤s402中确认的算法模型传输至fpga,进行目标检测。
58.在本发明的一个实施例中,优选地,在所述步骤s402中,包括:
59.按照功耗和由大到小的关系依次与预设功耗阈值对比,至功耗和小于预设功耗阈值,则确认该功耗和对应的算法模型为最佳的算法模型;
60.当最小功耗和大于预设功耗阈值时,临时控制运行中的高性能cpu的关闭,至目标检测完成后再进行目标跟踪处理。
61.当有新检测任务达到,fpga会被唤醒,实时计算系统的总功耗,在功耗允许的情况下,从算法模型矩阵中找到最佳匹配的模型,实时下载至fpga,进行目标检测;若目标跟踪软件功耗过大,导致找不到合适的模型,则停止目标跟踪,优先进行目标检测。
62.当有新的目标跟踪需求时,高性能cpu会被唤醒,来进行目标跟踪计算。此时功耗管理服务会实时计算系统的总功耗,若功耗允许,则运行目标跟踪软件,若目标检测算法的功耗过大,导致总功耗超标,则将任务放置在队列中,关闭高性能cpu,待目标检测完成后再进行目标跟踪处理。
63.根据本发明的一个方面,提供了一种电子设备,包括:至少一个低性能cpu、至少一个高性能cpu、至少一个fpga、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行如上述技术方案中任一项的基于异构soc舰船目标检测跟踪功耗优化方法。
64.根据本发明的一个方面,提供了一种计算机可读存储介质,用于存储计算机指令,计算机指令被处理器执行时,实现如上述技术方案中任一项一种基于异构soc舰船目标检测跟踪功耗优化方法。
65.综上所述,本发明提出了一种基于异构soc舰船目标检测跟踪功耗优化方法、电子设备,在fpga上运行的高效检测算法,通过调整位元精度、神经网络层级,构造多个不同功耗的算法模型矩阵,在根据软件的功耗变化、总功耗及预设功耗阈值,选择检测模型矩阵,在保证高效地完成舰船目标检测的基础上,通过动态关闭、开启cpu、fpga,动态调整检测算法,来确保系统功耗与计算能力的平衡,大大降低了功耗。
66.此外,需要说明的是,本发明可提供为方法、装置或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
67.本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
68.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备
以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
69.还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
70.最后需要说明的是,以上所述是本发明优选实施方式,应当指出,尽管已描述了本发明优选实施例,但对于本技术领域的技术人员来说,一旦得知了本发明的基本创造性概念,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1