函数返回检测方法及装置与流程

文档序号:32889460发布日期:2023-01-12 22:45阅读:41来源:国知局
函数返回检测方法及装置与流程

1.本说明书实施例属于计算机技术领域,尤其涉及函数返回检测方法及装置。


背景技术:

2.程序的代码(如二进制代码)中通常包括很多函数,该很多函数中存在具有调用关系的函数。其中,包含针对某个函数的调用点的函数,可称为该某个函数的调用者函数。实践中,为了对程序进行性能分析,如期望能够统计一个或多个被调用的函数的执行时间等,和/或为了避免隐私泄露等,一般需要对程序进行函数返回检测。


技术实现要素:

3.本发明的目的在于提供函数返回检测方法及装置,能减小为实现函数返回检测而引起的性能开销。
4.本说明书第一方面提供一种函数返回检测方法,包括:在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,所述第二代码包括先后顺序排列的第一指令、第二指令和所述第一代码的全部指令,所述第一指令用于调用所述全部指令的首条指令,所述第二指令用于跳转到负责函数返回检测的第二函数的入口;在所述第一代码中将首条指令修改为第三指令,所述第三指令用于跳转到所述第二代码的入口。
5.本说明书第二方面提供一种函数返回检测方法,包括:在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,所述第二代码包括先后顺序排列的第一指令、第二指令、所述第一代码的部分指令和第六指令,所述部分指令包括所述第一代码的首条指令,所述第一指令用于调用该首条指令,所述第二指令用于跳转到负责函数返回检测的第二函数的入口,所述第六指令用于跳转到所述部分指令的最后一条指令在所述第一代码中的下一条指令;在所述第一代码中将首条指令修改为第三指令,所述第三指令用于跳转到所述第二代码的入口。
6.本说明书第三方面提供一种函数返回检测方法,包括:在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用所述第一函数的入口的指令,调用所述第一函数;其中,所述第一函数当前的第一代码的首条指令是改写后的第三指令,所述第二代码包括先后顺序排列的第一指令、第二指令和所述第一函数原始的第一代码中全部指令的等价代码;执行所述当前的第一代码中的所述第三指令跳转到所述第二代码的入口;执行所述第二代码中的所述第一指令调用所述等价代码的首条指令,从而执行所述等价代码;在所述等价代码执行完后,执行所述第二代码中的所述第二指令跳转到负责函数返回检测的第二函数的入口,从而执行所述第二函数。
7.本说明书第四方面提供一种函数返回检测方法,包括:在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用所述第一函数的入口的指令,调用所述第一函数;其中,所述第一函数当前的第一代码的首条指令是改写后的第三指令,所述第二代码包括先后顺序排列的第一指令、第二指令、所述第一函数原始的第一代码中部分指
令的等价代码和第六指令,所述部分指令包括所述原始的第一代码的首条指令;执行所述当前的第一代码中的所述第三指令跳转到所述第二代码的入口;执行所述第二代码中的所述第一指令调用所述等价代码的首条指令,从而执行所述等价代码;在所述等价代码执行完后,通过执行所述第二代码中的所述第六指令,跳转到所述等价代码的最后一条指令在所述当前的第一代码中的下一条指令,从而返回所述当前的第一代码继续执行;在所述当前的第一代码的最后一条指令执行完后,执行所述第二代码中的所述第二指令跳转到负责函数返回检测的第二函数的入口,从而执行所述第二函数。
8.本说明书第五方面提供一种函数返回检测装置,包括:代码生成单元,被配置成在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,所述第二代码包括先后顺序排列的第一指令、第二指令和所述第一代码的全部指令,所述第一指令用于调用所述全部指令的首条指令,所述第二指令用于跳转到负责函数返回检测的第二函数的入口;指令修改单元,被配置成在所述第一代码中将首条指令修改为第三指令,所述第三指令用于跳转到所述第二代码的入口。
9.本说明书第五方面提供一种函数返回检测装置,包括:代码生成单元,被配置成在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,所述第二代码包括先后顺序排列的第一指令、第二指令、所述第一代码的部分指令和第六指令,所述部分指令包括所述第一代码的首条指令,所述第一指令用于调用该首条指令,所述第二指令用于跳转到负责函数返回检测的第二函数的入口,所述第六指令用于跳转到所述部分指令的最后一条指令在所述第一代码中的下一条指令;指令修改单元,被配置成在所述第一代码中将首条指令修改为第三指令,所述第三指令用于跳转到所述第二代码的入口。
10.本说明书第七方面提供一种函数返回检测装置,包括:第一调用单元,被配置成在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用所述第一函数的入口的指令,调用所述第一函数;其中,所述第一函数当前的第一代码的首条指令是改写后的第三指令,所述第二代码包括先后顺序排列的第一指令、第二指令和所述第一函数原始的第一代码中全部指令的等价代码;第一跳转单元,被配置成执行所述当前的第一代码中的所述第三指令跳转到所述第二代码的入口;第二调用单元,被配置成执行所述第二代码中的所述第一指令调用所述等价代码的首条指令,从而执行所述等价代码;第二跳转单元,被配置成在所述等价代码执行完后,执行所述第二代码中的所述第二指令跳转到负责函数返回检测的第二函数的入口,从而执行所述第二函数。
11.本说明书第八方面提供一种函数返回检测装置,包括:第一调用单元,被配置成在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用所述第一函数的入口的指令,调用所述第一函数;其中,所述第一函数当前的第一代码的首条指令是改写后的第三指令,所述第二代码包括先后顺序排列的第一指令、第二指令、所述第一函数原始的第一代码中部分指令的等价代码和第六指令,所述部分指令包括所述原始的第一代码的首条指令;第一跳转单元,被配置成执行所述当前的第一代码中的所述第三指令跳转到所述第二代码的入口;第二调用单元,被配置成执行所述第二代码中的所述第一指令调用所述等价代码的首条指令,从而执行所述等价代码;第二跳转单元,被配置成在所述等价代码执行完后,通过执行所述第二代码中的所述第六指令,跳转到所述等价代码的最后一条指令在所述当前的第一代码中的下一条指令,从而返回所述当前的第一代码继续执行;第三
跳转单元,被配置成在所述当前的第一代码的最后一条指令执行完后,执行所述第二代码中的所述第二指令跳转到负责函数返回检测的第二函数的入口,从而执行所述第二函数。
12.本说明书第九方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行如第一方面至第四方面中任一实现方式描述的方法。
13.本说明书第十方面提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现如第一方面至第四方面中任一实现方式描述的方法。
14.本说明书第十一方面提供一种计算机程序,其中,当该计算机程序在计算机中执行时,令该计算机执行如第一方面至第四方面中任一实现方式描述的方法。
15.本说明书的上述实施例提供的方案,通过构建被检测函数(前文中的第一函数)新的代码副本(前文中的第二代码),并对被检测函数原有的第一代码进行修改,能保证对未被检测的函数没有开销,而且当被检测函数执行完成后,负责函数返回检测的函数会自然获得控制权,无需利用开销较高的异常机制,从而具有很小的性能开销。
附图说明
16.为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
17.图1是本说明书实施例可以应用于其中的一个应用场景的示意图;
18.图2是本说明书实施例中的函数返回检测方法的流程图;
19.图3是本说明书实施例中的函数返回检测方法的流程图;
20.图4是本说明书实施例可以应用于其中的一个应用场景的示意图;
21.图5是本说明书实施例中的函数返回检测方法的流程图;
22.图6是本说明书实施例中的函数返回检测方法的流程图;
23.图7是本说明书实施例中的函数返回检测装置的结构示意图;
24.图8是本说明书实施例中的函数返回检测装置的结构示意图;
25.图9是本说明书实施例中的函数返回检测装置的结构示意图;
26.图10是本说明书实施例中的函数返回检测装置的结构示意图。
具体实施方式
27.为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
28.如前所述,程序的代码(如二进制代码)中通常包括很多函数,该很多函数中存在具有调用关系的函数。其中,包含针对某个函数的调用点的函数,可称为该某个函数的调用
者函数。实践中,为了对程序进行性能分析,如期望能够统计一个或多个被调用的函数的执行时间等,和/或为了避免隐私泄露等,一般需要对程序进行函数返回检测。
29.现有技术一般是通过在程序的代码中插入调试指令来实现函数返回检测。这种实现方式需要触发调试相关的异常,具有较大的性能开销。
30.为了能够减小为实现函数返回检测而引起的性能开销,本说明书实施例提供了函数返回检测方法。
31.参看图1,其是本说明书实施例可以应用于其中的一个应用场景的示意图。在图1所示的应用场景中,可以包括待检测程序的二进制代码中需要检测的函数b当前的代码(可称为第一代码),函数b新的代码副本(可称为第二代码),函数b的调用者函数a的代码,以及负责函数返回检测的函数c的代码。其中,函数b当前的第一代码,是对函数b原始的第一代码进行原地修改后的代码。函数b当前的第一代码的首条指令是改写后的指令i3。指令i3用于跳转到第二代码的入口。
32.第二代码包括先后顺序排列的指令i1、指令i2和函数b原始的第一代码中全部指令的等价代码d1。其中,指令i1用于调用等价代码d1的首条指令。指令i2用于跳转到函数c的入口。等价代码d1与该原始的第一代码中的全部指令完全相同,或者等价代码d1中的某些指令和该全部指令中对应指令内的偏移量不同。其中,该某些指令中的偏移量是修正后的偏移量。
33.调用者函数a的代码中包括用于调用函数b的入口的指令。在待检测程序的二进制代码运行过程中,可以如图1中的标号

所示,通过在调用者函数a中执行用于调用函数b的入口的指令,调用函数b。接着,可以如图1中的标号

所示,通过执行函数b当前的第一代码中的指令i3跳转到第二代码的入口。在指令i1为第二代码的首条指令的情况下,执行指令i3可以具体跳转到第二代码中的指令i1,接着可以如图1中的标号

所示,通过执行指令i1调用等价代码d1的首条指令,从而执行等价代码d1。在执行到等价代码d1的最后一条函数返回指令时,可以如图1中的标号

所示,通过执行该函数返回指令返回到指令i2。接着,可以如图1中的标号

所示,通过执行指令i2跳转到函数c的入口,从而执行函数c。在执行到函数c的最后一条函数返回指令时,可以如图1中的标号

所示,通过执行该函数返回指令返回到调用者函数a中用于调用函数b的入口的指令的下一条指令继续执行。
34.采用以上描述的函数返回检测过程,可以使得函数c自然获得控制权,无需利用开销较高的异常机制,从而具有很小的性能开销。
35.下面,先基于图1所示的应用场景,介绍针对待检测程序的二进制代码的修改过程。
36.参看图2,其是本说明书实施例中的函数返回检测方法的流程图。该方法可以由具有计算、处理能力的设备、装置或系统(如具有动态性能检测能力的系统)等执行。
37.如图2所示,首先,在步骤s201,在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,第二代码包括先后顺序排列的第一指令、第二指令和第一代码的全部指令,第一指令用于调用该全部指令的首条指令,第二指令用于跳转到负责函数返回检测的第二函数的入口。
38.其中,第一函数是需要检测的函数。下面,以第一函数为函数b,第二函数为函数c,第一指令为指令i1,第二指令为指令i2为例进行描述。
39.具体地,在步骤s201中,在待检测程序的二进制代码中,可以基于需要检测的函数b的第一代码生成第二代码。其中,此处的第一代码可以是函数b原始的第一代码,也即函数b原始的代码。第二代码可以包括先后顺序排列的指令i1、指令i2和第一代码的全部指令。指令i1用于调用该全部指令的首条指令。指令i2用于跳转到负责函数返回检测的函数c的入口。其中,指令i1可以属于call指令。指令i2可以属于jmp指令。实践中,在汇编语言中,call指令是调用指令,并且涉及对栈的操作。在执行call指令时,一般会将该call指令的下一条指令的地址压栈。而jmp指令是跳转指令,并不涉及对栈的操作。
40.在步骤s203,在第一代码中将首条指令修改为第三指令,第三指令用于跳转到第二代码的入口。
41.在生成第二代码后,可以在第一代码中将首条指令修改为指令i3(第三指令),指令i3用于跳转到第二代码的入口。其中,指令i3可以属于jmp指令。需要指出,当指令i1为第二代码的首条指令时,第二代码的入口可以是指令i1的地址。
42.在一种实施方式中,为了便于函数c获知当前是从哪个函数返回了,可以在第二代码中增添用于将第一代码的原始入口地址(也即函数b的原始入口地址)压栈的指令i4(第四指令)。基于此,第二代码还可以包括指令i4,指令i4是指令i1的上一条指令。在这种情况下,第二代码的入口可以是指令i4的地址。
43.实践中,当第二代码中排在上述全部指令之前的指令(如指令i4等)涉及压栈操作时,会导致栈顶发生变化。由于对于函数调用参数的访问都通过栈顶寄存器进行,因而当栈顶发生变化时,若要访问原来的参数,需要对偏移量进行修正。
44.因此,在一种实施方式中,在第二代码中排在上述全部指令之前的指令涉及压栈操作的情况下,当上述全部指令中存在包含对于函数调用参数的访问偏移量的指令时,在第二代码中可以对该指令中的访问偏移量进行修正。其中,当上述全部指令中包括用于调整栈顶寄存器的值的指令i5(第五指令)时,对于上述全部指令中包含相对于栈顶寄存器的内存地址访问的偏移量的指令,若该偏移量超过指令i5中对栈顶寄存器的调整值,则可以确定该偏移量是对于函数调用参数的访问偏移量。
45.在一种实施方式中,当上述全部指令中存在所采用的寻址方式为指令相对寻址的指令时,可以在第二代码中对该指令中的偏移量进行修正,以确保该指令在第二代码中能被正常执行。需要说明,该指令中所使用的偏移量和该指令的地址有关,由于该指令的位置变动了,所以需要对该指令中的偏移量进行修正。
46.图2对应的实施例提供的方案,通过构建被检测函数新的代码副本,并对被检测函数原有的第一代码进行修改,能保证对未被检测的函数没有开销,而且当被检测函数执行完成后,负责函数返回检测的函数会自然获得控制权,无需利用开销较高的异常机制,从而具有很小的性能开销。
47.在采用以上描述的代码修改过程完成对待检测程序的二进制代码的修改后,可以运行该二进制代码。下面,结合图3介绍该二进制代码运行过程中函数间的调用过程。
48.参看图3,其是本说明书实施例中的函数返回检测方法的流程图。该方法可以由具有计算、处理能力的设备、装置或系统(如具有动态性能检测能力的系统)等执行。
49.如图3所示,首先,在步骤s301,在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用第一函数的入口的指令,调用第一函数;其中,第一函数当前的
第一代码的首条指令是改写后的第三指令,第二代码包括先后顺序排列的第一指令、第二指令和第一函数原始的第一代码中全部指令的等价代码。
50.其中,调用者函数a中用于调用函数b的入口的指令,可以属于call指令。在执行该指令时,可以将该指令的下一条指令的地址压栈。这样,后续在负责函数返回检测的函数c中执行最后一条函数返回指令时,可以从栈中读取到该下一条指令的地址,从而基于该地址返回到调用者函数a中的该下一条指令继续执行。
51.在步骤s303,执行第一函数当前的第一代码中的第三指令跳转到第二代码的入口。
52.指令i3可以属于jmp指令。由于jmp指令并不涉及对栈的操作,因而在执行指令i3时,无需将指令i3的下一条指令的地址压栈。应该理解,在后续执行过程中,并不会返回到函数b当前的第一代码中的该下一条指令继续执行。
53.另外,当指令i1为第二代码的首条指令时,第二代码的入口可以是指令i1的地址,在执行完步骤s303之后,可以接着执行步骤s305。当第二代码还包括如前所述的指令i4时,指令i4为第二代码的首条指令,第二代码的入口可以是指令i4的地址,在执行完步骤s303之后,可以先通过执行第二代码中的指令i4将函数b的原始入口地址压栈,而后接着执行步骤s305。
54.在步骤s305,执行第二代码中的第一指令调用上述等价代码的首条指令,从而执行上述等价代码。
55.指令i1可以属于call指令。由于call指令涉及对栈的操作,因而在执行指令i1时,可以将指令i1的下一条指令(也即指令i2)的地址压栈。这样,在执行上述等价代码的最后一条函数返回指令时,可以从栈中读取到指令i2的地址,从而基于该地址返回到指令i2继续执行。
56.在步骤s307,在上述等价代码执行完后,执行第二代码中的第二指令跳转到负责函数返回检测的第二函数的入口,从而执行第二函数。
57.指令i2可以属于jmp指令。由于jmp指令并不涉及对栈的操作,因而在执行指令i2时,无需将指令i2的下一条指令的地址压栈。应该理解,在后续执行过程中,并不会再返回到第二代码中的该下一条指令继续执行。
58.在一种实施方式中,在第二代码包括指令i4的情况下,为了避免函数返回出现问题,函数c的代码中可以包括用于从栈顶获得函数入口地址的指令,以及用于弹掉栈顶元素的指令,并且这两个指令排在该代码的函数返回指令之前。
59.基于此,通过执行函数c的用于从栈顶获得函数入口地址的指令,可以从栈中读取到函数b的原始入口地址。通过执行函数c的用于弹掉栈顶元素的指令,可以从栈中弹出函数b的原始入口地址。这样,在执行到函数c的函数返回指令时,可以通过执行该函数返回指令,从栈中读取到调用者函数a中用于调用函数b的入口的指令的下一条指令的地址,并基于该地址正常返回到调用者函数a中的该下一条指令继续执行。
60.通过以上描述的函数间的调用过程,负责函数返回检测的函数会自然获得控制权,无需利用开销较高的异常机制,从而具有很小的性能开销。
61.以上结合图2和图3描述了图1所示应用场景下的函数返回检测方法。在图1所示的应用场景中,需要将被检测函数原始的第一代码的全部指令都复制到该被检测函数新的代
码副本中,这样会增加待检测程序的二进制代码的代码量。
62.为了进一步减小待检测程序的二进制代码的代码量,本说明书实施例还提供了另一种函数返回检测方案。在该方案中,仅需将被检测函数原始的第一代码的部分指令复制到该被检测函数新的代码副本中。该部分指令包括该原始的第一代码的首条指令。具体地,该部分指令可以均为该原始的第一代码中因原始首条指令要被改写为上述第三指令而在内存中会被覆盖的指令。下面,先结合图4介绍适用于该函数返回检测方案的应用场景。
63.参看图4,其是本说明书实施例可以应用于其中的一个应用场景的示意图。在图4所示的应用场景中,可以包括待检测程序的二进制代码中需要检测的函数b当前的代码(可称为第一代码),函数b新的代码副本(可称为第二代码),函数b的调用者函数a的代码,以及负责函数返回检测的函数c的代码。其中,函数b当前的第一代码,是对函数b原始的第一代码进行原地修改后的代码。函数b当前的第一代码的首条指令是改写后的指令i3。指令i3用于跳转到第二代码的入口。
64.第二代码包括先后顺序排列的指令i1、指令i2、函数b原始的第一代码中部分指令的等价代码d2和指令i6。其中,指令i1用于调用等价代码d2的首条指令。指令i2用于跳转到函数c的入口。指令i6用于跳转到等价代码d2的最后一条指令在函数b当前的第一代码中的下一条指令(如图4中示出的指令i7)。等价代码d2与上述部分指令完全相同,或者等价代码d2中的某些指令和上述部分指令中对应指令内的偏移量不同。其中,该某些指令中的偏移量是修正后的偏移量。
65.调用者函数a的代码中包括用于调用函数b的入口的指令。在待检测程序的二进制代码运行过程中,可以如图4中的标号

所示,通过在调用者函数a中执行用于调用函数b的入口的指令,调用函数b。接着,可以如图4中的标号

所示,通过执行函数b当前的第一代码中的指令i3跳转到第二代码的入口。在指令i1为第二代码的首条指令的情况下,执行指令i3可以具体跳转到第二代码中的指令i1,接着可以如图4中的标号

所示,通过执行指令i1调用等价代码d2的首条指令,从而执行等价代码d2。在执行完等价代码d2后,可以如图4中的标号

所示,通过执行指令i6跳转到函数b当前的第一代码中的指令i7继续执行。在执行到函数b当前的第一代码中的最后一条函数返回指令时,可以如图4中的标号

所示,通过执行该函数返回指令返回到第二代码中的指令i2。接着,可以如图4中的标号

所示,通过执行指令i2跳转到函数c的入口,从而执行函数c。在执行到函数c的最后一条函数返回指令时,可以如图4中的标号

所示,通过执行该函数返回指令返回到调用者函数a中用于调用函数b的入口的指令的下一条指令继续执行。
66.采用以上描述的函数返回检测过程,可以使得函数c自然获得控制权,无需利用开销较高的异常机制,从而具有很小的性能开销。而且,与图1所示的应用场景中的函数返回检测过程相比,能减小第二代码的代码量,从而能减小待检测程序的二进制代码的代码量。
67.下面,先基于图4所示的应用场景,介绍针对待检测程序的二进制代码的修改过程。
68.参看图5,其是本说明书实施例中的函数返回检测方法的流程图。该方法可以由具有计算、处理能力的设备、装置或系统(如具有动态性能检测能力的系统)等执行。
69.如图5所示,首先,在步骤s501,在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,第二代码包括先后顺序排列的第一指令、第二指令、第一代
码的部分指令和第六指令,该部分指令包括第一代码的首条指令,第一指令用于调用该首条指令,第二指令用于跳转到负责函数返回检测的第二函数的入口,第六指令用于跳转到该部分指令的最后一条指令在第一代码中的下一条指令。
70.其中,第一函数是需要检测的函数。下面,以第一函数为函数b,第二函数为函数c,第一指令为指令i1,第二指令为指令i2,第六指令为指令i6为例进行描述。
71.具体地,在步骤s501中,在待检测程序的二进制代码中,可以基于需要检测的函数b的第一代码生成第二代码。其中,此处的第一代码可以是函数b原始的第一代码,也即函数b原始的代码。第二代码可以包括先后顺序排列的指令i1、指令i2、第一代码的部分指令和指令i6。该部分指令包括第一代码的首条指令。指令i1用于调用该首条指令。指令i2用于跳转到负责函数返回检测的第二函数的入口。指令i6用于跳转到该部分指令的最后一条指令在第一代码中的下一条指令。指令i1可以属于call指令。指令i2和指令i6可以属于jmp指令。
72.在一种实施方式中,该部分指令可以均为第一代码中因原始首条指令要被改写为指令i3(第三指令)而在内存中会被覆盖的指令。其中,指令i3用于跳转到第二代码的入口。另外,指令i3可以属于jmp指令。
73.在步骤s503,在第一代码中将首条指令修改为第三指令,第三指令用于跳转到第二代码的入口。
74.在生成第二代码后,可以在第一代码中将首条指令修改为指令i3。需要指出,当指令i1为第二代码的首条指令时,第二代码的入口可以是指令i1的地址。
75.在一种实施方式中,为了便于函数c获知当前是从哪个函数返回了,可以在第二代码中增添用于将第一代码的原始入口地址(也即函数b的原始入口地址)压栈的指令i4(第四指令)。基于此,第二代码还可以包括指令i4,指令i4是指令i1的上一条指令。在这种情况下,第二代码的入口可以是指令i4的地址。
76.实践中,当第二代码中排在上述部分指令之前的指令(如指令i4等)涉及压栈操作时,会导致栈顶发生变化。由于对于函数调用参数的访问都通过栈顶寄存器进行,因而当栈顶发生变化时,若要访问原来的参数,需要对偏移量进行修正。
77.因此,在一种实施方式中,在第二代码中排在上述部分指令之前的指令涉及压栈操作的情况下,当上述部分指令中存在包含对于函数调用参数的访问偏移量的指令时,在第二代码中可以对该指令中的该访问偏移量进行修正。其中,当上述部分指令中包括用于调整栈顶寄存器的值的指令i5(第五指令)时,对于上述部分指令中包含相对于栈顶寄存器的内存地址访问的偏移量的指令,若该偏移量超过指令i5中对栈顶寄存器的调整值,则可以确定该偏移量是对于函数调用参数的访问偏移量。
78.另外,对于第一代码中除上述部分指令以外的任意指令,若该指令包含对于函数调用参数的访问偏移量,则在第一代码中可以对该指令中的该访问偏移量进行修正。
79.在一种实施方式中,当上述部分指令中存在所采用的寻址方式为指令相对寻址的指令时,可以在第二代码中对该指令中的偏移量进行修正,以确保该指令在第二代码中能被正常执行。
80.图5对应的实施例提供的方案,通过构建被检测函数新的代码副本,并对被检测函数原有的第一代码进行修改,能保证对未被检测的函数没有开销,而且当被检测函数执行
完成后,负责函数返回检测的函数会自然获得控制权,无需利用开销较高的异常机制,从而具有很小的性能开销。而且,与图2对应的实施例提供的方案相比,能有效减小待检测程序的二进制代码的代码量。
81.在采用图5对应的实施例描述的代码修改过程完成对待检测程序的二进制代码的修改后,可以运行该二进制代码。下面,结合图6介绍该二进制代码运行过程中函数间的调用过程。
82.参看图6,其是本说明书实施例中的函数返回检测方法的流程图。该方法可以由具有计算、处理能力的设备、装置或系统(如具有动态性能检测能力的系统)等执行。
83.如图6所示,首先,在步骤s601,在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用第一函数的入口的指令,调用第一函数;其中,第一函数当前的第一代码的首条指令是改写后的第三指令,第二代码包括先后顺序排列的第一指令、第二指令、第一函数原始的第一代码中部分指令的等价代码和第六指令,该部分指令包括原始的第一代码的首条指令。
84.在步骤s603,执行第一函数当前的第一代码中的第三指令跳转到第二代码的入口。
85.在步骤s605,执行第二代码中的第一指令调用上述等价代码的首条指令,从而执行上述等价代码。
86.关于步骤s601-s605的解释,可参考前文中的步骤s301-305的相关说明,在此不再赘述。
87.在步骤s607,在上述等价代码执行完后,通过执行第二代码中的第六指令,跳转到上述等价代码的最后一条指令在第一函数当前的第一代码中的下一条指令,从而返回第一函数当前的第一代码继续执行。
88.具体地,在上述等价代码执行完后,可以通过执行第二代码中的指令i6,跳转到上述等价代码的最后一条指令在函数b当前的第一代码中的下一条指令,从而返回函数b当前的第一代码继续执行。
89.在步骤s609,在第一函数当前的第一代码的最后一条指令执行完后,执行第二代码中的第二指令跳转到负责函数返回检测的第二函数的入口,从而执行第二函数。
90.具体地,函数b当前的第一代码的最后一条指令一般为函数返回指令。在执行到函数b当前的第一代码的该函数返回指令时,可以通过执行该函数返回指令从栈中读取到指令i2的地址,从而基于该地址返回到第二代码中的指令i2。之后,可以执行第二代码中的指令i2跳转到负责函数返回检测的函数c的入口,从而执行函数c。
91.在一种实施方式中,在第二代码包括指令i4的情况下,为了避免函数返回出现问题,函数c的代码中可以包括用于从栈顶获得函数入口地址的指令,以及用于弹掉栈顶元素的指令,并且这两个指令排在该代码的函数返回指令之前。
92.基于此,通过执行函数c的用于从栈顶获得函数入口地址的指令,可以从栈中读取到函数b的原始入口地址。通过执行函数c的用于弹掉栈顶元素的指令,可以从栈中弹出函数b的原始入口地址。这样,在执行到函数c的函数返回指令时,可以通过执行该函数返回指令,从栈中读取到调用者函数a中用于调用函数b的入口的指令的下一条指令的地址,并基于该地址正常返回到调用者函数a中的该下一条指令继续执行。
93.通过以上描述的函数间的调用过程,负责函数返回检测的函数会自然获得控制权,无需利用开销较高的异常机制,从而具有很小的性能开销。而且,与图3对应的实施例提供的方案相比,能有效减小待检测程序的二进制代码的代码量。
94.需要说明,前文中描述的函数返回检测方法可适用于区块链上的智能合约检测。例如,可针对智能合约里面的函数进行函数返回检测。
95.图7是本说明书实施例中的函数返回检测装置的结构示意图。该装置可以应用于具有计算、处理能力的设备或系统(如具有动态性能检测能力的系统)等。
96.如图7所示,本说明书实施例中的函数返回检测装置700可以包括:代码生成单元701和指令修改单元702。其中,代码生成单元701被配置成在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,第二代码包括先后顺序排列的第一指令、第二指令和第一代码的全部指令,第一指令用于调用该全部指令的首条指令,第二指令用于跳转到负责函数返回检测的第二函数的入口;指令修改单元702被配置成在第一代码中将首条指令修改为第三指令,第三指令用于跳转到第二代码的入口。
97.在一些实施例中,第二代码还包括第四指令,第四指令是第一指令的上一条指令,用于将第一代码的原始入口地址压栈。
98.在一些实施例中,指令修改单元702还可以被配置成:当上述全部指令中存在包含对于函数调用参数的访问偏移量的指令时,在第二代码中对该指令中的该访问偏移量进行修正。
99.在一些实施例中,上述全部指令中包括第五指令,第五指令用于调整栈顶寄存器的值;以及指令修改单元702还可以被配置成:对于上述全部指令中包含相对于栈顶寄存器的内存地址访问的偏移量的指令,若该偏移量超过第五指令中对栈顶寄存器的调整值,则确定该偏移量是对于函数调用参数的访问偏移量。
100.在一些实施例中,指令修改单元702还可以被配置成:当上述全部指令中存在所采用的寻址方式为指令相对寻址的指令时,在第二代码中对该指令中的偏移量进行修正。
101.在一些实施例中,第一指令属于call指令,第二指令和第三指令属于jmp指令。
102.图8是本说明书实施例中的函数返回检测装置的结构示意图。该装置可以应用于具有计算、处理能力的设备或系统(如具有动态性能检测能力的系统)等。
103.如图8所示,本说明书实施例中的函数返回检测装置800可以包括:代码生成单元801和指令修改单元802。其中,代码生成单元801被配置成在待检测程序的二进制代码中,基于被调用的第一函数的第一代码生成第二代码,第二代码包括先后顺序排列的第一指令、第二指令、第一代码的部分指令和第六指令,该部分指令包括第一代码的首条指令,第一指令用于调用该首条指令,第二指令用于跳转到负责函数返回检测的第二函数的入口,第六指令用于跳转到该部分指令的最后一条指令在第一代码中的下一条指令;指令修改单元802被配置成在第一代码中将首条指令修改为第三指令,第三指令用于跳转到第二代码的入口。
104.在一些实施例中,第二代码还包括第四指令,第四指令是第一指令的上一条指令,用于将第一代码的原始入口地址压栈。
105.在一些实施例中,指令修改单元802还可以被配置成:当上述部分指令中存在包含对于函数调用参数的访问偏移量的指令时,在第二代码中对该指令中的该访问偏移量进行
修正。
106.在一些实施例中,上述部分指令中包括第五指令,第五指令用于调整栈顶寄存器的值;以及指令修改单元802还可以被配置成:对于上述部分指令中包含相对于栈顶寄存器的内存地址访问的偏移量的指令,若该偏移量超过第五指令中对栈顶寄存器的调整值,则确定该偏移量是对于函数调用参数的访问偏移量。
107.在一些实施例中,指令修改单元802还可以被配置成:对于第一代码中除上述部分指令以外的任意指令,若该指令包含对于函数调用参数的访问偏移量,则在第一代码中对该指令中的该访问偏移量进行修正。
108.在一些实施例中,指令修改单元802还可以被配置成:当上述部分指令中存在所采用的寻址方式为指令相对寻址的指令时,在第二代码中对该指令中的偏移量进行修正。
109.在一些实施例中,上述部分指令均为第一代码中因原始首条指令要被改写为第三指令而在内存中会被覆盖的指令。
110.在一些实施例中,第一指令属于call指令,第二指令、第三指令和第六指令属于jmp指令。
111.图9是本说明书实施例中的函数返回检测装置的结构示意图。该装置可以应用于具有计算、处理能力的设备或系统(如具有动态性能检测能力的系统)等。
112.如图9所示,本说明书实施例中的函数返回检测装置900可以包括:第一调用单元901、第一跳转单元902、第二调用单元903和第二跳转单元904。其中,第一调用单元901被配置成在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用第一函数的入口的指令,调用第一函数;其中,第一函数当前的第一代码的首条指令是改写后的第三指令,第二代码包括先后顺序排列的第一指令、第二指令和第一函数原始的第一代码中全部指令的等价代码;第一跳转单元902被配置成执行该当前的第一代码中的第三指令跳转到第二代码的入口;第二调用单元903被配置成执行第二代码中的第一指令调用该等价代码的首条指令,从而执行该等价代码;第二跳转单元904被配置成在该等价代码执行完后,执行第二代码中的第二指令跳转到负责函数返回检测的第二函数的入口,从而执行第二函数。
113.在一些实施例中,第二代码还包括第四指令,第四指令是第一指令的上一条指令,用于将第一代码的原始入口地址压栈;以及上述装置900还可以包括:地址压栈单元(图中未示出),被配置成在第二调用单元903执行第二代码中的第一指令调用上述等价代码的首条指令之前,执行第二代码中的第四指令将第一代码的原始入口地址压栈。
114.图10是本说明书实施例中的函数返回检测装置的结构示意图。该装置可以应用于具有计算、处理能力的设备或系统(如具有动态性能检测能力的系统)等。
115.如图10所示,本说明书实施例中的函数返回检测装置1000可以包括:第一调用单元1001、第一跳转单元1002、第二调用单元1003、第二跳转单元1004和第三跳转单元1005。其中,第一调用单元1001被配置成在待检测程序的二进制代码中,通过在第一函数的调用者函数中执行用于调用第一函数的入口的指令,调用第一函数;其中,第一函数当前的第一代码的首条指令是改写后的第三指令,第二代码包括先后顺序排列的第一指令、第二指令、第一函数原始的第一代码中部分指令的等价代码和第六指令,该部分指令包括该原始的第一代码的首条指令;第一跳转单元1002被配置成执行该当前的第一代码中的第三指令跳转
到第二代码的入口;第二调用单元1003被配置成执行第二代码中的第一指令调用该等价代码的首条指令,从而执行该等价代码;第二跳转单元1004被配置成在该等价代码执行完后,通过执行第二代码中的第六指令,跳转到该等价代码的最后一条指令在该当前的第一代码中的下一条指令,从而返回该当前的第一代码继续执行;第三跳转单元1005被配置成在该当前的第一代码的最后一条指令执行完后,执行第二代码中的第二指令跳转到负责函数返回检测的第二函数的入口,从而执行第二函数。
116.在一些实施例中,第二代码还包括第四指令,第四指令是第一指令的上一条指令,用于将第一代码的原始入口地址压栈;以及上述装置1000还可以包括:地址压栈单元(图中未示出),被配置成在第二调用单元1003执行第二代码中的第一指令调用上述等价代码的首条指令之前,执行第二代码中的第四指令将第一代码的原始入口地址压栈。
117.在图7-图10分别对应的装置实施例中,关于各单元的进一步解释,可参考前文中相关方法实施例中的相关说明,在此不再赘述。
118.本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,当该计算机程序在计算机中执行时,令计算机执行以上方法实施例描述的函数返回检测方法。
119.本说明书实施例还提供了一种计算设备,包括存储器和处理器,其中,该存储器中存储有可执行代码,该处理器执行该可执行代码时,实现以上方法实施例描述的函数返回检测方法。
120.本说明书实施例还提供了一种计算机程序,其中,当该计算机程序在计算机中执行时,令计算机执行以上方法实施例描述的函数返回检测方法。
121.在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(field programmable gate array,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardware description language,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advanced boolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardware description language)等,目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
122.控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
123.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为服务器系统。当然,本技术不排除随着未来计算机技术的发展,实现上述实施例功能的计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
124.虽然本说明书一个或多个实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。例如若使用到第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
125.为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
126.本发明是参照根据本发明实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实
现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
127.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
128.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
129.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
130.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
131.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储、石墨烯存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
132.本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
133.本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
134.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料
或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
135.以上所述仅为本说明书一个或多个实施例的实施例而已,并不用于限制本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1