一种数据采集方法、系统、电子设备及存储介质与流程

文档序号:31724009发布日期:2022-10-05 00:04阅读:59来源:国知局
一种数据采集方法、系统、电子设备及存储介质与流程

1.本技术涉及数据处理技术领域,具体涉及一种数据采集方法、系统、电子设备及存储介质。


背景技术:

2.针对车载终端,当前数据采集大多是app(application,应用程序,简称app)接入sdk(software development kit,软件开发工具包,简称sdk)来实现数据采集,然后进行http(hyper text transfer protocol,超文本传输协议,简称http)上传等。在数据采集时,涉及到的app少则几个,多的会高达数十个,并且每个app涉及到的功能也是成倍的增加,并且不断有新需求,新的app加入。每一次新需求,新app的增加,在该基础上都会增加新的数据采集,研发人员会再次的接入sdk实现该功能。
3.在数据埋点的基础上,目前部分文献可以利用远程指令下发数据来实现需要的数据采集,但是,该部分文献并未解决埋点复杂的问题,基于此,有必要提出一种全新的数据采集技术。


技术实现要素:

4.鉴于以上所述现有技术的缺点,本技术提供一种数据采集方法、系统、电子设备及存储介质,以解决上述技术问题。
5.本技术提供一种数据采集方法,所述方法包括以下步骤:
6.获取预先或实时确定的多个应用程序,其中,每个应用程序的业务与其他应用程序的业务之间彼此独立;
7.根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;
8.基于预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。
9.于本技术的一实施例中,根据数据采集中间件服务独立采集每个应用程序的业务数据的过程包括:
10.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间件服务;
11.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的类文件;
12.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述类文件转换为可执行文件,并在所述类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
13.于本技术的一实施例中,根据数据采集中间件服务独立采集每个应用程序的业务数据的过程包括:
14.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间
件服务;
15.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的第一类文件,以及利用数据采集工具直接在所述第一类文件中植入数据,形成第二类文件;
16.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述第二类文件转换为可执行文件,并在所述第二类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
17.于本技术的一实施例中,所述预设的计算机代码包括java代码,所述类文件包括class文件,所述可执行文件包括dex文件,所述编译工具包括android编译工具,所述链接工具包括android链接工具。
18.于本技术的一实施例中,所述预设的计算机代码包括java代码,所述第一类文件和所述第二类文件包括class文件,所述可执行文件包括dex文件,所述编译工具包括android编译工具,所述链接工具包括android链接工具,所述数据采集工具包括asm插桩。
19.本技术还提供一种数据采集系统,所述系统包括有:
20.应用程序模块,用于预先或实时确定需要进行数据采集的多个应用程序,其中,每个应用程序的业务与其他应用程序的业务之间彼此独立;
21.数据采集模块,用于根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;
22.数据上传模块,用于根据预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。
23.于本技术的一实施例中,根据数据采集中间件服务独立采集每个应用程序的业务数据的过程包括:
24.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间件服务;
25.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的类文件;
26.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述类文件转换为可执行文件,并在所述类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
27.于本技术的一实施例中,根据数据采集中间件服务独立采集每个应用程序的业务数据的过程包括:
28.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间件服务;
29.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的第一类文件,以及利用数据采集工具直接在所述第一类文件中植入数据,形成第二类文件;
30.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述第二类文件转换为可执行文件,并在所述第二类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
31.本技术还提供一种电子设备,所述电子设备包括:
32.一个或多个处理器;
33.存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个
处理器执行时,使得所述电子设备实现如上述中任一项所述的数据采集方法。
34.本技术还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行如上述中任一项所述的数据采集方法。
35.如上所述,本技术提供一种数据采集方法、系统、电子设备及存储介质,具有以下有益效果:
36.本技术首先获取预先或实时确定的多个应用程序,根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;基于预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。由此可知,本技术可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,不仅减少数据采集的工作量,而且还提高数据采集效率,基本实现一劳永逸的数据采集效果。
37.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
38.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
39.图1为应用本技术中一个或多个实施例中技术方案的示例性系统架构的示意图;
40.图2为本技术中一实施例提供的数据采集方法的流程示意图;
41.图3为本技术中一实施例提供的字节码转换流程示意图;
42.图4为本技术中另一实施例提供的字节码转换流程示意图;
43.图5为本技术中另一实施例提供的数据采集方法的流程示意图;
44.图6为本技术中一实施例提供的数据采集系统的硬件结构示意图;
45.图7为适用于实现本技术中一个或多个实施例的电子设备的硬件结构示意图。
具体实施方式
46.以下将参照附图和优选实施例来说明本技术的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本技术的其他优点与功效。本技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本技术的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本技术,而不是为了限制本技术的保护范围。
47.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本技术的基本构想,遂图式中仅显示与本技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
48.在下文描述中,探讨了大量细节,以提供对本技术实施例的更透彻的解释,然而,对本领域技术人员来说,可以在没有这些具体细节的情况下实施本技术的实施例是显而易
见的,在其他实施例中,以方框图的形式而不是以细节的形式来示出公知的结构和设备,以避免使本技术的实施例难以理解。
49.java,是一门面向对象的计算机编程语言。
50.header,简称标头,是服务器以http(hyper text transfer protocol,超文本传输协议,简称http)协议传html(hyper text markup language,超文本标记语言,简称html)资料到浏览器前所送出的字串,在标头与html文件之间尚需空一行分隔。
51.asm,是一个java字节码操控框架。它能被用来动态生成类或者增强既有类的功能。asm可以直接产生二进制class文件,也可以在类被加载入java虚拟机之前动态改变类行为。
52.图1示出了一种可以应用本技术中一个或多个实施例中技术方案的示例性系统架构的示意图。如图1所示,系统架构100可以包括终端设备110、网络120和服务器130。终端设备110可以包括智能手机、平板电脑、笔记本电脑、台式电脑等各种电子设备。服务器130可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。网络120可以是能够在终端设备110和服务器130之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路或者无线通信链路。
53.根据实现需要,本技术实施例中的系统架构可以具有任意数目的终端设备、网络和服务器。例如,服务器130可以是由多个服务器设备组成的服务器群组。另外,本技术实施例提供的技术方案可以应用于终端设备110,也可以应用于服务器130,或者可以由终端设备110和服务器130共同实施,本技术对此不做特殊限定。
54.在本技术的一个实施例中,本技术的终端设备110或服务器130可以首先获取预先或实时确定的多个应用程序,根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;基于预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。利用终端设备110或服务器130执行数据采集方法,可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,不仅减少数据采集的工作量,而且还提高数据采集效率,基本实现一劳永逸的数据采集效果。
55.以上部分介绍了应用本技术技术方案的示例性系统架构的内容,接下来继续介绍本技术的数据采集方法。
56.图2示出了本技术一实施例提供的数据采集方法流程示意图。具体地,在一示例性实施例中,如图2所示,本实施例提供一种数据采集方法,该方法包括以下步骤:
57.s210,获取预先或实时确定的多个应用程序,其中,每个应用程序的业务与其他应用程序的业务之间彼此独立;
58.s220,根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;
59.s230,基于预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。
60.由此可知,本实施例可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,不仅减少数据采集的工作量,而且还提高数据采集效率,基本实现一劳永逸的数据采集效果。
61.根据上述记载,在一示例性实施例中,步骤s220根据数据采集中间件服务独立采集每个应用程序的业务数据的过程包括:
62.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间件服务;
63.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的类文件;
64.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述类文件转换为可执行文件,并在所述类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
65.在本实施例中,所述预设的计算机代码包括java代码,所述类文件包括class文件,所述可执行文件包括dex文件,所述编译工具包括android编译工具,所述链接工具包括android链接工具。具体地,如图3所示,本实施例首先将java source code(或者java源代码)以.java为后缀进行呈现,即可以将java source code以“.java file”为后缀进行呈现,作为数据采集中间件服务。再利用android编译工具或者其它编译工具,将以“.java file”为后缀呈现的源代码转换为类文件,即将“.java file”为后缀呈现的源代码转换为class文件。其中,转换后的class文件包含常量池、逻辑等。作为示例,如图3所示,转换后的class文件可以包括常量池constant pool、类文件信息class info和数据data。同时,android系统自身的android链接工具会将class文件转换为可执行文件,即可以利用与android编译工具关联的android链接工具将class文件转换为.dex文件;并在class文件的基础上合并部分重复数据。其中,合并部分重复数据后的可执行文件或.dex文件同样包括各种常量池、data、逻辑,以及会增加标头数据或header数据等。作为示例,如图3所示,合并部分重复数据后的可执行文件或.dex文件可以包括header(标头)、常量池constant pool、类文件定义class1 definition、类文件定义class2 definition和数据data。
66.根据上述记载,在另一示例性实施例中,步骤s220根据数据采集中间件服务独立采集每个应用程序的业务数据的过程还可以包括:
67.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间件服务;
68.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的第一类文件,以及利用数据采集工具直接在所述第一类文件中植入数据,形成第二类文件;
69.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述第二类文件转换为可执行文件,并在所述第二类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
70.在本实施例中,所述预设的计算机代码包括java代码,所述第一类文件和所述第二类文件包括class文件,所述可执行文件包括dex文件,所述编译工具包括android编译工具,所述链接工具包括android链接工具,所述数据采集工具包括asm插桩。具体地,如图4所示,本实施例首先将java source code(或者java源代码)以.java为后缀进行呈现,即可以将java source code以“.java file”为后缀进行呈现,作为数据采集中间件服务。再利用android编译工具或者其它编译工具,将以“.java file”为后缀呈现的源代码转换为类文件,即将“.java file”为后缀呈现的源代码转换为class文件。并且,在此阶段,数据采集工具可直接植入数据在class文件中,和java源码差异即是自动化插入的数据采集工具逻辑。
即在此阶段,可以采用asm插桩等作为数据采集工具,直接植入数据在class文件中,得到新的class文件。本实施例可以将未植入数据的class文件记为第一类文件,植入数据后的class文件记为第二类文件。其中,转换后的class文件包含常量池、逻辑等。作为示例,如图4所示,转换后的class文件可以包括常量池constant pool、类文件信息class info和数据data。同时,android系统自身的android链接工具会将class文件转换为可执行文件,即可以利用与android编译工具关联的android链接工具将class文件转换为.dex文件;并在class文件的基础上合并部分重复数据。其中,合并部分重复数据后的可执行文件或.dex文件同样包括各种常量池、data、逻辑,以及会增加标头数据或header数据等。作为示例,如图4所示,合并部分重复数据后的可执行文件或.dex文件可以包括header(标头)、常量池constant pool、类文件定义class1 definition、类文件定义class2definition和数据data。
71.如图5所示,本技术还提供一实施例,该实施例提供一种基于java字节码插桩方式实现数据采集的方法,该方法包括以下步骤:
72.步骤1:首先获取各个应用业务独立的应用程序app(application,应用程序,简称app);
73.步骤2:再利用数据采集中间件独立采集各个应用程序app的业务数据;
74.步骤3:将采集的所有业务数据汇总至数据库db中;
75.步骤4:将数据库db中汇总的业务数据按照预先或实时设置的数据统一规则上传server(服务器)端。
76.作为一示例,如图3所示,本实施例首先将各个app源码以.java为后缀呈现(研发人员可以独立,无需关注数据采集逻辑);然后利用android编译工具或者其它编译工具执行的时候会转换为class文件,包括常量池,逻辑等;再基于android自身的android链接工具将class文件转换为.dex文件,并在class文件的基础上合并部分重复数据,使得合并重复数据后的.dex文件同样包括各种常量池,data,逻辑,以及会新增加header数据等。作为另一示例,如图4所示,本实施例首先将各个app源码以.java为后缀呈现;然后利用android编译工具或者其它编译工具执行的时候会转换为class文件,包括常量池,逻辑等。同时在该阶段,基于asm插桩形成的数据采集工具等可直接植入数据在class文件中,和java源码差异即是自动化插入的数据采集工具逻辑。再基于android自身的android链接工具将class文件转换为.dex文件,并在class文件的基础上合并部分重复数据,使得合并重复数据后的.dex文件同样包括各种常量池,data,逻辑,会新增加header数据等,该部逻辑和字节码转换流程无差异,多了一些数据采集数据即可。
77.由此可知,本实施例提供一种基于java字节码插桩方式实现数据采集的技术方式,能够使用与所有用java实现的软件的数据采集,以便在高效率,高性能的实现数据采集。本实施例提供的一种基于java字节码插桩的数据采集方式,涉及java源代码,class文件,dex文件等。研发人员正常开发业务功能(逻辑层,app业务服务),java字节码插桩可以独立于当前的业务代码(数据采集中间件服务),和app业务服务单项交互,字节码插入工具基于数据采集中间件和app业务服务之间,可以实现无缝的代码植入,为字节码插桩的实际执行方。当研发人员开发完成业务代码以后,通过android工具编译,数据采集工具在编译的过程中会在class代码中植入任何需要的代码,包括采集格式数据等。收集的数据可以统
一存储数据库或文件中,业务规定时间通过http上传服务器即可,即可统一的实现数据的采集。所以,本实施例可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,减少数据采集的工作量,提高数据采集效率,基本实现一劳永逸的数据采集效果。
78.综上所述,本技术提供一种数据采集方法,首先获取预先或实时确定的多个应用程序,根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;基于预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。由此可知,本方法可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,不仅减少数据采集的工作量,而且还提高数据采集效率,基本实现一劳永逸的数据采集效果。研发人员正常开发业务功能(逻辑层,app业务服务),java字节码插桩可以独立于当前的业务代码(数据采集中间件服务),和app业务服务单项交互,字节码插入工具基于数据采集中间件和app业务服务之间,可以实现无缝的代码植入,为字节码插桩的实际执行方。当研发人员开发完成业务代码以后,通过android工具编译,数据采集工具在编译的过程中会在class代码中植入任何需要的代码,包括采集格式数据等。收集的数据可以统一存储数据库或文件中,业务规定时间通过http上传服务器即可,即可统一的实现数据的采集。所以,本方法可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,减少数据采集的工作量,提高数据采集效率,基本实现一劳永逸的数据采集效果。
79.如图6所示,本技术还提供一种数据采集系统,所述系统包括有:
80.应用程序模块610,用于预先或实时确定需要进行数据采集的多个应用程序,其中,每个应用程序的业务与其他应用程序的业务之间彼此独立;
81.数据采集模块620,用于根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;
82.数据上传模块630,用于根据预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。
83.由此可知,本实施例可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,不仅减少数据采集的工作量,而且还提高数据采集效率,基本实现一劳永逸的数据采集效果。
84.根据上述记载,在一示例性实施例中,数据采集模块620根据数据采集中间件服务独立采集每个应用程序的业务数据的过程包括:
85.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间件服务;
86.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的类文件;
87.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述类文件转换为可执行文件,并在所述类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
88.在本实施例中,所述预设的计算机代码包括java代码,所述类文件包括class文件,所述可执行文件包括dex文件,所述编译工具包括android编译工具,所述链接工具包括android链接工具。具体地,如图3所示,本实施例首先将java source code(或者java源代
码)以.java为后缀进行呈现,即可以将java source code以“.java file”为后缀进行呈现,作为数据采集中间件服务。再利用android编译工具或者其它编译工具,将以“.java file”为后缀呈现的源代码转换为类文件,即将“.java file”为后缀呈现的源代码转换为class文件。其中,转换后的class文件包含常量池、逻辑等。作为示例,如图3所示,转换后的class文件可以包括常量池constant pool、类文件信息class info和数据data。同时,android系统自身的android链接工具会将class文件转换为可执行文件,即可以利用与android编译工具关联的android链接工具将class文件转换为.dex文件;并在class文件的基础上合并部分重复数据。其中,合并部分重复数据后的可执行文件或.dex文件同样包括各种常量池、data、逻辑,以及会增加标头数据或header数据等。作为示例,如图3所示,合并部分重复数据后的可执行文件或.dex文件可以包括header(标头)、常量池constant pool、类文件定义class1 definition、类文件定义class2 definition和数据data。
89.根据上述记载,在另一示例性实施例中,数据采集模块620根据数据采集中间件服务独立采集每个应用程序的业务数据的过程包括:
90.将每个应用程序的源码以预设的计算机代码为后缀进行呈现,作为数据采集中间件服务;
91.利用编译工具将呈现出的源码转换为包含常量池和逻辑类的第一类文件,以及利用数据采集工具直接在所述第一类文件中植入数据,形成第二类文件;
92.选择与所述编译工具关联的链接工具,并基于选择出的链接工具将所述第二类文件转换为可执行文件,并在所述第二类文件的基础上合并部分重复数据,以使采集的业务数据包括常量池、逻辑和标头数据。
93.在本实施例中,所述预设的计算机代码包括java代码,所述第一类文件和所述第二类文件包括class文件,所述可执行文件包括dex文件,所述编译工具包括android编译工具,所述链接工具包括android链接工具,所述数据采集工具包括asm插桩。具体地,如图4所示,本实施例首先将java source code(或者java源代码)以.java为后缀进行呈现,即可以将java source code以“.java file”为后缀进行呈现,作为数据采集中间件服务。再利用android编译工具或者其它编译工具,将以“.java file”为后缀呈现的源代码转换为类文件,即将“.java file”为后缀呈现的源代码转换为class文件。并且,在此阶段,数据采集工具可直接植入数据在class文件中,和java源码差异即是自动化插入的数据采集工具逻辑。即在此阶段,可以采用asm插桩等作为数据采集工具,直接植入数据在class文件中,得到新的class文件。本实施例可以将未植入数据的class文件记为第一类文件,植入数据后的class文件记为第二类文件。其中,转换后的class文件包含常量池、逻辑等。作为示例,如图4所示,转换后的class文件可以包括常量池constant pool、类文件信息class info和数据data。同时,android系统自身的android链接工具会将class文件转换为可执行文件,即可以利用与android编译工具关联的android链接工具将class文件转换为.dex文件;并在class文件的基础上合并部分重复数据。其中,合并部分重复数据后的可执行文件或.dex文件同样包括各种常量池、data、逻辑,以及会增加标头数据或header数据等。作为示例,如图4所示,合并部分重复数据后的可执行文件或.dex文件可以包括header(标头)、常量池constant pool、类文件定义class1 definition、类文件定义class2definition和数据data。
94.本技术还提供一实施例,该实施例提供一种基于java字节码插桩方式实现数据采集的系统,该系统用于执行以下步骤:
95.步骤1:首先获取各个应用业务独立的应用程序app(application,应用程序,简称app);
96.步骤2:再利用数据采集中间件独立采集各个应用程序app的业务数据;
97.步骤3:将采集的所有业务数据汇总至数据库db中;
98.步骤4:将数据库db中汇总的业务数据按照预先或实时设置的数据统一规则上传server(服务器)端。
99.作为一示例,如图3所示,本实施例首先将各个app源码以.java为后缀呈现(研发人员可以独立,无需关注数据采集逻辑);然后利用android编译工具或者其它编译工具执行的时候会转换为class文件,包括常量池,逻辑等;再基于android自身的android链接工具将class文件转换为.dex文件,并在class文件的基础上合并部分重复数据,使得合并重复数据后的.dex文件同样包括各种常量池,data,逻辑,以及会新增加header数据等。作为另一示例,如图4所示,本实施例首先将各个app源码以.java为后缀呈现;然后利用android编译工具或者其它编译工具执行的时候会转换为class文件,包括常量池,逻辑等。同时在该阶段,基于asm插桩形成的数据采集工具等可直接植入数据在class文件中,和java源码差异即是自动化插入的数据采集工具逻辑。再基于android自身的android链接工具将class文件转换为.dex文件,并在class文件的基础上合并部分重复数据,使得合并重复数据后的.dex文件同样包括各种常量池,data,逻辑,会新增加header数据等,该部逻辑和字节码转换流程无差异,多了一些数据采集数据即可。
100.由此可知,本实施例提供一种基于java字节码插桩方式实现数据采集的技术方式,能够使用与所有用java实现的软件的数据采集,以便在高效率,高性能的实现数据采集。本实施例提供的一种基于java字节码插桩的数据采集方式,涉及java源代码,class文件,dex文件等。研发人员正常开发业务功能(逻辑层,app业务服务),java字节码插桩可以独立于当前的业务代码(数据采集中间件服务),和app业务服务单项交互,字节码插入工具基于数据采集中间件和app业务服务之间,可以实现无缝的代码植入,为字节码插桩的实际执行方。当研发人员开发完成业务代码以后,通过android工具编译,数据采集工具在编译的过程中会在class代码中植入任何需要的代码,包括采集格式数据等。收集的数据可以统一存储数据库或文件中,业务规定时间通过http上传服务器即可,即可统一的实现数据的采集。所以,本实施例可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,减少数据采集的工作量,提高数据采集效率,基本实现一劳永逸的数据采集效果。
101.综上所述,本技术提供一种数据采集系统,首先获取预先或实时确定的多个应用程序,根据数据采集中间件服务独立采集每个应用程序的业务数据,并将采集的业务数据传输至数据库进行汇总;基于预先或实时确定的数据统一规则将所述数据库中汇总的业务数据上传至服务器端。由此可知,本系统可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,不仅减少数据采集的工作量,而且还提高数据采集效率,基本实现一劳永逸的数据采集效果。研发人员正常开发业务功能(逻辑层,app业务服务),java字节码插桩可以独立于当前的业务代码(数据采集中间件服务),和app业务服务
单项交互,字节码插入工具基于数据采集中间件和app业务服务之间,可以实现无缝的代码植入,为字节码插桩的实际执行方。当研发人员开发完成业务代码以后,通过android工具编译,数据采集工具在编译的过程中会在class代码中植入任何需要的代码,包括采集格式数据等。收集的数据可以统一存储数据库或文件中,业务规定时间通过http上传服务器即可,即可统一的实现数据的采集。所以,本系统可以在代码编译阶段直接插入数据,实现数据采集目的,极大地简化了数据采集的复杂度,减少数据采集的工作量,提高数据采集效率,基本实现一劳永逸的数据采集效果。
102.需要说明的是,上述实施例所提供数据采集系统与上述实施例所提供的数据采集方法属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。上述实施例所提供的数据采集系统在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能,本处也不对此进行限制。
103.本技术的实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现上述各个实施例中提供的数据采集方法。
104.图7示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。需要说明的是,图7示出的电子设备的计算机系统1000仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
105.如图7所示,计算机系统1000包括中央处理单元(central processing unit,cpu)1001,其可以根据存储在只读存储器(read-only memory,rom)1002中的程序或者从储存部分1008加载到随机访问存储器(random access memory,ram)1003中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在ram1003中,还存储有系统操作所需的各种程序和数据。cpu 1001、rom 1002以及ram1003通过总线1004彼此相连。输入/输出(input/output,i/o)接口1005也连接至总线1004。
106.以下部件连接至i/o接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分1007;包括硬盘等的储存部分1008;以及包括诸如lan(local area network,局域网)卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至i/o接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入储存部分1008。
107.特别地,根据本技术的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(cpu)1001执行时,执行本技术的系统中限定的各种功能。
108.需要说明的是,本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是
电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
109.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
110.描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
111.本技术的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机的处理器执行时,使计算机执行如前所述的数据采集方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
112.本技术的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的数据采集方法。
113.上述实施例仅示例性说明本技术的原理及其功效,而非用于限制本技术。任何熟悉此技术的人士皆可在不违背本技术的精神及范畴下,对上述实施例进行修饰或改变。因此,但凡所属技术领域中具有通常知识者在未脱离本技术所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本技术的权利要求所涵盖。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1