本申请涉及计算机,尤其涉及一种数据对齐方法及装置。
背景技术:
1、云控平台可以接收多个数据通道传输的不同类型的结构化数据和非结构化数据,其中,结构化数据由数字和值组成,非结构化数据由传感器、文本文件、音频和视频文件等组成,需要对多个数据通道传输的数据进行对齐处理,以便提高后续处理的有效性。
2、现有技术中,采用人工对齐的方式进行数据对齐,需要耗费大量人力资源,工作效率较低,同时由于是根据人工固定规则的时间进行数据对齐,数据对齐的准确性也较差。
3、因此,如何提高数据对齐的效率和准确性,成为了亟待解决的技术问题。
技术实现思路
1、本说明书实施例提供一种数据对齐方法及装置,以解决现有技术中数据对齐方法存在的效率低以及准确性差的问题。
2、为解决上述技术问题,本说明书实施例是这样实现的:
3、第一方面,本说明书实施例提供的一种数据对齐方法,包括:
4、获取第一数据通道传输的第一数据和第二数据通道传输的第二数据;
5、将所述第一数据和所述第二数据按照预设数据帧划分成若干个数据单元,得到第一数据序列和第二数据序列;
6、计算所述第一数据序列中各个数据单元和所述第二数据序列中各个数据单元之间的相似度;
7、将各个数据单元中相似度大于预设阈值的数据单元作为目标数据单元;
8、将所述第一数据序列中的目标数据单元和所述第二数据序列中的目标数据单元对齐;
9、基于对齐后的所述第一数据序列中的目标数据单元和对齐后的所述第二数据序列中的目标数据单元,对所述第一数据和所述第二数据进行对齐。
10、第二方面,本说明书实施例提供的一种数据对齐装置,包括:
11、数据获取模块,用于获取第一数据通道传输的第一数据和第二数据通道传输的第二数据;
12、数据划分模块,将第一数据和第二数据按照预设数据帧划分成若干个数据单元,得到第一数据序列和第二数据序列;
13、相似度计算模块,用于计算第一数据序列中各个数据单元和第二数据序列中各个数据单元之间的相似度;
14、目标数据单元确定模块,用于将相似度大于预设阈值的数据单元作为目标数据单元;
15、目标数据单元对齐模块,用于将所述第一数据序列中的目标数据单元和所述第二数据序列中的目标数据单元对齐;
16、数据对齐模块,用于基于对齐后的所述第一数据序列中的目标数据单元和对齐后的所述第二数据序列中的目标数据单元,对所述第一数据和所述第二数据进行对齐。
17、本说明书一个实施例实现了能够达到以下有益效果:获取第一数据通道传输的第一数据和第二数据通道传输的第二数据;将所述第一数据和所述第二数据按照预设数据帧划分成若干个数据单元,得到第一数据序列和第二数据序列;计算所述第一数据序列中各个数据单元和所述第二数据序列中各个数据单元之间的相似度;将各个数据单元中相似度大于预设阈值的数据单元作为目标数据单元;将所述第一数据序列中的目标数据单元和所述第二数据序列中的目标数据单元对齐;基于对齐后的所述第一数据序列中的目标数据单元和对齐后的所述第二数据序列中的目标数据单元,对所述第一数据和所述第二数据进行对齐。本申请通过相似度确定目标数据单元,通过目标数据单元将数据进行对齐,从而提高数据对齐的效率和准确性。
1.一种数据对齐方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,将所述第一数据序列中的目标数据单元和所述第二数据序列中的目标数据单元对齐,具体包括:
3.根据权利要求1所述的方法,其特征在于,将所述第一数据序列中的目标数据单元和所述第二数据序列中的目标数据单元对齐,具体包括:
4.根据权利要求1所述的方法,其特征在于,将所述第一数据序列中的目标数据单元和所述第二数据序列中的目标数据单元对齐,具体包括:
5.根据权利要求1所述的方法,其特征在于,所述计算所述第一数据序列中各个数据单元和所述第二数据序列中各个数据单元之间的相似度,具体包括:
6.根据权利要求1所述的方法,其特征在于,所述将各个数据单元中相似度大于预设阈值的数据单元作为目标数据单元,具体包括:
7.根据权利要求6所述的方法,其特征在于,所述方法包括:
8.根据权利要求7所述的方法,其特征在于,所述方法,包括:
9.根据权利要求1所述的方法,其特征在于,所述第一数据通道包括车辆、路侧感知设备、交通指示灯设备中的至少一种设备的传输数据的通道;
10.一种数据对齐装置,其特征在于,包括: