一种数据处理的方法及装置的制造方法

文档序号:9417469阅读:208来源:国知局
一种数据处理的方法及装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,特别涉及一种数据处理的方法及装置。
【背景技术】
[0002]随着信息通信技术快速发展,产生了海量的数据资源,这些数据资源被分别保存在不同的数据库中,不同的数据资源之间,一般相互之间没有关联。为了充分利用这些数据资源,需要将不同的数据资源关联起来。
[0003]现有技术中,为了建立数据资源之间的联系,一般将数据资源存储在同一个数据表中,通过同一个数据表来关联该数据表中的数据资源。例如:通过数据表中的行列将数据资源进行分类。
[0004]通过上述描述可见,现有技术中,数据资源通过存储在同一个数据表中来相关关联,但是,这种方式比较适合数据量较少的情况,当数据量很多时,将这些数据资源存储在同一个数据表中比较困难,而且不容易处理。另外,一张数据表中对数据资源的描述能力有限,只能对数据资源的少量特征进行关联,难以全面对数据资源的特征进行关联。总之,现有技术的方法关联数据的效率较低。

【发明内容】

[0005]有鉴于此,本发明提供了一种数据处理的方法及装置,能够提高关联数据的效率。
[0006]—方面,本发明提供了一种数据处理的方法,包括:预先设置多个标签,还包括:
[0007]S1:获取待处理数据对应的至少一个字符串;
[0008]S2:分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签;
[0009]S3:将所有匹配标签作为所述待处理数据的标签。
[0010]进一步地,包括:所述S2,包括:
[0011]S21:从当前字符串中提取至少一个待标识字符串,其中,每个待标识字符串由当前字符串中相邻的字符组成;
[0012]S22:将每个待标识字符串与每个标签进行匹配,获取每个待标识字符串相匹配的匹配标签;
[0013]S23:将每个待标识字符串相匹配的匹配标签作为当前字符串对应的匹配标签。
[0014]进一步地,所述S22,包括:
[0015]B1:将当前待匹配字符串两端中的任意一端作为删减端;
[0016]B2:将当前待标识字符串作为当前待匹配字符串;
[0017]B3:判断当前待匹配字符串的字符数是否小于预设值,如果是,则结束当前流程,否则,执行步骤B4;
[0018]B4:将当前待匹配字符串与所有标签进行匹配,判断是否有与当前待匹配字符串相匹配的标签,如果有,则将与当前待匹配字符串相匹配的标签作为当前待标识字符串的匹配标签,执行步骤B5,否则,执行步骤B5 ;
[0019]B5:将当前待匹配字符串的删减端的第一个字符去掉,得到删减字符串,将所述删减待标识字符串作为当前待匹配字符串,返回步骤B3。
[0020]进一步地,包括:
[0021]X为所有标签中字符个数最少的标签的字符数,Y为所有标签中字符个数最多的标签的字符数;
[0022]所述预设值包括X ;
[0023]所述S21,包括:判断当前字符串的字符数是否大于Y,如果是,则从当前字符串中提取出所有字符数为Y的待标识字符串,否则,将当前字符串作为待标识字符串。
[0024]进一步地,还包括:
[0025]将每个标签保存在对应的标签关联表,所述标签关联表中包括:当如标签的上级标签、当前标签的下级标签、当前标签的关联标签;
[0026]和/或,所述待处理数据对应的至少一个字符串,包括:存储所述待处理数据的数据表中对应的数据项名称、所述待处理数据的属性名称、所述待处理数据中的字符串;
[0027]和/或,所述多个标签,包括:存储数据的数据表中的数据项名称、标准词库中的词、数据的属性名称;
[0028]和/或,所有标签中包括多个维度的标签,每个维度的所有标签中包括描述当前维度对应的数据特征的所有标签。
[0029]进一步地,在所述S3之后,进一步包括:将对应相同标签的各个待处理数据,确定为相关联的数据。
[0030]另一方面,本发明提供了一种数据处理的装置,包括:
[0031]设置单元,用于设置多个标签;
[0032]获取单元,用于获取待处理数据对应的至少一个字符串;
[0033]匹配单元,用于分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签,将所有匹配标签作为所述待处理数据的标签。
[0034]进一步地,包括:所述匹配单元,在执行所述分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签时,具体执行:从当前字符串中提取至少一个待标识字符串,其中,每个待标识字符串由当前字符串中相邻的字符组成,将每个待标识字符串与每个标签进行匹配,获取每个待标识字符串相匹配的匹配标签,将每个待标识字符串相匹配的匹配标签作为当前字符串对应的匹配标签;
[0035]进一步地,还包括:关联单元,用于将对应相同标签的各个待处理数据,确定为相关联的数据。
[0036]进一步地,所述匹配单元,在执行所述将每个待标识字符串与每个标签进行匹配,获取每个待标识字符串相匹配的匹配标签时,具体执行:
[0037]B1:将当前待匹配字符串两端中的任意一端作为删减端;
[0038]B2:将当前待标识字符串作为当前待匹配字符串;
[0039]B3:判断当前待匹配字符串的字符数是否小于预设值,如果是,则结束当前流程,否则,执行步骤B4;
[0040]B4:将当前待匹配字符串与所有标签进行匹配,判断是否有与当前待匹配字符串相匹配的标签,如果有,则将与当前待匹配字符串相匹配的标签作为当前待标识字符串的匹配标签,执行步骤B5,否则,执行步骤B5 ;
[0041]B5:将当前待匹配字符串的删减端的第一个字符去掉,得到删减字符串,将所述删减待标识字符串作为当前待匹配字符串,返回步骤B3。
[0042]进一步地,包括:
[0043]X为所有标签中字符个数最少的标签的字符数,Y为所有标签中字符个数最多的标签的字符数;
[0044]所述预设值包括X ;
[0045]所述匹配单元,在执行所述从当前字符串中提取至少一个待标识字符串时,具体执行:判断当前字符串的字符数是否大于Y,如果是,则从当前字符串中提取出所有字符数为Y的待标识字符串,否则,将当前字符串作为待标识字符串。
[0046]本发明实施例提供的一种数据处理的方法及装置,将待处理数据对应的字符串与预设的标签进行匹配,获取每个字符串匹配的匹配标签,将该匹配标签作为待处理数据的标签,通过这种方法,可以为不同的数据匹配对应的标签,当两个数据对应的标签相同时,可以确定这两个数据是相关联的。每个数据可能有多个对应的标签,而每个标签可能对应很多不同的数据,可以认为具有相同标签的数据是相关联的,这样通过标签这个纽带就可以建立大量数据之间的关联,提高了关联数据的效率。
【附图说明】
[0047]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]图1是本发明一实施例提供的一种数据处理的方法的流程图;
[0049]图2是本发明一实施例提供的另一种数据处理的方法的流程图;
[0050]图3是本发明一实施例提供的一种数据处理的装置的示意图;
[0051]图4是本发明一实施例提供的另一种数据处理的装置的示意图。
【具体实施方式】
[0052]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053]如图1所示,本发明实施例提供了一种数据处理的方法,该方法可以包括以下步骤:
[0054]SO:预先设置多个标签;
[0055]S1:获取待处理数据对应的至少一个字符串;
[0056]S2:分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签;
[0057]S3:将所有匹配标签作为所述待处理
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1