数据筛选的方法、装置及服务器的制造方法_2

文档序号:9217289阅读:来源:国知局
开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0056]图1示出了根据本发明一个实施例的数据筛选的方法的流程图。该方法可用于各种服务器,例如网络中服务提供商的各种业务服务器。如图1所示,该方法包括如下步骤S110-S130。
[0057]在步骤SllO中,获取记录地区与地区所用IP地址间对应关系的数据。
[0058]数据包括:地区名称和地区对应IP地址段。
[0059]在步骤S120中,判断数据中地区名称是否符合预设地区名称约束条件,数据中地区对应IP地址段是否符合预设IP地址约束条件。
[0060]在一实施例中,如图2所示,所述判断数据中地区名称是否符合预设地区名称约束条件,可包括如下步骤S210和步骤S220。
[0061]在步骤S210中,判断数据中地区名称是否符合“中国+省份名称+市名称”的格式。
[0062]在步骤S220中,如果符合,则判定数据中地区名称符合预设地区名称约束条件。
[0063]举例而言,如图3所示,所述判断所述数据中地区名称是否符合“中国+省份名称+市名称”的格式,可包括如下步骤S302-S308:
[0064]在步骤S302中,确定数据中地区名称所包含的字段。
[0065]在步骤S304中,判断数据中地区名称中第一字段是否为中国,如果是,执行步骤S306,否则,判断过程结束。
[0066]在步骤S306中,判断数据中地区名称中第二字段末尾是否包括“省”或“自治区”,如果是,执行步骤S308,否则,判断过程结束。
[0067]在步骤S308中,判断数据中地区名称中第三字段末尾是否包括“市”或“自治州”,如果是,执行步骤S310,否则,判断过程结束。
[0068]在步骤S310中,判定数据中地区名称符合“中国+省份名称+市名称”的格式。
[0069]例如,数据中地区名称为中国河北省保定市,将该地区名称按字段进行拆分,确定出地区名称所包含的字段。其中,共包含三个字段,第一字段、第二字段和第三字段,分别为中国、河北省、保定市。对所得字段进行判断,第一字段中包括中国,第二字段末尾中包括“省”,第三字段末尾中包括“市”,判定数据中地区名称符合预设地区名称约束条件。
[0070]又例如,数据中地区名称为中国吉林省延边朝鲜族自治州,将该地区名称按字段进行拆分,确定出地区名称所包含的字段。其中,共包含三个字段,分别为中国、吉林省、延边朝鲜族自治州。对所得字段进行判断,第一字段中包括中国,第二字段末尾中包括“省”,第三字段末尾中包括“自治州”,判定数据中地区名称符合预设地区名称约束条件。
[0071]又例如,数据中地区名称为中国西安市雁塔区,将该地区名称按字段进行拆分,确定出地区名称所包含的字段。其中,共包含三个字段,分别为中国、西安市、雁塔区。对所得字段进行判断,第一字段中包括中国,接着对第二字段进行判断,第二字段末尾中不包括“省”或“自治区”,判定数据中地区名称不符合预设地区名称约束条件。
[0072]在一实施例中,地区对应IP地址段包括起始IP地址和结束IP地址。如图4所示,判断数据中地区对应IP地址段是否符合预设IP地址约束条件,可包括如下步骤S402-S404。
[0073]在步骤S402中,判断数据中地区对应IP地址段的起始IP地址和结束IP地址是否都为32位或128位整数类型。
[0074]在步骤S404中,如果是,则判定数据中地区对应IP地址段符合预设IP地址约束条件。
[0075]具体而言,如果IP地址段的起始IP地址和结束IP地址都为32位整数类型,则说明该IP地址段为规范的IPv4地址。如果IP地址段的起始IP地址和结束IP地址都为128位整数类型,则说明该IP地址段为规范的IPv6地址。当IP地址段为规范的IPv4地址或IPv6地址时,该IP地址段符合预设IP地址约束条件。
[0076]在步骤S130中,将地区名称符合预设地区名称约束条件,并且地区对应IP地址段符合预设IP地址约束条件的数据判定为稳定数据,进行存储。
[0077]在本实施例中,通过将数据中地区名称和地区对应IP地址段分别与预设地区名称约束条件和预设IP地址约束条件进行比较,筛选出稳定数据;由此解决了从网络中获得数据错误过多,影响对数据使用的问题,取得了增强所用数据信息的可靠性,进而提高使用数据的业务的服务性能的有益效果。
[0078]在一实施例中,所述方法还包括:使用判定出的稳定数据对数据库中存储的数据进行更新。
[0079]举例而言,如图5所示,使用判定出的稳定数据对数据库中存储的数据进行更新,具体包括如下步骤S502和S504。
[0080]在步骤S502中,将稳定数据中没有被数据库包括的数据添加到数据库中。
[0081]在步骤S504中,将数据库中没有被稳定数据包括的数据标记为删除。
[0082]在本实施例中,采用稳定数据对数据库中数据进行更新,保证数据库中数据与数据源中可靠数据的一致性。并且,将将数据库中没有被稳定数据包括的数据标记为删除,如此,使得该数据不会被业务使用,但是也没有从物理存储介质中删除。进而,当以后需要该数据时,可以将该数据进行恢复,进而能够更加高效的对数据库的进行维护。
[0083]图6示出了根据本发明一个实施例的数据筛选的方法的流程图。该方法可用于各种服务器,例如网络中服务提供商的各种业务服务器。如图6所示,该方法包括如下步骤S602-S618。
[0084]在步骤S602中,获取记录地区与地区所用IP地址间对应关系的一条数据。
[0085]数据包括:地区名称和地区对应IP地址段。
[0086]在步骤S604中,确定该条数据中地区名称所包含的字段。
[0087]在步骤S606中,判断该条数据中地区名称中第一字段是否为中国,如果是,执行步骤S608,否则,执行步骤S602。
[0088]在步骤S608中,判断该条数据中地区名称中第二字段末尾是否包括“省”或“自治区”,如果是,执行步骤S610,否则,执行步骤S602。
[0089]在步骤S610中,判断该条数据中地区名称中第三字段末尾是否包括“市”或“自治州”,如果是,执行步骤S612,否则,执行步骤S602。
[0090]在步骤S612中,判断该条数据中地区对应IP地址段的起始IP地址和结束IP地址是否都为32位或128位整数类型,如果是,则执行步骤S614,否则,执行步骤S602。
[0091]在步骤S614中,将该条数据判定为稳定数据进行存储。
[0092]在步骤S616中,将稳定数据中没有被数据库包括的数据添加到数据库中。
[0093]在步骤S618中,将数据库中没有被稳定数据包括的数据标记为删除。
[0094]在本实施例中,通过将数据中地区名称和地区对应IP地址段分别与预设地区名称约束条件和预设IP地址约束条件进行比较,筛选出稳定数据;由此解决了从网络中获得数据错误过多,影响对数据使用的问题,取得了增强所用数据信息的可靠性,进而提高使用数据的业务的服务性能的有益效果。
[0095]上述仅为本发明的数据筛选的方法的实例性说明,本发明不限于此。凡在本发明的精神或原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
[0096]图7示出了根据本发明一个实施例的数据筛选的装置的结构图。该装置可用于各种服务器,例如网络中服务提供商的各种业务服务器。如图7所示,该装置包括模块。
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1