一种互联网网站责任主体识别方法

文档序号:9579368阅读:154来源:国知局
一种互联网网站责任主体识别方法
【技术领域】:
[0001] 本发明涉及互联网技术领域,具体讲是一种互联网网站责任主体识别方法。
【背景技术】:
[0002] 目前,对于互联网网站责任主体的识别方法主要是通过人工的方式进行域名查 询、ip查询等,结合查询的结果加上人工的判断来判别互联网网站的责任主体。这种方法 依赖人工,较为低效且带有主观性,人力的有限性使得查询结果无法保障准确性。

【发明内容】

[0003]本发明要解决的技术问题是,提供一种不用人工检查,可以自动化判断,能够减少 人力成本,效率高,且结果更加准确可靠的互联网网站责任主体识别方法。
[0004]本发明的技术解决方案是,提供一种互联网网站责任主体识别方法,该识别方法 包括以下步骤:
[0005]①、首先根据需要甄别的网站搜集网站特征值并确定结果集合;
[0006]②、接着建立起特征值和结果集的映射关系并赋予权值;
[0007]③、然后针对每个映射进行计算,获得不同的结果集;
[0008]④、最后将所有的结果集进行归并,得到最后的结果。
[0009]采用上述方法后,与现有技术相比,本发明的有益技术效果是:本发明专利的最终 实现主体是一个应用系统,本专利可以理解为该应用系统的核心算法,该应用系统以一个 网站地址作为输入,输出其可能归属单位的集合,期间不用人工检查,可以自动化判断,能 够减少人力成本,效率高,且由于采用了多元素作为判别的依据,因此判断的结果可信度高 于基于经验的人工判断,其结果更加准确可靠。
【附图说明】:
[0010] 图1是本发明一种互联网网站责任主体识别方法的流程图;
[0011] 图2是输入集合与输出集合之间的映射关系图;
[0012] 图3是图2中权值R11的权值再分配图。 具体实施例:
[0013]下面结合附图和具体实施例对本发明一种互联网网站责任主体识别方法作进一 步说明:
[0014] 如图1所示,本发明一种互联网网站责任主体识别方法的具体步骤如下:
[0015]①、首先根据需要甄别的网站搜集网站特征值,如图2所示,建立输入集合I(网站 特征值)和输出集合〇 (查询结果),其中,输入集合I包括但不限于:网站域名、网站IP地 址、网站名、网站商标、网站备案号、网站所留地址等,输出集合〇包括但不限于:网站所有 单位、单位法人、单位地址、单位联系电话、单位联系邮箱等。
[0016]②、由于通过不同的特征值所获得的查询结果的可信度不一样,因此接下来就需 要建立一张特征值与结果集之间的权值映射表,针对不同的特征值赋予不同的权值和映射 方法,如图2所示,其中,第一行为输出集合0,第一列为输入结合I,剩余的值(R11~R65) 代表的是从该行的输入I判断出的输出0的可信度的权值。
[0017]③、然后针对每个映射进行计算,获得不同的结果集;
[0018]④、最终的每项结果在展示时,将通过不同特征值所获得的结果进行加权和归并。
[0019]本发明采用自动化检测技术,结合多个网站特征值,针对每个查询目标进行查询。 由于使用不同的特征值所查询的结果可能不一致,为了从众多查询结果中找出有可能的真 实结果,将针对不同目标的特征值赋予不同的权值。当查询结果不一致时,按照同样结果加 权的方式展现出来,权值表达了结果的可信程度。
[0020] 本发明将通过以下两个具体实施例来进一步说明本发明一种互联网网站责任主 体识别方法的原理:
[0021] 实施例1
[0022] 要查询的网站域名为A,网站上所留的备案号为B,网站名为C,以这三项信息作为 输入集合I,假定本次需要查找的结果集合0为网站所有人。首先建立起特征值和结果的映 射关系并定义权值,如表一所示,通过站长工具等网站查询域名所对应的网站所有人R11, 并且定义这个查询结果的权值为0. 4,通过网站备案号在ICP备案查询网站查询网站所有 人R21,并定义这个查询的权值为0.4,通过网站名搜索所有企业人的映射为R31,并定义这 个权值为〇. 2。利用已经定义的映射和权值关系,通过域名A查出所有人为D,通过备案号B 查出所有人为E,通过网站名C查出所有人为D,通过结果和映射表的权值,归并同类项,则 最终的结果集表示为:D的可能是40% +20%= 60%,E的可能是40%。
[0023]表一:
[0024]
[0025]针对每一个映射关系,我们可以进一步定义映射方法。如通过网站域名查找网站 所有单位,可以通过官方的域名查询网站进行查询。由于存在多个域名查询网站,为了进 一步提高可信度,将权值再次划分,针对多个域名查询网站分配不同的权值,并将查询结果 归并,如图3所示,在通过域名查询所有人时,通过新网域名查询网站获得的企业所有人为 D1,而通过美橙域名查询网站得到的结果为D2。则根据预先定义的权值,将该项0.4的权值 再次分配为50 %和50 %,最后返回的结果集为D1可能性为0. 4X50 % = 20 %,D2可能性 0. 4X50%= 20%。
[0026] 综上所述,对于一个从输入集合II~lx到输出集合01~0y的映射,设定其某一 个权值Rij再分解权值为Rijl~Rijz的,最终的结果表达式为:
[0027]
[0028] 其中,w为利用该权值检测到的结果,0,表示第j个输出结果(比如网站归属单 位),Rij为图2中的映射权值,Rijk为图2中的权值乘以图3中的权值得到的最后权值。 每次检测的结果都以此公式进行汇总。
[0029] 实施例2
[0030]某网站,知道其ip地址和域名地址(图2中的第一列,只取两项),查询其归属单 位(图2中的第一行,只取一项),由于输入项有ip地址、域名地址,分别赋予此两项的权值 为50%、50% (如表二所示),然后进一步将R11划分为新网和美橙(如表三所示),将R21 划分为万网和新网(如表四所示)。
[0031] 表二:
[0037] 通过ip地址查训到穴旧牌平,丨兄乃λmjη」此.|土乃〇u7。= 0· 25,归属单位为B 的可能为50% *50%= 0. 25。[0038] 通过域名查询到其归属单位为C的可能为50% *50%=0. 25,归属单位为A的可 能为50% *50%= 0· 25。[0039] 则最终的结果是:归属单位为A的权值为0. 25+0. 25=0. 5(即在此合并同类项), 为B的权值为0. 25,为c的权值为0. 25。[0040] 以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方
[0032]
[0033] 表三:
[0034]
[0035] 表四:
[0036] 案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
【主权项】
1. 一种互联网网站责任主体识别方法,其特征在于:该识别方法包括以下步骤: ① 、首先应用系统根据需要甄别的网站搜集网站特征值并确定结果集合; ② 、接着建立起特征值和结果集的映射关系并赋予权值; ③ 、然后针对每个映射进行计算,获得不同的结果集; ④ 、最后将所有的结果集进行归并,得到最后的结果。2. 根据权利要求1所述的一种互联网网站责任主体识别方法,其特征在于:步骤②中 的权值为Rij,Rij根据同一种性质不同的网站特征值进行再次划分,Rij的再分解权值为 Rij\~Rij 2的,最终的结果表达式为:其中,w为利用该权值检测到的结果,0,表示第j个输出结果。
【专利摘要】一种互联网网站责任主体识别方法,该识别方法的步骤是首先根据需要甄别的网站搜集网站特征值并确定结果集合,接着建立起特征值和结果集的映射关系并赋予权值,然后针对每个映射进行计算,获得不同的结果集,最后将所有的结果集进行归并,得到最后的结果。本发明一种互联网网站责任主体识别方法的优点是:不用人工检查,可以自动化判断,能够减少人力成本,效率高,且结果更加准确可靠。
【IPC分类】G06F17/30
【公开号】CN105335480
【申请号】CN201510657425
【发明人】蔡翔, 孙建, 张敏
【申请人】国家电网公司, 国网安徽省电力公司电力科学研究院
【公开日】2016年2月17日
【申请日】2015年10月13日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1