处理目的地址的方法和系统的制作方法

文档序号:7625705阅读:128来源:国知局
专利名称:处理目的地址的方法和系统的制作方法
技术领域
本发明涉及web地址和超链接,更具体地,涉及用于检测伪造的web地址和超链接的方法。
背景技术
超链接是电子文档中链接到该同一电子文档中的另一位置或链接到一完全不同的文档的元素。超链接可在任何电子文档例如网页、电子邮件、字处理文档、电子表格或类似物中。就因特网来说,超链接可以是可被嵌入到对象例如词、短语、图标或图像中的、网站的网络地址或域名。这些对象通常称为超链接对象。
万维网上的网页和其他资源由唯一的URL(统一资源定位符)或地址来标识。网络地址或IP地址是用于TCP/IP网络上的计算机或设备的标识符。使用TCP/IP协议的网终根据目的地的IP地址来路由消息。IP地址的格式是被书写为由句点隔开的四个数字的32位数字地址。每个数字可以是0到255。例如,1.160.10.240可以是一IP地址。
域名是标识一个或多个IP地址的名称。例如,域名<ibm.com>可以具有一个或多个与之相关联的IP地址。每个域名具有一指示它与之关联的顶级域(TLD)的后缀(例如,.com、.org或.net)。因特网基于IP地址而不是域名来工作,因此需要域名系统(DNS)服务器来将域名转换成IP地址。
一旦激活超链接对象,则可由Web浏览器或类似物建立一因特网联系。该超链接对象本身可以是表示网站、网站的名称、网站的域名或任何希望的表示物的符号。例如,IBM的网站的超链接对象可以是IBM符号、名称IBM或域名<www.ibm.com>。
通过使用伪造的超链接,可将因特网用户引到伪造的网站。例如,一超链接对象可显示名称<www.ibm.com>,而与该对象相关联的域名实际上却是<www.1bm.com>,其中使用数字“1”代替了字母“i”。用于这种伪造的超链接的HTML语法可以是<a href=http//www.1bm.com/>www.ibm.com</a>。该超链接看起来是www.ibm.com,而其域名实际上却是http//www.1bm.com。由于数字“1”在外观上与字母“i”相似,没有疑心的用户可能不会认识到他们正被路由到一伪造的网站而不是真实的网站。该伪造网站可以是真实网站的假造形式,其用来收集和利用用户的敏感信息。这种活动被称为网络钓鱼(phishing)。

发明内容
根据本发明的第一个方面,一种处理目的地址的方法包括通过比较该目的地址与至少一个已知的目的地址来确定该目的地址是否为一合法地址,并响应于该确定执行第一功能。
根据本发明的另一个方面,一种注册域名的方法包括比较该域名与多个已知名称,确定该域名是否是该多个已知名称中任何一个的欺骗性变换,并且如果该域名不是该多个已知名称中任何一个的欺骗性变换,则允许注册该域名。
根据本发明的再一个方面,一种识别欺骗性域名变换的方法包括比较一域名与至少一个已知名称,并且确定该域名是否包括与所述至少一个已知名称的视觉混淆。
根据本发明的进一步的方面,一种用于处理目的地址的计算机程序产品包括具有包含在其中的计算机可读程序代码的计算机可读介质。该计算机可读程序代码包括被配置为通过比较该目的地址与至少一个已知的目的地址来确定该目的地址是否为合法地址的计算机可读程序代码,以及被配置为响应于所述确定执行第一功能的计算机可读程序代码。
根据本发明的又一个方面,一种用于注册域名的计算机程序产品包括具有包含在其中的计算机可读程序代码的计算机可读介质。该计算机可读程序代码包括被配置为比较该域名与多个已知名称的计算机可读程序代码,被配置为确定该域名是否是该多个已知名称中任何一个的欺骗性变换的计算机可读程序代码,以及被配置为如果该域名不是该多个已知名称中任何一个的欺骗性变换则允许注册该域名的计算机可读程序代码。
根据本发明的另一个方面,一种用于识别欺骗性域名变换的计算机程序产品包括具有包含在其中的计算机可读程序代码的计算机可读介质。该计算机可读程序代码包括被配置为比较一域名与至少一个已知名称的计算机可读程序代码,以及被配置为确定该域名是否包括与该至少一个已知名称的视觉混淆的计算机可读程序代码。
根据本发明的再一个方面,一种系统包括被配置为通过比较一目的地址与至少一个已知的目的地址来确定该目的地址是否为合法地址的第一模块,以及被配置为响应于所述确定执行第一功能的第二模块。
根据本发明的进一步的方面,一种用于注册域名的系统包括比较一域名与多个已知名称并确定该域名是否是该多个已知名称中任何一个的欺骗性变换的第一模块,以及如果该域名不是该多个已知名称中任何一个的欺骗性变换,则允许注册该域名的第二模块。
根据本发明的又一个方面,一种用于识别欺骗性域名变换的系统包括被配置为比较一域名与至少一个已知名称,并且确定该域名是否包括与所述至少一个已知名称的视觉混淆的第一模块。
通过结合附图阅读以下对本发明的非限制性详细描述,本领域的普通技术人员将清楚地了解由权利要求所唯一定义的本发明的其他方面和特征。


图1示出了可用于本发明的计算机系统;图2示出了根据本发明的一个方面处理目的地址的方法;以及图3示出了根据本发明的另一个方面检测域名注册期间的非法域名的方法。
具体实施例方式
如本领域的技术人员可理解的,本发明可体现为方法、系统或计算机程序产品。因此,本发明可采取完全硬件实施例、完全软件实施例(包括固件、常驻软件、微代码等)、或组合了在这里都被一般地称为“电路”或“模块”的软件方面和硬件方面的实施例的形式。此外,本发明可采取在计算机可用存储介质上的计算机程序产品的形式,该计算机可用存储介质具有包含于该介质中的计算机可用程序代码。
可利用任何合适的计算机可读介质。计算机可用或计算机可读介质可以是,例如但不限于,电、磁、光、电磁、红外、或半导体系统、装置、设备、或传播介质。该计算机可读介质的更具体的例子(非穷尽性的列表)包括以下各项具有一个或多个导线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储设备、传输介质例如那些支持因特网或内联网的传输介质、或磁存储设备。应注意所述计算机可用或计算机可读介质甚至可以是其上印有程序的纸或其他合适的介质,因为该程序可通过例如对该纸或其他介质进行光扫描而被电子地捕获,然后在需要时以适当的方式被编译、解释或以其他方式处理,并随后被存储在计算机存储器中。在本文献的情境中,计算机可用或计算机可读介质可以是可包含、存储、传递、传播、或传送程序以由指令执行系统、装置或设备使用或与之相联系地使用的任何介质。
用于执行本发明的操作的计算机程序代码可以用面向对象的编程语言例如Java7、Smalltalk或C++编写。然而,用于执行本发明的操作的计算机程序代码也可以用传统的过程编程语言例如“C”编程语言编写。所述程序代码可完全在用户的计算机上、部分在用户的计算机上、作为独立的软件包、部分在用户的计算机上并部分地在远程计算机上、或完全在远程计算机上执行。在后一情况中,该远程计算机可以通过局域网(LAN)或广域网(WAN)连接到用户的计算机,或者该连接可以是连接到外部计算机(例如,使用因特网服务提供商通过因特网)。
以下参照根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本发明。应理解这些流程图和/或框图中的每一个框,以及这些流程图和/或框图中的框的组合,可以由计算机程序指示实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其他可编程数据处理装置的处理器以生成一机器,从而通过该计算机或其他可编程数据处理装置执行的这些指令创建了用于实现在所述流程图和/或框图的一个或多个框中指定的功能/动作。
这些计算机程序指令也可被存储在可指引计算机或其他可编程数据处理装置以特定方式工作的计算机可读存储器中,从而存储在该计算机可读存储器中的指令生成了一包括实现在所述流程图和/或框图的一个或多个框中指定的功能/动作的指令手段的制造物品。
所述计算机程序指令也可被装载到计算机或其他可编程数据处理装置中,以致使在该计算机或其他可编程装置上执行一系列操作步骤,来产生一计算机实现的过程,从而在该计算机或其他可编程装置上执行的指令提供了用于实现在所述流程图和/或框图的一个或多个框中指定的功能/动作的步骤。
现参照图1,其示出了可用于处理目的地址的计算机系统10。计算机系统10包括通过网络35连接在一起的多个计算设备15、20、25和一域名服务器30。计算设备15可包括若干计算设备例如个人计算机、移动电话、个人数字助理(PDA)或类似物中的任何一个。计算设备20、25可包括若干计算设备例如存放有一网站的个人计算机中的任何一个。在所示的实施例中,计算设备20存放有合法网站<www.ibm.com>,而计算设备25存放有非法网站<www.1bm.com>。网络35可以包括包括局域网、广域网、内联网或因特网的任何网络系统。本领域的技术人员将理解,系统10可包括若干不同的计算机设备、其他web服务器、域名服务器或其他适当的设备。此外,网络35可包括一个或多个适当连接在一起的网络。
根据本发明的一个方面,计算设备15包括访问存放在计算设备20、25中的网站的浏览器程序。要处理的超链接可在任何电子文档例如网页、电子邮件、字处理文档、电子表格或类似物中。就因特网来说,超链接可以包括一目的地址,例如可嵌入在一对象例如词、短语、图标或图象中的、网站的数字IP地址或域名。在本发明的一个方面,该目的地址可以是存放在计算设备20中的一网站(例如,<www.ibm.com>)的域名。处理该目的地址以确定该域名是合法域名的诚实变换还是欺骗性变换。
可将该目的地址与一合法域名列表、一非法域名列表、或这两者的组合相比较。例如,非法域名列表可包含条目<www.1bm.com>,这可能是一已知的非法域名,因为字母“i”已经为数字“1”所取代。此外,合法域名列表可包含条目<ibm.com>,这可能是一已知的合法站点,因为只是简单地从名称中抛弃了“www”。下面将说明什么构成了诚实的或欺骗性的变换,以及因此,域名是否会是合法的或非法的。
根据本发明的一个方面,将域名与各合法域名相比较,以确定是否存在利用视觉混淆的欺骗性变换。一种类型的视觉混淆是字母数字到字母数据的替换。例如,数字“1”看起来很像字母“i”,从而用一个替换另一个可构成一欺骗性变换。假设将超链接<www.1bm.com>与已知域名<www.ibm.com>相比较,则“1”对“i”的替换可指示一欺骗性变换。下列替换也可用于造成视觉混淆,从而导致超链接和已知域名的很可能的欺骗性变换数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、字母n替换字母m、以及字母m替换字母n。本领域的技术人员将理解也可使用其他字母数字到字母数字的替换来造成视觉混淆。
可检查的另一种形式的视觉混淆是顶级域的替换。例如,可以用.org替换.com,用.gov替换.com,以及使用任何国家代码来通过视觉混淆生成欺骗性变换。
根据本发明的另一个方面,可确定所述域名与合法域名列表之间的相似性。“共同序列”是在两个字符串中以相同顺序出现的字符的序列。例如,字符串“academic”和“abcdefghijklm”具有很多共同序列,包括a,c,d,e,m,iac,ad,ae,am,aicd,ce,cm,ciacdem,acdei。最后两个序列具有是最长共同序列(LCS)的特殊特征。应注意一共同序列可具有多个实例(例如,“ad”可以来自AcaD或acAD)。
两个字符串之间的相似性M和指定这两个字符串之间的对的集合的变量P可计算如下。给定两个字符串s和t,其中s代表要处理的域名,而t代表已知的合法域名M=similarity(s,t),且P=xform(s,t)={(si,ti)0<=i<=k}其中s=s0+s1+...+sk且t=t0+t1+...+tk符合以下约束,即,如果u=u0+u1+...+uM是s和t的最长共同序列,则u可通过进行以下选择而构建uM=si=tj从而如果um=si=tj且um-1=sx=ty,则对于所有的m、i、j、x和y,x<i且y<j。简言之,u按顺序选择s和t的共同子字符串。(应注意,某些si和tj可以是长度为0的“空串”,并且这些不应被认为是LCS的一部分)。
P可被认为是单个集合,而全部解答可被认为如下simiform(s,t)=<M,{P}>。
可计算一表示两个字符串之间的相似性并因而表示变换是诚实的还是欺骗性的相似性阈值。该相似性阈值可计算如下N=LCS(s,t)/min(length(s),length(t))其中LCS(s,t)是字符串s和t的最长共同序列;min(length(s),length(t))是s和t的最小字符长度。
为了说明的目的,假设s=www.ibm.comt=www.1bm.com。
s和t之间的对的集合是P={(″www.″,″www.″),(″i″,″1″),(″bm.com″,″bm.com″)}。
因此,s和t的最长共同序列是10,并且最小字符长度是11。因此相似性阈值N是10/11。以百分比表示,则相似性阈值N是90.9%。除了指示完全匹配的100%的相似性阈值外,相似性阈值越大,则变换是欺骗性变换的可能性就越大,因此在所示的例子中,变换可能是欺骗性的。可将该相似性阈值与一预先确定的阈值相比较,以确定变换是否将被认为是诚实的或欺骗性的。对于较高的安全性,可将该阈值设置得较低(例如,70%),而对于较低的安全性,可将该阈值设置得较高(例如,90%)。本领域的技术人员将理解,可将该阈值设置为任何所希望的值。本领域的技术人员还将理解,可使用任何合适的公式来计算该相似性阈值。
根据本发明的另一个方面,可向用户呈现包括带有域名的显示文本的超链接。通常,显示文本与域名相匹配。然而,显示文本可以是域名的变换,并因此可以是可被解决的诚实的或欺骗性的变换。可将该显示名称与域名比较以确定是否存在变换,以及该变换是否是诚实的或欺骗性的。用于这种超链接的HTML语法可以是<a href=″http//www.1bm.com/″www.ibm.com</a>。该超链接看起来是<www.ibm.com>,而其域名实际上是<www.1bm.com>。将显示名称<www.ibm.com>与域名<www.1bm.com>相比较,并且由于数字“1”对字母“i”的替换是一种形式的视觉混淆,所以该变换可能是欺骗性的,且该超链接可能是一伪造物。
附加于或独立于以上所述,可访问域名服务器30以确定与所述域名以及已知域名或显示文本相关联的(一个或多个)IP地址。可将所得到的各IP地址相互比较以确定在这些IP地址之间是否存在任何重叠。由于一域名可具有一个或多个与之相关联的IP地址,如果在所述IP地址之间有任何重叠,则要处理的域名很可能是所述已知域名或显示文本的诚实变换。例如,与域名<ibm.com>相关联的IP地址可能落入与<www.ibm.com>相关联的IP地址集合中,这表示变换是诚实的,且该域名是合法的。相反,与<www.1bm.com>相关联的IP地址可能不会落入与<www.ibm.com>相关联的IP地址集合中,这表示变换是欺骗性的,且该域名是非法的。
根据本发明的另一个方面,所述目的地址可以是与一域名相关联的一IP地址。可将该IP地址与一合法IP地址列表、一非法地址列表和这两者的组合相比较。此外,可访问域名服务器30以确定与该IP地址相关联的域名。然后可如这里所描述的那样分析该域名。
如果所述变换是合法变换的数据库的一部分或者是一诚实变换,则可允许用户访问与考虑中的该域名相关联的网站。但是,如果该变换是非法变换的数据库的一部分或者是一欺骗性变换,则可警示用户,用户可能无法访问与该域名相关联的网站,或者用户可能必须明确地授予允许访问该网站的许可。本领域的技术人员将理解,也可采取其他适当的行动。
所述合法域名列表可本地驻留在用户的计算机上,或远程驻留在服务器、另一个计算机或与用户的计算机分离的任何其他设备上。可在用户检查不同的超链接时以与填充字处理词典相同的方式填充所述列表。如本领域的技术人员将理解的,所述列表也可包含已知的合法和/或非法地址。
本领域的技术人员将理解,也可利用本发明来确定域名注册的可接受性。作为注册过程的一部分,将把要注册的域名与已知注册的列表相比较,以确保寻求注册的域名不是已经注册的域名的重复。此外,可将寻求注册的域名与已知诚实的和/或欺骗性的变换相比较。也可将寻求注册的域名与商标或其他适当名称的数据库相比较,以确定该域名是否是任何所述商标或其他适当名称的诚实或欺骗性变换。假设该域名还没有被注册,如果该域名是已知诚实变换的数据库的一部分,或被确定为诚实变换,则允许域名注册继续进行,或者如果该域名是已知欺骗性变换的数据库的一部分或被确定为欺骗性变换,则可终止该过程。本领域的技术人员将理解,可采取其他适当的行动,例如通知任何遭受了可能是本域名的欺骗性变换的域名的注册的域名的拥有者。用于这种过程的语法可以如下方式执行,其中n是寻求注册的域名,D是域名、商标或其他适当名称的数据库。
if(n是D的元素){fail(n已在使用);}else{for each z in D{P=xform(z,n);H=true;for i=0 to k doH&=honest(zi,ni);if(H==false){fail(n可从z由欺骗性变换得到);}}}现在参照图2,其示出了一种处理目的地址的方法100。在框110,呈现要处理的目的地址。在框120,分析该目的地址,以确定该目的地址是域名还是IP地址。如果该目的地址是IP地址,则在框130分析该目的地址以确定它是否包含在被阻挡IP地址的数据库或被阻挡IP地址的范围内。如果该目的地址包含在这种数据库中,则认为该目的地址是欺骗性地址,并在框140采取适当行动。否则,确定与该目的地址相关的域名,并且该过程在框160与来自框120的域名类型的目的地址一起继续进行。
在框160,将该域名与合法域名的数据库相比较。如果该域名与数据库中的任何条目匹配,则在框170将允许用户访问网站。如果该域名不与数据库中的条目匹配,则在框180分析该域名,以确定它是否是合法域名的欺骗性变换。如果该变换是欺骗性的,则认为该目的地址是一欺骗性地址,并且在框140采取适当行动。如果该变换被认为是诚实的,则在框170将允许用户访问该网站。
现在参照图3,其示出了一种在域名注册期间检测非法域名的方法200。在框210,呈现要注册的域名。在框220,将该域名与注册域名的数据库相比较,以确定考虑中的该域名是否已经被注册。如果该域名已经被注册,则在框230通知用户该域名不可用于注册。如果该域名还没有注册,则在框240分析该域名以确定它是否是已注册域名或商标的欺骗性变换。如果该变换是欺骗性的,则在框250终止注册。如果该变换是诚实的,则在框260允许注册过程继续。
图1-3的流程图和框图示出了根据本发明的各实施例的系统、方法和计算机程序产品的可能实现的结构、功能和操作。在这方面,这些流程图和框图中的每一个框可代表代码的模块、段或部分,其包括用于实现所指定的逻辑功能的一个或多个可执行指令。应注意,在某些其他可选择的实现中,在框中标出的功能可以不按图中标出的顺序发生。例如,取决于所涉及的功能,显示为相继发生的两个框可以事实上基本并行地执行,或者这些框有时可以相反顺序执行。也应注意,这些框图和/或流程图的每一个框,以及这些框图和/或流程图中的框的组合,可由执行指定功能或动作的专用的基于硬件的系统来实现,或者由专用硬件和计算机指令的组合来实现。
这里所使用的术语仅是为了描述特定实施例的目的,而并非旨在限制本发明。如这里所使用的,单数形式“一”、“一个”、“该”旨在也包括复数形式,除非上下文清楚地指示不是这样。还应理解,词语“包括”和/或“包含”,当在本说明书中使用时,指定所述特征、整数、步骤、操作、元件和/或部件的存在,但并不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组合的存在或附加。
对于本领域的技术人员显然的是,可对这里描述的特定实施例进行大量的修改和改变,而不背离本发明的精神和范围。
权利要求
1.一种处理目的地址的方法,该方法包括以下步骤通过比较该目的地址与至少一个已知目的地址来确定该目的地址是否为合法地址;以及响应于所述确定执行第一功能。
2.根据权利要求1的方法,其中所述通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否为合法地址的步骤包括确定该目的地址是否是该至少一个已知目的地址的诚实变换。
3.根据权利要求1的方法,其中所述至少一个已知目的地址是多个已知合法目的地址中的一个。
4.根据权利要求3的方法,其中所述响应于所述确定执行第一功能的步骤包括响应于确定了所述目的地址不是所述多个已知合法目的地址的一部分而发出警告或阻挡对所述目的地址的访问中的至少一个。
5.根据权利要求1的方法,其中所述至少一个已知目的地址是多个已知非法目的地址中的一个。
6.根据权利要求5的方法,其中所述响应于所述确定执行第一功能的步骤包括响应于确定了所述目的地址是所述多个已知非法目的地址的一部分而发出警告或阻挡对所述目的地址的访问中的至少一个。
7.根据权利要求1的方法,其中所述目的地址是域名。
8.根据权利要求1的方法,其中所述目的地址是IP地址。
9.根据权利要求8的方法,其中所述通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否为合法地址的步骤包括比较该目的地址与多个已知IP地址,并且其中所述响应于所述确定执行第一功能的步骤包括响应于确定了该目的地址是所述多个已知IP地址的一部分而发出警告或阻挡对该目的地址的访问中的至少一个。
10.根据权利要求1的方法,其中所述目的地址是IP地址,并且其中所述通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否是合法地址的步骤包括执行该IP地址的反向查找以确定该IP地址的域名,并比较该域名与至少一个已知域名。
11.根据权利要求10的方法,其中所述比较所述域名与至少一个已知域名的步骤包括确定所述域名是否是所述至少一个已知域名的欺骗性变换。
12.根据权利要11的方法,其中所述欺骗性变换包括视觉混淆。
13.根据权利要求12的方法,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
14.根据权利要求12的方法,其中所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
15.根据权利要求11的方法,其中所述欺骗性变换包括顶级域的替换。
16.根据权利要求11的方法,其中所述确定所述域名是否是所述至少一个已知域名的欺骗性变换的步骤包括确定所述域名和所述至少一个已知域名之间的相似性值是否超过一预定值。
17.根据权利要求16的方法,其中所述相似性值是基于所述域名和所述至少一个已知域名之间的最长共同序列确定的。
18.根据权利要求1的方法,其中所述目的地址是一具有显示文本的超链接的目的地址,并且其中所述通过比较所述目的地址与至少一个已知目的地址来确定所述目的地址是否为合法地址的步骤包括比较所述超链接的目的地址与所述超链接的显示文本。
19.根据权利要求18的方法,其中所述比较所述超链接的目的地址与所述超链接的显示文本的步骤包括确定所述目的地址是否是所述显示文本的欺骗性变换。
20.根据权利要求19的方法,其中所述欺骗性变换包括视觉混淆。
21.根据权利要求19的方法,其中所述欺骗性变换包括顶级域的替换。
22.根据权利要求19的方法,其中所述确定所述目的地址是否是所述显示文本的欺骗性变换的步骤包括确定所述域名和所述显示文本之间的相似性值是否超过一预定值。
23.根据权利要求22的方法,其中所述相似性值是基于所述域名和所述显示文本之间的最长共同序列确定的。
24.根据权利要求1的方法,其中所述第一功能包括响应于确定了所述目的地址是所述显示文本的欺骗性变换而发出警告或阻挡对该目的地址的访问中的一个。
25.根据权利要求1的方法,其中所述目的地址是IP地址,并且其中所述通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否是合法地址的步骤包括确定该IP地址是否包括与所述至少一个已知目的地址相关联的至少一个IP地址。
26.根据权利要求1的方法,其中所述通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否是合法地址的步骤包括确定该目的地址是否是所述至少一个已知目的地址的欺骗性变换。
27.根据权利要求26的方法,其中所述至少一个已知地址是多个已知地址的一部分,并且其中所述响应于所述确定执行第一功能的步骤包括响应于确定了所述目的地址是所述至少一个已知地址的诚实变换而将该目的地址添加到所述多个已知地址中。
28.根据权利要求26的方法,其中所述至少一个已知地址是多个已知地址的一部分,并且进一步包括远程存储所述多个已知地址。
29.根据权利要求26的方法,其中所述至少一个已知地址是多个已知地址的一部分,并且进一步包括本地存储所述多个已知地址。
30.一种注册域名的方法,该方法包括以下步骤比较该域名与多个已知名称;确定该域名是否是所述多个已知名称中任何一个的欺骗性变换;以及如果该域名不是所述多个已知名称中任何一个的欺骗性变换,则允许注册该域名。
31.根据权利要求30的方法,其中所述多个已知名称是商标和服务商标的数据库。
32.根据权利要求30的方法,其中所述多个已知名称是已注册域名的数据库。
33.根据权利要求30的方法,其中所述欺骗性变换包括视觉混淆。
34.根据权利要求33的方法,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
35.根据权利要求33的方法,其中所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
36.根据权利要求30的方法,其中所述欺骗性变换包括顶级域的替换。
37.根据权利要求30的方法,其中所述确定所述域名是否是所述多个已知名称中任何一个的欺骗性变换的步骤包括确定所述域名和所述多个已知名称中任何一个之间的相似性值是否超过一预定值。
38.根据权利要求37的方法,其中所述相似性值是基于所述域名和所述多个已知域名之间的最长共同序列确定的。
39.一种识别欺骗性域名变换的方法,该方法包括以下步骤比较一域名与至少一个已知名称;以及确定该域名是否包括与所述至少一个已知名称的视觉混淆。
40.根据权利要求39的方法,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
41.根据权利要求39的方法,其中所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
42.根据权利要求39的方法,其中所述至少一个名称是从商标和服务商标的数据库中选择的。
43.根据权利要求39的方法,其中所述至少一个名称是从已注册域名的数据库中选择的。
44.根据权利要求39的方法,其中所述至少一个名称包括与所述域名相关联的显示名称。
45.一种用于处理目的地址的计算机程序产品,该计算机程序产品包括具有包含于其中的计算机可读程序代码的计算机可读介质,该计算机可读程序代码包括被配置为通过比较该目的地址与至少一个已知目的地址来确定该目的地址是否为合法地址的计算机可读程序代码;以及被配置为响应于所述确定执行第一功能的计算机可读程序代码。
46.根据权利要求45的计算机程序产品,其中所述被配置为通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否为合法地址的计算机可读程序代码包括被配置为确定该目的地址是否为该至少一个已知目的地址的诚实变换的计算机可读程序代码。
47.根据权利要求45的计算机程序产品,其中所述至少一个已知目的地址是多个已知合法目的地址中的一个。
48.根据权利要求45的计算机程序产品,其中所述至少一个已知目的地址是多个已知非法目的地址中的一个。
49.根据权利要求45的计算机程序产品,其中所述目的地址是域名。
50.根据权利要求45的计算机程序产品,其中所述目的地址是IP地址。
51.根据权利要求45的计算机程序产品,其中所述目的地址是IP地址,并且其中所述被配置为通过比较该目的地址与至少一个已知目的地址来确定该目的地址是否是合法地址的计算机可读程序代码包括被配置为执行所述IP地址的反向查找以确定该IP地址的域名的计算机可读程序代码,以及被配置为比较该域名与至少一个已知域名的计算机可读程序代码。
52.根据权利要求51的计算机程序产品,其中所述被配置为比较所述域名与至少一个已知域名的计算机可读程序代码包括被配置为确定该域名是否为所述至少一个已知域名的欺骗性变换的计算机可读程序代码。
53.根据权利要求52的计算机程序产品,其中所述欺骗性变换包括视觉混淆。
54.根据权利要求53的计算机程序产品,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
55.根据权利要求53的计算机程序产品,其中所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
56.根据权利要求52的计算机程序产品,其中所述欺骗性变换包括顶级域的替换。
57.根据权利要求52的计算机程序产品,其中所述被配置为确定所述域名是否是所述至少一个已知域名的欺骗性变换的计算机可读程序代码包括被配置为确定所述域名和所述至少一个已知域名之间的相似性值是否超过一预定百分比的计算机可读程序代码。
58.根据权利要求57的计算机程序产品,其中所述相似性值是基于所述域名和所述至少一个已知域名之间的最长共同序列确定的。
59.根据权利要求45的计算机程序产品,其中所述目的地址是一具有显示文本的超链接的目的地址,并且其中所述被配置为通过比较所述目的地址与至少一个已知目的地址来确定所述目的地址是否为合法地址的计算机可读程序代码包括被配置为比较所述超链接的目的地址与所述超链接的显示文本的计算机可读程序代码。
60.根据权利要求59的计算机程序产品,其中所述被配置为比较所述超链接的目的地址与所述超链接的显示文本的计算机可读程序代码包括被配置为确定所述目的地址是否是所述显示文本的欺骗性变换的计算机可读程序代码。
61.根据权利要求60的计算机程序产品,其中所述欺骗性变换包括视觉混淆。
62.根据权利要求60的计算机程序产品,其中所述欺骗性变换包括顶级域的替换。
63.根据权利要求60的计算机程序产品,其中所述被配置为确定所述目的地址是否是所述显示文本的欺骗性变换的计算机可读程序代码包括被配置为确定所述域名和所述显示文本之间的相似性值是否超过一预定百分比的计算机可读程序代码。
64.根据权利要求63的计算机程序产品,其中所述相似性值是基于所述域名和所述显示文本之间的最长共同序列确定的。
65.根据权利要求45的计算机程序产品,其中所述目的地址是IP地址,并且其中所述被配置为通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否是合法地址的计算机可读程序代码包括被配置为确定该IP地址是否在与所述多个已知目的地址中至少一个相关联的IP地址的范围内的计算机可读程序代码。
66.根据权利要求45的计算机程序产品,其中所述被配置为通过比较所述目的地址与至少一个已知目的地址来确定该目的地址是否为合法地址的计算机可读程序代码包括被配置为确定所述目的地址是否是所述至少一个已知目的地址的欺骗性变换的计算机可读程序代码。
67.根据权利要求66的计算机程序产品,其中所述至少一个已知地址是多个已知地址的一部分,并且其中所述被配置为响应于所述确定执行第一功能的计算机可读程序代码包括响应于确定了所述目的地址是所述至少一个已知地址的诚实变换而将该目的地址添加到所述多个已知地址中的计算机可读程序代码。
68.根据权利要求66的计算机程序产品,其中所述至少一个已知地址是多个已知地址的一部分,并且进一步包括被配置为远程存储所述多个已知地址的计算机可读程序代码。
69.根据权利要求66的计算机程序产品,其中所述至少一个已知地址是多个已知地址的一部分,并且进一步包括被配置为本地存储所述多个已知地址的计算机可读程序代码。
70.一种用于注册域名的计算机程序产品,该计算机程序产品包括具有包含在其中计算机可读程序代码的计算机可读介质,该计算机可读程序代码包括被配置为比较该域名与多个已知名称的计算机可读代码;被配置为确定该域名是否是所述多个已知名称中任何一个的欺骗性变换的计算机可读程序代码;以及被配置为如果该域名不是所述多个已知名称中任何一个的欺骗性变换,则允许注册该域名的计算机可读程序代码。
71.根据权利要求70的计算机程序产品,其中所述多个已知名称是商标和服务商标的数据库。
72.根据权利要求70的计算机程序产品,其中所述多个已知名称是已注册域名的数据库。
73.根据权利要求70的计算机程序产品,其中所述欺骗性变换包括视觉混淆。
74.根据权利要求73的计算机程序产品,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
75.根据权利要求73的计算机程序产品,其中所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
76.根据权利要求70的计算机程序产品,其中所述欺骗性变换包括顶级域的替换。
77.根据权利要求70的计算机程序产品,其中所述被配置为确定所述域名是否是所述多个已知名称中任何一个的欺骗性变换的计算机可读程序代码包括被配置为确定所述域名和所述多个已知名称中任何一个之间的相似性值是否超过一预定值的计算机可读程序代码。
78.根据权利要求77的计算机程序产品,其中所述相似性值是基于所述域名和所述多个已知域名之间的最长共同序列确定的。
79.用于识别欺骗性域名变换的计算机程序产品,该计算机程序产品包括具有包含在其中计算机可读程序代码的计算机可读介质,该计算机可读程序代码包括被配置为比较一域名与至少一个已知名称的计算机可读程序代码;以及被配置为确定该域名是否包括与所述至少一个已知名称的视觉混淆的计算机可读程序代码。
80.根据权利要求79的计算机程序产品,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
81.根据权利要求79的计算机程序产品,其中所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
82.根据权利要求79的计算机程序产品,其中所述至少一个名称是从商标和服务商标的数据库中选择的。
83.根据权利要求79的计算机程序产品,其中所述至少一个名称是从已注册域名的数据库中选择的。
84.根据权利要求79的计算机程序产品,其中所述至少一个名称包括与所述域名相关联的显示名称。
85.一种系统,包括被配置为通过比较目的地址与至少一个已知目的地址来确定该目的地址是否为合法地址的第一模块;以及被配置为响应于所述确定执行第一功能的第二模块。
86.根据权利要求85的系统,其中所述第一模块被配置为确定所述目的地址是否是所述至少一个已知目的地址的诚实变换。
87.根据权利要求85的系统,其中所述至少一个已知目的地址是多个已知合法目的地址中的一个。
88.根据权利要求85的系统,其中所述至少一个已知目的地址是多个已知非法目的地址中的一个。
89.根据权利要求85的系统,其中所述目的地址是域名。
90.根据权利要求85的系统,其中所述目的地址是IP地址。
91.根据权利要求85的系统,其中所述目的地址是IP地址,并且其中所述第一模块被配置为执行所述IP地址的反向查找以确定该IP地址的域名,以及比较该域名与至少一个已知域名。
92.根据权利要求91的系统,其中所述第一模块被配置为确定所述域名是否是所述至少一个已知域名的欺骗性变换。
93.根据权利要求92的系统,其中所述欺骗性变换包括视觉混淆。
94.根据权利要求93的系统,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
95.根据权利要求94的系统,其中所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
96.根据权利要求92的系统,其中所述欺骗性变换包括顶级域的替换。
97.根据权利要求92的系统,其中所述第一模块被配置为确定所述域名和所述至少一个已知域名之间的相似性值是否超过一预定值。
98.根据权利要求97的系统,其中所述相似性值是基于所述域名和所述至少一个已知域名之间的最长共同序列确定的。
99.根据权利要求85的系统,其中所述目的地址是一具有显示文本的超链接的目的地址,并且其中所述第一模块被配置为比较所述超链接的目的地址与所述超链接的显示文本。
100.根据权利要求99的系统,其中所述第一模块被配置为确定所述目的地址是否是所述显示文本的欺骗性变换。
101.根据权利要求100的系统,其中所述欺骗性变换包括视觉混淆。
102.根据权利要求99的系统,其中所述欺骗性变换包括顶级域的替换。
103.根据权利要求99的系统,其中所述第一模块被配置为确定所述域名和所述显示名称之间的相似性值是否超过一预定值。
104.根据权利要求103的系统,其中所述相似性值是基于所述域名和所述显示名称之间的最长共同序列确定的。
105.根据权利要求85的系统,其中所述目的地址是IP地址,并且其中所述第一模块被配置为确定该IP地址是否在与所述多个已知目的地址中至少一个相关联的IP地址的范围内。
106.根据权利要求85的系统,其中所述第一模块被配置为确定所述目的地址是否是所述至少一个已知目的地址的欺骗性变换。
107.根据权利要求106的系统,其中所述至少一个已知地址是多个已知地址的一部分,并且其中所述第二模块被配置为响应于确定了所述目的地址是所述至少一个已知地址的诚实变换而将该目的地址添加到所述多个已知地址中。
108.根据权利要求106的系统,其中所述至少一个已知地址是多个已知地址的一部分,并进一步包括被配置为远程存储所述多个已知地址的第三模块。
109.根据权利要求106的系统,其中所述至少一个已知地址是多个已知地址的一部分,并进一步包括被配置为本地存储所述多个已知地址的第三模块。
110.根据权利要求85的系统,其中该系统是web浏览器的一部分。
111.根据权利要求85的系统,其中该系统是电子邮件程序的一部分。
112.根据权利要求85的系统,其中该系统是DNS服务器的一部分。
113.根据权利要求85的系统,其中所述第二模块是所述第一模块的一部分。
114.一种用于注册域名的系统,包括用于比较该域名与多个已知名称,并确定该域名是否是所述多个已知名称中任何一个的欺骗性变换的第一模块;以及用于如果该域名不是所述多个已知名称中任何一个的欺骗性变换,则允许注册该域名的第二模块。
115.根据权利要求114的系统,其中所述多个已知名称是商标和服务商标的数据库。
116.根据权利要求114的系统,其中所述多个已知名称是已注册域名的数据库。
117.根据权利要求114的系统,其中所述欺骗性变换包括视觉混淆。
118.根据权利要求117的系统,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
119.根据权利要求118的系统,所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
120.根据权利要求114的系统,其中所述欺骗性变换包括顶级域的替换。
121.根据权利要求114的系统,其中所述第一模块被配置为确定所述域名和所述多个已知名称中任何一个之间的相似性值是否超过一预定值。
122.根据权利要求121的系统,其中所述相似性值是基于所述域名和所述多个已知域名之间的最长共同序列确定的。
123.一种用于识别欺骗性域名变换的系统,该系统包括被配置为比较一域名与至少一个已知名称并确定该域名是否包括与所述至少一个已知名称的视觉混淆的第一模块。
124.根据权利要求123的系统,其中所述视觉混淆包括字母数字到字母数字的视觉混淆。
125.根据权利要求124的系统,所述视觉混淆包括数字1替换字母L、字母L替换数字1、数字0替换字母O、字母O替换数字0、数字0替换字母o、字母o替换数字0、数字8替换字母B、字母B替换数字8、数字8替换字母S、字母S替换数字8、数字8替换字母E、字母E替换数字8、数字3替换字母E、字母E替换数字3、数字7替换字母F、字母F替换数字7、数字1替换字母I、字母I替换数字1、数字1替换字母i、字母i替换数字1、字母n替换字母m、和字母m替换字母n中的至少一个。
126.根据权利要求123的系统,其中所述至少一个名称是从商标和服务商标的数据库中选择的。
127.根据权利要求123的系统,其中所述至少一个名称是从已注册域名的数据库中选择的。
128.根据权利要求123的系统,所述至少一个名称包括与所述域名相关联的显示名称。
全文摘要
处理目的地址以确定该目的地址是否是伪造的Web地址或超链接。可将该目的地址与已知域名的数据库相比较以了解该域名是合法的还是非法的。也可将该目的地址与其他域名相比较以了解它是其他域名的诚实变换还是欺骗性变换。如果该目的地址是另一域名的欺骗性变换,则可采取适当行动。
文档编号H04L12/24GK1760872SQ20051011274
公开日2006年4月19日 申请日期2005年10月12日 优先权日2004年10月13日
发明者J·M·莱克 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1