关键词的处理系统和方法以及储存其执行程序的储存媒体的制作方法

文档序号:6457041阅读:206来源:国知局
专利名称:关键词的处理系统和方法以及储存其执行程序的储存媒体的制作方法
技术领域
本发明涉及一种^f吏用网络信息处理关^^建词的方法和系统。
背景技术
业已公开了 一种处理本机语言互联网地址的方法,当以关键:字形式输入本机语言互联网地址以访问该互联网网站时,客户计算器可访问对应的网页。该方法的实施例业已由本专利申请的申
请人所提交的韩国专利第317059号中揭示。更具体地说,该专利揭示了 一种代理模块在域名系统(DNS)服务器中安装方法以及另一种本机语言处理程序在客户计算器上安装方法。
然而,使用者通常不喜欢在他们的计算器上安装插入式程序以处理作为本机语言互联网地址的输入关4建词,并且该插入式程序可能影响计算器的使用,例如,当执行其它程序时使计算速度减慢。
再者,网络管理员不喜欢对DNS服务器本身变址,并且当在DNS服务器出现故障时可能出现互联网服务故障。
再者,当将一值输入到一些客户端网络浏览器的地址窗口及搜寻窗口,该网络浏览器将所输入的值转变成相同的查询并传输该查询。这些网络浏览器仅仅传输主机名,即域名,当传输查询到DNS服务器时分成两个。例如,将"yahoo"输入到地址窗口及搜寻窗口。当该查询为"http:〃search.msn.com/results.aspx qzyahoo&FORM:QBRE,,及"http:〃search.msn.com/results.aspx q=yahoo&FORM=I7AW,,时,"search.msn.com,,对应于主机名,即域名,仅统 一 资源定位器(URL)传输到DNS服务器。因此,不可能在输入地址窗口的值以及输入搜寻窗口的值之间加以区别。

发明内容
考虑到上述的问题,本发明的目的在于在输入到地址窗口的值以及输入到搜寻窗口的值之间作区别以4巴输入到地址窗口的值处理成为本机语言互联网地址,以及在这情况下,在网络上提供经由网络传输查询的接收方法以及把该查询处理成为本机语言互联网i也址。
本发明的另一目的是在不需要对任何客户系统或域名系统(DNS)服务器等等进行修改或对其增设任何系统的情况下处理关键词。
本发明的又一 目的是透过在网络上接收经由网络传输的数据,以数据端口、网际协议(IP)地址等等为基础进行数据区别以及粗略过滤额外需要关键词处理的查询数据使网络流通量的负载减到最小。
为了达到上述的目的,根据本发明的第一方面, 一种使用网络信息处理关键词的系统,藉此,在网络上接收及处理从客户终端传输来的网络信息,该系统包括标识符数据库,其用于储存至少一输入存储单元标识符;以及查询确定装置,其用于接收从客户终端传输来的网络信息之中的超文本传输协议(HTTP)查询、
确定储存在标识符数据库中的输入存储单元标识符是否在该HTTP查询的标题的统 一 资源信息(URI)中存在以及确定当储存在标识符数据库中的输入存储单元标识符在该HTTP查询的标题的URI中存在时,该HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关4建词查询。
根据本发明的第二方面, 一种使用网络信息处理关键词的系统,藉此,在网络上接收及处理从客户终端传输到特定服务器的网络信息,该系统包括主机信息数据库,其用于将信息储存在至少一主机上;以及查询确定装置,其用于接收从客户终端传输到特定服务器的网络信息之中的HTTP查询、确定该HTTP查询的标题的主机信息是否储存在该主机信息数据库中,以及确定当该HTTP查询的标题的主机信息储存在该主机信息数据库中时,该HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关4建词查询。
该系统可进一步包括网络信息检索工具,其用于确定从客户终端传输到特定服务器的网络信息为HTTP查询以及当该网络信息的标题的目的端口数据适合于HTTP查询时,将该网络信息传输到该查询确定装置。
该系统可进一步包括IP数据库,其用于储存至少一 IP地址;以及网络信息检索工具,其用于确定从客户终端传输到特定服务器的网络信息的标题的目的IP地址是否储存于该IP数据库中,以及当该网络信息的标题的目的IP地址储存于该IP数据库中时,将该网络信息传输到该查询确定装置。这里,该查询确定装置可确定当由该网络信息检索工具传输的网络信息的标题的目的端口数据适合于HTTP查询时,该网络信息为HTTP查询。
根据本发明的第三方面, 一种使用网络信息处理关键词的系统,藉此,在网络上接收及处理从客户终端传输到特定服务器的网络信息,该系统包括后缀/域数据库,其用于储存特定后缀或特定域;以及查询确定装置,其用于接收从客户终端传输到特定服务器的网络信息之中的DNS查询,以及确定当储存在该后缀/
域数据库中的特定后缀或特定域包括在该DNS查询时,该DNS查询是关于输入到客户端网络浏览器的地址窗口中的关键词查询。
根据本发明的第四方面, 一种使用网络信息处理关键词的系
网络信息,该系统包括域标识符数据库,其用于储存表示域名的标识符;以及查询确定装置,其用于接收从客户终端传输到特定服务器的网络信息之中的DNS查询,确定储存在域标识符数据库中的标识符是否包括在该DNS查询的查询现场数据中,以及确定当储存在域标识符数据库中的标识符不包括在该D N S查询的查询现场数据中时,该DNS查询是关于输入到客户端网络浏览器的地址窗口中的关4建词查询。
根据本发明的第五方面, 一种使用网络信息处理关键词的方法,藉此,在网络上接收及处理从客户终端传输到特定服务器的网络信息,该方法包括以下步骤接收从客户终端传输到客户服务器的网络信息之中的HTTP查询;确定储存在包括至少一标识符的标识符数据库中的输入存储单元标识符是否在该HTTP查询中存在,及确定当储存在标识符数据库中的输入存储单元标识符在该HTTP查询中存在时,该HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关4走词查询;以及为响应该HTTP查询向客户终端传输IP或本机语言互联网地址(NLIA)服务器的统一资源定位器(URL)或搜寻服务器,该NLIA服务器回送IP地址或URL对应的特定关键词以及该搜寻服务器回送特定关键词的搜寻结果。根据本发明的第六方面,本发明提供了 一种储存实施上述的关键词的处理方法的程序的记录媒体。可以计算器编码的方式在计算器可读记录媒体中实施根据本发明的 一 种实施例的关键词的
处理方法。该计算器可读记录媒体可为任何记录装置,其储存可由计算器系统读取的数据。例如,该计算器可读记录媒体可为只
读存储器(ROM)、随机存储器(RAM)、光盘只读存储器(CD-ROM)、磁带、硬盘、软盘、移动储存装置、非易失性存储器(快速存储器)、光学数据储存装置等等。还有,该记录媒体可为载波,例如,在互联网上传送。
术语"文本串"表示了每种可输入到网络浏览器的地址窗口或搜寻窗口的输入信息。该术语包括普通的URLs、关键词,例如,除URLs之外的韩国文文本、英文文本及数字等等。
术语"URL"表示了目录、档案等,以及域名,例如,"/htm/index.html",指出由与互联网连接的计算器系统所提供的各种信息的地址。
术语"IP地址"表示了连接到互联网的计算器系统的实际地址以互相进行识别并且符合网际协议第四版(Ipv4)少见定、网际协议第六版(Ipv6)规定等等。
根据现有技术,输入到搜寻窗口的值与输入到地址窗口的值具有相同域。因此,仅使用DNS服务器,当使用输入到该地址窗口的值来处理本机语言互联网地址时,不可能将输入地址窗口的值及输入搜寻窗口的值区别开。然而,根据本发明的关键词处理方法,在网络上接收及处理该值可有效地解决现有的问题。
再者,与现有技术仅容许在客户终端上安装插入式程序来处理本机语言互联网地址不同,本机语言互联网地址于数据流聚集的位置进行处理。因而,许多终端可同时处理本机语言互联网地址。
此外,在不需要修改客户的系统或DNS服务器等,或对其增 设系统的情况下可处理本机语言互联网地址。因而,有可能减少
负载以及用户或DNS服务器管理员的不情愿并提供稳定的服务。 另外,根据本发明的实施例,在网络上接收经由网络传输的 数据,粗略地过滤需要第一处理的数据,并且藉此可显着地减少 处理负载。因而,虽然使用网络通信,有可能保持该网络通信平
矛急i也i乾动。


图1为提供整个互联网服务系统的方框图,该系统使用根据
本发明的实施例的关键词的处理系统;
图2为根据本发明的实施例的关键词的处理系统的方框图, 图3为根据本发明的实施例的图2的关键词的处理系统的方框图; 以及
图4至图7为根据本发明的实施例的关键词的处理方法的流 程图。
具体实施例方式
以下将参照附图详细地^又述本发明的实施例。在以下的详细 叙述中,功能根据服务器、客户终端等分类及叙述,但有需要时, 功能可由另一之器件实施。
图1为提供整个互联网服务系统的方框图,该系统使用根据 本发明的实施例的关键词的处理系统。
如图l所示,在每一住宅安装的个人计算器(PC)系统10及公司/代理计算器系统12经由在预定机构,例如学校或公司中设立的
局域网(LAN),通过访问网络,例如,公共交换电话网(PSTN)/综 合服务数字网(ISDN)22、数字用户线路(xDSL)24、无线网络26或 类似混合光纤同轴(HFC)电缆的租用线28访问路路由器30 ,连接 到互联网。该路由器30通过关键词处理系统40访问互联网服务 提供商(ISP)50。
如图1所示,关键词处理系统40为该路由器30与该ISP50 之间的单独系统,但亦可以包括在该路由器30或该ISP50中。再 者,该关键词处理系统40主要用于在网络上接收及处理从该路由 器30或网络集线器经由网络传输的数据,在该网络集线器数据经 由互联网传输及聚集。因此,该关键词处理系统40可安装在任何 能够达到这样的目的的地方。
以下将详细叙述该关键词处理系统40的功能。该关键词处理 系统40可使用镜像方法或代理方法接收通过网络传输的数据。
(1) 镜像方法
该镜像方法为于网络切换,例如,层7(L7)切换等时复制数据, 以及使用该网络流通量作观察等等的方法。这里,该网络切换使 用了特定端口。当包镜像使用切换器功能来执行时,许多负载可 能放置在该切换器上,并因而可使用网络分接头。
根据该镜像方法,当原始的数据以传统方法传输的时候对复 制数据进行处理。因而,有可能避免使用互联网的麻烦和甚至当 在处理过程中发生问题时避免处理的延迟。
(2) 代理方法
该代理方法为在网络的中间安装附加代理设备,并藉此,仅 当数据通过该代理服务器时进行下一个步骤的方法。因为仅当数据完全由代理服务器处理后才可进行下一个步骤,这可确保了数 据的处理。
根据本实施例,网络信息检索工具监控透过该镜像方法或该 代理方法传输的网络数据。然而,当有大量的数据需要进行监控 时,会在处理该数据的关键词处理系统40中有相当大的负载。在
这情况下,可使整个网络慢下来,或使该关键词处理系统40的处 理效果降低。因此,优选的是只区别及处理必要的数据。
可首先对附加到数据的各种标题进行分析,以根据该数据是 否从特定服务器传输来、使用甚么种类的通信协议、该数据是否 为一种响应或一种查询等等来区别待处理的数据。其次,可确定 该数据是否为关键词。再者,有可能直接确定在没有该第一区别 处理的情况下该数据是否是关键词,以及还可进行各种改进。
图2为根据本发明的实施例的关键词的处理系统的方框图, 及图3为根据本发明的实施例的图2的关键词的处理系统的方框 图。
客户终端100在网络通路上与关键词处理系统40连接。关键 词处理系统40通过互联网60分别与域名系统(DNS)及本才几语言互 联网地址(NLIA)服务器200连接。必要时,该关4定词处理系统40 可访问搜寻服务器300。
根据该关键词处理系统40的构成,该关键词处理系统40包 括查询确定装置44以及数据库46,并且可进一步包括网络信息检 索工具42。
在详细叙述使用网络数据来处理关键词的方法之前,将会叙 述网络数据层以及各个标题。
协议组例如传输控制协议/网际协议(TCP/IP)由多层协议组 成,并且如以下的表l所示,TCP/IP通常由四层组成。表1
应用层远程通信网、文件传输协议(FTP)、电子邮件等
传输层传输控制协议(TCP)、用户数据报协议(UDP)
网络层网际协议(IP)、网间控制报文协议(ICMP)、互联网组 管理协调议(IGMP)
链路层装置驱动程序、网络信息中心(NIC)
在应用层中执行用于实际通信的详细功能。当由应用层所产 生的用户数据通过传输层的时候,将网络层及链路层、各个层的 数据加入到用户数据中。结果,构成完整的通信数据,即以太网 帧(见表2)。
表2
用户数据
标题用户l史寸居
TCP(UDP)标题应用数据
IP标题TCP(UDP)标题应用数据
以太网标题
IP标题
TCP(UDP)标题
应用数据
以太网尾部
《-
-以太网帧-
以这样方式构成的以太网标题包括媒体访问控制(MAC)地 址,该MAC地址为目的及源局域网(LAN)卡的硬件地址。IP标题 包括目的及源的IP地址、协议种类等。TCP(用户数据报协议(UDP)) 标题包括在相应的服务的通信端口上的信息。应用数据为实际通信数据并且包括表示该通信数据的种类和 特征的标题区。
众所周知的端口 1至1023,例如,超文本传输协议(HTTP): 80、文件传送协议(FTP):23、远程通信网21、邮局协议第3版 (POP3): 110等等,主要用作TCP或UDP通信的服务端口 ,而不 是任意的通信端口。因而,当对TCP(UDP)标题进行分析以得到服 务端口信息时,在不需要分析整个通信数据的情况下,有可能使 用众所周知的端口来得知数据的种类。例如,当TCP标题的目的 端口号为53时,相应的数据为DNS查询。另一方面,当TCP标 题的目的端口号为80时,相应的数据为HTTP查询。
以下将详细叙述确定所输入的文本串是否为用传输网络信息 的关键词查询。
<根据HTTP查询的标题的统 一 资源信息(URI)来确定>
查询确定装置44在从客户终端100传输来的网络信息之中接 收HTTP查询。然后,该查询确定装置44确定储存在标识符数据 库4 6 a中的输入存储单元标识符是否在该HT TP查询的标题的URI 中存在,以及确定该HTTP查询是关于输入到客户端网络浏览器 的地址窗口中的关4建词查询。
以下将叙述输入存储单元标识符。当除普通的URL查询之外 的文本串,例如关键词,输入到例如,Internet Explorer 7.0的地 址窗口时,该文本串转变成查询并且传输到搜寻服务器。这里, 将输入到该网络浏览器的地址窗口中的文本串转变成查询并传输 该查询的搜寻服务器300的域设定成与将输入到网页的搜寻窗口 中的搜寻字转变成查询并传输该查询的搜寻服务器300的相同。
更具体地说,当关键词,例如"^3苕",输入到Internet Explorer 7.0的地址窗口时,它#皮转变成查询
http:〃search.live.com/results.aspx q=%ED%8A%B9%ED%97%88%EC%B2o/。AD&mkt:en-us。/oFORMK)PNSCH"并进行处理(search.live.com的IP 地址为"211.196.154.198"。
再者,甚至当相同的关键词""3S"输入到搜寻窗口时,它 #皮转变成类似的查询
"http:〃search.live.com/results.aspx q=%ED%8A%B9%ED%97%88%EC% B2。/。AD&mk^en-US。/()fom^QBRE"并进行处理。在这两种情况下,均 传车lr相同的主才几信息"http:〃search.live.com"。
两种情况的查询彼此均非常类似但具有不同部分,即 "OPNSCH"及"QBRE"。因而,该部分储存为在该标识符数据库46a 中的标识符,以及该查询确定装置44确定储存在标识符数据库46a 中的输入存储单元标识符是否在该HTTP查询的标题的URI中存 在。当储存在标识符数据库46a中的输入存储单元标识符在该 HTTP查询的标题的URI中存在时,该查询确定装置44确定该 HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关键: 词查询。
因此,储存在标识符数据库46a中的输入存储单元标识符为 文本串,用其可确定关键词是否为输入到客户端网络浏览器的地 址窗口或搜寻窗口的文本串。该输入存储单元标识符会因应搜索 引擎而有所不同,并且由系统构建者或管理员预先选择以构成该 标识符lt据库46a。
同时,URI、主机信息等也包括在HTTP查询的标题中。再者, 数据,例如"接受(Accept)"、"编码(Encoding)","主机(Host)"等均 以"字段名信息"的形式记录在以"方法(Method)(空间 (space))URI(空间(space))版本(Version)"的形式的信息之后。因而, 可将URI节区别为在HTTP标题之间的两个空间的值。除此之外, 因为主机信息节以"主机(HOST):..."的形式,可探测以"主机 (HOST):"开始的部分来区别该主机信息节。这里,"方法(Method)"
18为信息,例如"GET"、 "POST"等等,以及"版本(Version),,为信息, 例如"HTTP/ l.l"等等。表3示出了 HTTP标题的例子。 表3
超文本传输协议
' GET /results.邵)^,m^^8從B^^8y:t:eii-us&FORM《PNSCH HTTP/l.l\r\n
Revest URI: /results. a5p)( q3EC幼7从8SEB铋ra8加kt-en-usSF0RM《PNSCH Request version:
Acc印t: i阔e/gif, image/x-xbitmap, imags/jp叫i,/p〗p叫柳lication/x曙shod柳e-flash, appli( Arapt-La,age: ko\r\n
Accept隱Encod化g: gzip, deflate\r\n
user-Agem:刚"'lla/4.0 (oipan'ble; msie 7.0; widows mt 5.1; .net clr 1.1.4322)\r\n 匿search,live.一rVi Connection: Ke印-AliveVVi
[OOkle: SFOIfWPNSCH; AFORMsOPNSCH; SRCHUIl>V=liGUID=F5B7BDl5249lM89FAC4167Dl9A0833B3; SRCHUSR=WJ.
\r\n
例如,在表3的HTTP标题lt据中,URI为"/results.aspx q= %EC%B7%A8%EB%AF&B8&mkt=en-us&FORM=OPNSH,、:>(及主机信息 为"search.live.com"。
<根据HTTP查询的标题的URI来确定>
该查询确定装置44在主机信息数据库46c中的至少一主机上 储存信息。该查询确定装置44在从客户终端传输来的网络信息之 中接收HTTP查询并且确定包括在该HTTP查询中的主机信息是 否储存在该主机信息数据库46c中。当包括在该HTTP查询中的 主机信息储存在该主机信息数据库46c中时,该查询确定装置44 确定该HTTP查询是关于输入到客户端网络浏览器的地址窗口中 的关4建词查询。
例如,在Internet Explorer 6中,除普通的DNS形式之外,关键 词#L转变成包括"auto.search.msn.com"的查询,以及除地址窗口之夕卜,输入到搜寻窗口中的值使用包括"search.msn.com"的另 一 查询。因 而,当"auto.search.msn.com"包括在主才几信息中时,可确定关#:词#皮 输入到地址窗口中。在这情况下,只有输入到客户端网络浏览器 的地址窗口中的关4建词会转变为包括"auto.search.com"的查询,因而 不需要服务器标识符。该主机信息数据库46c的信息也是由系统 构建者或管理员构成。
在该主机信息数据库46c中,储存有表示特定服务器,例如 "auto.search.msn.com", 的主机信息。
以上所叙为根据HTTP查询的标题的URI的确定方法以及根 据HTTP查询的标题的主机信息的确定方法,但有可能使用URI 和主机信息两者。换句话说,该标识符数据库46a可储存至少一 输入存储单元标识符以及还可储存与该输入存储单元标识符匹配 的主机信息。更具体地说,首先该查询确定装置44确定HTTP查 询的标题的主机信息是否储存在该标识符数据库46a中。其次该 查询确定装置44确定当HTTP查询的标题的主机信息确定储存在 该标识符数据库46a中时,所储存的并与主机信息匹配的输入存 储单元标识符是否在该URI中存在。当该输入存储单元标识符在 该URI中存在时,该查询确定装置44确定该HTTP查询是关于输 入到客户端网络浏览器中的关键词查询。
该关键词处理系统40可具有网络信息检索工具42。当从客户 终端传输来的主机信息的标题的目的端口数据适合于HTTP查询 时,该网络信息检索工具42可确定该网络信息为HTTP查询以及 传输该网络信息到该查询确定装置44。
再者,该数据库46可包括储存至少一 IP地址的IP数据库46b。 该网络信息检索工具4 2确定从客户终端10 0传输来的网络信息的 标题的目的IP地址是否储存于该IP数据库46b中,以及当该目的 IP地址储存于该IP数据库46b中时,将该网络信息传输到该查询确定装置44。该查询确定装置44可确定当由该网络信息检索工具 42传输来的网络信息的标题的目的端口数据适合于HTTP查询时, 该网络信息为HTTP查询。这里,包括在该IP数据库46b中的IP 地址为DNS服务器或特定服务器的IP地址,以及该IP数据库46b 由系统构建者或管理员构成。
<根据后缀/域名是否包括在DNS查询来确定>
该查询确定装置44在从客户终端100传输来的网络信息之中 接收DNS查询。当储存在后缀/域数据库46d中的特定域或标识符 包括在该DNS查询中时,该查询确定装置44确定该DNS查询是 关于输入到客户端网络浏览器的地址窗口中的关键词查询。
该关^^建词处理系统40可包括网络信息检索工具42,该网络信 息检索工具42确定当从客户终端100传输来的主机信息的标题的 目的端口it据适合于DNS查询时,该网络信息为DNS查询以及 传输该网络信息到该查询确定装置4 4 。
除了由DNS系统处理的正式的域名扩展之外,该后缀/域数据 库46d可储存至少一后缀。再者,该后缀/域数据库46d可储存特 定服务器的域名,例如"auto.search.msn.com",以确定特定月良务器所 指定的所有查询均为关键词。在动态主机配置协议(D H C P )服务器 通过DHCP分配IP地址的处理过程中,可将后缀分配给该客户终 端100。再者,当终端配置程序改变终端配置的时候,可将特定后 缀分配给该客户终端100。此外,也可根据用户的设定,将后缀分 配给该客户终端100。本申请人所提出的韩国专利申请第 10-2006-118640号中业已揭示了关于使用后缀数据库的实例的详 细描述。
<根据域标识符是否包括在DNS查询来确定> 该查询确定装置44在从客户终端100传输来的网络信息之中 接收DNS查询并且将表示域名的域标识符储存在域标识46e中。当关键词直接在DNS查询中传输时,该域标识符数据库 46e很有可能被使用。
该查询确定装置44在从客户终端100传输来的网络信息之中 接收DNS查询i且确定储存在域标识符数据库46e中的标识符是 否包括在该DNS查询的查询现场数据中。当储存在域标识符数据 库46e中的标识符不包括在该查询现场数据中时,该查询确定装 置44确定该DNS查询是关于输入到客户端网络浏览器的地址窗 口中的关4建词查询。
储存在域标识符数据库46e中的域标识符可为"."、"www"、 "http:〃,,以及通用顶级域(TLDs),例如".com"、 ".net"等等。根据使 用,例如"."来确定所输入的文本串是否是关键词的方法,可以确 定,当域标识符"."不包括在所输入文本串中时,该文本串是关键 词,以及可以确定,当域标识符"."包括在所输入文本串中时,该 文本串不是关键词。
区别在网络数据的第一分析中的待处理DNS查询,检查该数 据的内容以分析该数据是否具有特定形式,并且藉此可以确定该 DNS查询是否是关于关键词查询。
以下,如表4所示,DNS查询包括标题、问题栏、回答栏等 等,以及在这些之中的问题栏用于确定。
表4
标题QI^0(查询)
问题QNAME=^ 3智、QCLASS=IN、 QTYPE=A
回答<空>
权限<空>
补充A 创同时,该数据库46可额外具有储存至少一 IP地址的IP数据
库46b。该网络信息;险索工具42确定从客户终端IOO传输来的网 络信息的标题的目的IP地址是否储存于该IP数据库46b中。当该 目的IP地址储存于该IP数据库46b中时,该网络信息检索工具 42将该网络信息传输到该查询确定装置44,以及该查询确定装置 44确定当由该网络信息检索工具42传输来的网络信息的标题的 目的端口数据适合于DNS查询时,该网络信息为DNS查询。 <确定文本串是否是关键词之后的处理>
当该查询确定装置44确定HTTP查询或DNS查询是关于输 入到客户端网络浏览器的地址窗口中的关键词查询时,该查询确 定装置44为响应该HTTP查询或DNS查询向客户终端传输IP地 址或NLIA服务器200的URL,该NLIA服务器200回送IP地址 或URL对应于特定关键词或该搜寻服务器300回送特定关键词的 搜寻结果。
当该关键词处理系统40向客户终端100回送NLIA服务器200 的互联网地址时,该客户终端100接收该互联网地址并且使用该 所获得的互联网地址来访问该NLIA服务器200。
随后,该客户终端100把输入文本串的信息传输到该NLIA 服务器200。该NLIA服务器200接收该文本串并且处理对应于该 文本串的互联网地址。更具体地说,该NLIA服务器200首先搜寻 地址关4走词与互联网地址匹配的并且储存该地址关键词和该互联 网地址的NLIA数据库。
当与该文本串匹配的地址关键词在该NLIA数据库中存在时, 该N LIA服务器2 0 0将对应于该地址关键词的互联网地址回到客户 终端100。该客户终端100^f妄收该互联网地址以访问对应的网页。 在该NLIA数据库中,预先匹配及储存对应于该关键词的地址关键词和互联网地址。例如,将地址关键词"智2〖01 (BlueHouse)"和互 联网i也址"www.president.go.kr,,互相匹酉己及储存。
同时,当与该文本串匹配的地址关键词不在该NLIA数据库中 存在时,该NLIA服务器200将该文本串转变成向特定搜寻服务器 的搜寻查询并且将该搜寻查询传输到该客户终端100。该客户终端 100接收该搜寻查询并访问该特定搜寻服务器及对应的网页。
另外,当与该文本串匹配的地址关键词不在该NLIA数据库中 存在时,该NLIA服务器200可将特定搜寻服务器的互联网地址或 搜寻查询传输到该客户终端100。当该NLIA服务器200从该客户 终端100接收文本串时,该NLIA服务器200可将该文本串转变成
向特定搜寻服务器的搜寻查询并且将该搜寻查询传输到该客户终 端100。
当该关键词处理系统40将该搜寻服务器300的互联网地址回 到该客户终端100时,该客户终端100接收该互联网地址并使用 所获得的互联网地址来访问该搜寻服务器300。当该客户终端100 访问该搜寻服务器300时,该客户终端IOO提供了对应于该输入 文本串(关键词)的搜寻表。
同时,当该查询确定装置44响应传输到特定服务器的HTTP 查询或DNS查询时,该查询确定装置44向该客户终端100、该特 定服务器或该客户终端100及该特定服务器传输对应于该查询的 重设信号。该重设信号可被视为终止该客户终端100与该特定服 务器之间的通信的连接关闭指令。在UDP通信中,并没有保持连 接的功能,因而,当该查询确定装置44响应查询后并不需要有额 外的操作。另一方面,在TCP通信中,所有数据流在通信建立后 受控,其与UDP通信不同。因而,仅对实际数据(DNS要求)进行 处理,而保持与特定服务器的连接。并且然后将重设(RST)信息包 传输到该客户终端100及特定服务器两者以关闭连接。
24当输入到地址窗口中的关键词转变成punycode码并且然后以 DNS查询传输,可能难以处理该DNS查询。当网络浏览器确定输 入文本串为关键词时,可将输入关键词转变成punycode码。在这 情况下,可将该关^l建词转变成punycode码,或当4巴后缀加到该文 本串之后可将该文本串转变成punycode码。例如,当UDP标题或 TCP标题的端口值为53时,能够确定输入文本串为DNS查询数 据,并且然后能够确定该输入文本串是否为根据该DNS查询数据 的内容的关键词。因为输入到地址窗口中的关键词转变成 punycode码并以DNS查询传输,当该文本串业已转变成punycode 码时,该文本串可确定为关键词。再者,有可能以各种方式来确 定该文本串是否是关键词,例如,根据储存在该后缀/域数据库46d 中的特定域或特定标识符是否包括在该DNS查询中、储存在域标 识符数据库46e中的域标识符是否包括在该DNS查询中等等。
以下将叙述根据本发明的 一 实施例的关键词的处理方法。图4 为根据本发明的 一 实施例的关键词的处理方法的流程图。
如图2及图4所示,当该客户终端100经由网络传输数据时(步 骤101),该关键词处理系统40在网络上接收该网络数据(步骤 103)。如上所述,该数据可用该镜像方法或该代理方法接收。
随后,首先以数据的种类等等为基础来区别HTTP查询(步骤 105)。更具体地说,对附加到该数据的各种标题进行分析,并且 确定是否需要确定该数据是否是关键词,藉此区别待处理的HTTP 查询。例如,当该传输来的数据的TCP标题的目的端口号为80 时,确定该数据为待处理的HTTP查询。在这情况下,可额外进 行使用经由网络传输的数据IP地址来区别HTTP查询的处理。
随后,确定储存在标识符数据库46a中的输入存储单元标识 符是否在该第一区别数据的标题的URI中存在,即该HTTP查询(步骤107)。
当确定该HTTP查询是关于输入到客户端网络浏览器的地址 窗口中的关键词查询时,向客户终端100传输IP地址或该NLIA 服务器200的URL或该搜寻服务器300以响应该HTTP查询(步骤 109)。该NLIA服务器200回送IP地址或URL对应的特定关键词, 以及该搜寻服务器300回送特定关键词的搜寻结果。该客户终端 100接收该IP地址或该NLIA服务器200的URL或该搜寻服务器 300以访问对应的网页(步骤111)。
另一方面,当确定该HTTP查询不是关于输入到客户端网络 浏览器的地址窗口中的关键词查询时,该关键词处理系统40不处 理该HTTP查询并且按照现状传输网络数据(步骤120)。
以下将叙述根据本发明的另 一 实施例的关键词的处理方法。 图5为根据本发明的另一实施例的关键词的处理方法的流程图。
如图2及图5所示,当该客户终端100经由网络传输数据时(步 骤201),该关键词处理系统40在网络上接收该网络数据(步骤203)。
随后,首先以数据的种类等等为基础来区别HTTP查询(步骤 205)。更具体地说,对附加到该数据的各种标题进行分析,并且 确定是否需要确定该数据是否是关键词,藉此区别待处理的HTTP 查询。例如,当该传输来的数据的TCP标题的目的端口号为80 时,确定该数据为待处理的HTTP查询。
随后,该查询确定装置44在从客户终端IOO传输来的网络信 息之中接收该HTTP查询并且确定该HTTP查询的标题的主机信 息是否储存在该主机信息数据库46c中(步骤207)。当该HTTP查 询的标题的主机信息储存在该主机信息数据库46c中时,该查询 确定装置44确定该HTTP查询是关于输入到客户端网络浏览器的 地址窗口中的关4建词查询。当确定该HTTP查询是关于输入到客户端网络浏览器的地址 窗口中的关键词查询时,该处理转到步骤209及步骤211。另一方 面,当确定该HTTP查询不是关于输入到客户端网络浏览器的地 址窗口中的关键词查询时,对该HTTP查询不进行处理(步骤220)。
以下将根据本发明的又 一 实施例来叙述关键词的处理方法。 图6为根据本发明的又一实施例的关键词的处理方法的流程图。
如图2及图6所示,当该客户终端100经由网络传输数据时(步 骤301),该关键词处理系统40在网络上接收该网络数据(步骤303)。
随后,首先以数据的种类等等为基础来区别DNS查询(步骤 305)。更具体地说,对附加到该数据的各种标题进行分析,并且 确定是否需要确定该数据是否是关键词,藉此区别待处理的DNS 查询。例如,当该传输来的数据的TCP标题或UDP标题的目的端 口号为53时,确定该数据为待处理的DNS查询。
随后,确定储存在后缀/域数据库46d中的后缀/域是否在该 DNS查询中存在(步骤307)。
当储存在后缀/域数据库46d中的后缀/域在该DNS查询中存 在时,向客户终端100传输IP地址或NLIA服务器200的URL或 该搜寻服务器300以响应该DNS查询(步骤309)。该客户终端100 接收该IP地址或URL以访问对应的网页(步骤311)。
当确定该DNS查询不是关于输入到客户端网络浏览器的地址 窗口中的关键词查询时,对该DNS查询不进行处理(步骤320)。
以下将叙述根据本发明的再 一 实施例的关键词的处理方法。 图7为根据本发明的再一实施例的关键词的处理方法的流程图。
如图2及图7所示,当该客户终端100经由网络传输数据时(步 骤4 01),该关键词处理系统4 0在网络上接收该网络数据(步骤4 0 3)。
随后,首先以数据的种类等等为基础来区别DNS查询(步骤405)。更具体地说,对附加到该数据的各种标题进行分析,并且 确定是否需要确定该数据是否是关键词,藉此区别待处理的DNS 查询。
随后,该查询确定装置44确定储存在该域标识符数据库46e 中的并表示域名的标识符是否包括在从客户终端100传输来的 DNS查询中(步骤407)。
当确定储存在该域标识符数据库46e中的并表示域名的标识 符不包括在该DNS查询中时,确定该数据为关键词,并且该处理 转到步骤409及步骤411。另一方面,当所储存的表示域名的标识 符包括在该DNS查询的标题中时,对该DNS查询不进行处理(步 骤420)。
参照图4至图7,图中所示为根据本发明的一些实施例的处理 关键词的各种方法,但也可结合以处理关键词。
本文业已揭示本发明的一些实施例,并且虽然使用了特定的 术语,所用的术语仅在一般叙述性的意义上加以说明并非对本发 明作限定。因此,本领域技术人员应当理解,在不背离如权利要 求书中所提出的本发明的原则及精神下,该些实施例的形式及细 节均可作出各种变化。
权利要求
1.一种使用网络信息处理关键词的系统,在网络上接收及处理从客户终端传输来的网络信息,所述系统包括标识符数据库,用于储存至少一输入存储单元标识符;以及查询确定装置,用于接收从客户终端传输来的网络信息中的超文本传输协议(HTTP)查询、确定储存在标识符数据库中的输入存储单元标识符是否在所述HTTP查询的标题的统一资源信息(URI)中存在,以及确定当储存在标识符数据库中的输入存储单元标识符在所述HTTP查询的标题的URI中存在时,所述HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关键词查询。
2. 如权利要求1所述的系统,其特征在于,所述标识符数据库 储存与所述标识符匹配的主机信息,以及所述查询确定装置首先确 定所述HTTP查询的标题的主机信息是否储存在所述标识符数据库 中,其次确定,当所述HTTP查询的标题的主机信息储存在所述标 识符数据库中时,所储存的并与主机信息匹配的输入存储单元标识 符是否在所述URI中存在,以及最后确定,当所储存的并与主机信 息匹配的输入存储单元标识符在所述URI中存在时,所述HTTP查 询是关于输入到客户端网络浏览器的地址窗口中的关键词查询。
3. 如权利要求1所述的系统,其特征在于,所述标识符数据库 储存与所述标识符匹配的主机信息,以及所述查询确定装置首先确 定储存在所述标识符数据库中的输入存储单元标识符是否在所述 URI中存在,其次确定,当储存在所述标识符数据库中的输入存储 单元标识符在所述URI中存在时,所述HTTP查询的标题的主机信 息是否与所储存的并与输入存储单元标识符匹配的主机信息一致,以及最后确定,当所述HTTP查询的标题的主机信息与所储存的并2与输入存储单元标识符匹配的主机信息一致时,所述HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关键词查询。
4. 一种使用网络信息处理关键词的系统,在网络上接收及处理 从客户终端传输到特定服务器的网络信息,所述系统包括主机信息数据库,用于将信息储存在至少一主机上;以及 查询确定装置,用于接收从客户终端传输到特定服务器的网络 信息之中的超文本传输协议(HTTP)查询、确定所述HTTP查询的标 题的主机信息是否储存在所述主机信息数据库中,以及确定当所述 HTTP查询的标题的主机信息储存在所述主机信息数据库中时,所 述HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关键 词查询。
5. 如权利要求1至4中任一项所述的系统,其特征在于,所述 系统进一步包括网络信息检索工具,用于确定从客户终端传输到特定服务器的 网络信息为HTTP查询以及当所述网络信息的标题的目的端口数据 适合于HTTP查询时,将所述网络信息传输到所述查询确定装置。
6. 如权利要求1至4中任一项所述的系统,其特征在于,所述 系统进一步包括网际协议(IP)数据库,用于储存至少一IP地址;以及 网络信息检索工具,用于确定从客户终端传输到特定服务器的 网络信息的标题的目的IP地址是否储存于所述IP数据库中,以及 当所述网络信息的标题的目的IP地址储存于所述IP数据库中时, 将所述网络信息传输到所述查询确定装置,其中,所述查询确定装 置确定当由所述网络信息检索工具传输的网络信息的标题的目的 端口数据适合于HTTP查询时,所述网络信息为HTTP查询。
7. 如权利要求1至4中任一项所述的系统,其特征在于,当所述查询确定装置确定所述HTTP查询是关于输入到客户端网络浏览 器的地址窗口中的关4建词查询时,所述查询确定装置为响应所述 HTTP查询向客户终端传输网际协议(IP)或本机语言互联网地址 (NLIA)服务器的统一资源定位器(URL)或搜寻服务器,所述NLIA 服务器回送IP地址或URL对应的特定关键词以及所述搜寻服务器回送特定关键词的搜寻结果。
8. 如权利要求7所述的系统,其特征在于,所述查询确定装置 将对应于所述HTTP查询的复原信号传输到所述客户终端、所述特 定服务器或所述客户终端及所述特定服务器。
9. 一种使用网络信息处理关键词的系统,在网络上接收及处理 从客户终端传输到特定服务器的网络信息,所述系统包括后缀/域数据库,用于储存特定后缀或特定域;以及 查询确定装置,用于接收从客户终端传输到特定服务器的网络 信息之中的域名系统(DNS)查询,以及确定当储存在所述后缀/域数 据库中的特定后缀或特定域包括在所述DNS查询时,所述DNS查 询是关于输入到客户端网络浏览器的地址窗口中的关键词查询。
10. —种使用网络信息处理关键词的系统,在网络上接收及处 理从客户终端传输到特定服务器的网络信息,所述系统包括域标识符数据库,用于储存表示域名的标识符;以及 查询确定装置,用于接收从客户终端传输到特定服务器的网络 信息之中的域名系统(DNS)查询,确定储存在域标识符数据库中的 标识符是否包括在所述DNS查询的查询现场数据中,以及确定当 储存在域标识符数据库中的标识符不包括在所述DNS查询的查询 现场数据中时,所述DNS查询是关于输入到客户端网络浏览器的 地址窗口中的关4走词查询。
11. 如权利要求9或10所述的系统,其特征在于,所述系统进一步包括网络信息检索工具,用于确定从客户终端传输到特定服务器的 网络信息为DNS查询以及当所述网络信息的标题的目的端口数据 适合于DNS查询时,将所述网络信息传输到所述查询确定装置。
12. 如权利要求9或10所述的系统,其特征在于,所述系统进 一步包括网际协议(IP)数据库,用于储存至少一IP地址;以及 网络信息检索工具,用于确定从客户终端传输到特定服务器的 网络信息的标题的目的IP地址是否储存于所述IP数据库中,以及 当所述网络信息的标题的目的IP地址储存于所述IP数据库中时, 传输所述网络信息到所述查询确定装置,其中,所述查询确定装置 确定当由所述网络信息检索工具传输的网络信息的标题的目的端 口数据适合于DNS查询时,所述网络信息为DNS查询。
13. 如权利要求9或10所述的系统,其特征在于,当所述查询 确定装置确定所述DNS查询是关于输入到客户端网络浏览器的地 址窗口中的关4囊词查询时,所述查询确定装置为响应所述DNS查 询向客户终端传输网际协议(IP)或本机语言互联网地址(NLIA)服务 器的统一资源定位器(URL)或搜寻服务器,所述NLIA服务器回送 IP地址或URL对应的特定关键词以及所述搜寻服务器回送特定关 键词的搜寻结果。
14. 如权利要求13所述的系统,其特征在于,所述查询确定装 置将对应于所述HTTP查询的复原信号传输到所述客户终端、所述 特定服务器或所述客户终端及所述特定服务器。
15. —种使用网络信息处理关键词的方法,在网络上接收及处 理从客户终端传输到特定服务器的网络信息,所述方法包括以下步 骤接收从客户终端传输到客户服务器的网络信息之中的超文本 传输协议(HTTP)查询;确定储存在包括至少一标识符的标识符数据库中的输入存储 单元标识符是否在所述HTTP查询中存在,及确定当储存在标识符 数据库中的输入存储单元标识符在所述HTTP查询中存在时,所述 HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关键词 查询;以及响应所述HTTP查询向客户终端传输网际协议(IP)或本机语言 互联网地址(NLIA)服务器的统一资源定位器(URL)或搜寻服务器, 所述NLIA服务器回送IP地址或URL对应的特定关键词以及所述 搜寻服务器回送特定关键词的搜寻结果。
16. 如权利要求15所述的方法,其特征在于,所述查询确定步 骤包括以下步骤把与标识符匹配的主机信息储存到所述输入存储单元标识符 数据库中,并且首先确定所述HTTP查询的主机信息是否储存在所 述输入存储单元标识符数据库中;以及其次确定所储存的并与主机信息匹配的标识符是否与在所述 HTTP查询中存在,其中,当所述第一确定步骤和所述其次确定步骤依次被满足 时,可以确定所述的HTTP查询为关于输入到客户端网络浏览器的 地址窗口中的关4定词查询。
17. 如权利要求15所述的方法,其特征在于,所述查询确定步 骤包括以下步骤首先确定储存在所述输入存储单元标识符数据库中的输入存 储单元标识符是否在所述HTTP查询的主机信息中存在;以及把与输入存储单元标识符匹配的主机信息储存到所述标识符数据库中及其次确定所述HTTP查询的主机信息是否与所储存的并与所述输入存储单元标识符匹配的主机信息 一 致,其中,当所述第一确定步骤和所述其次确定步骤依次被满足时,可以确定所述的HTTP查询为关于输入到客户端网络浏览器的 地址窗口中的关4囊词查询。
18. 如权利要求15所述的方法,其特征在于,所述的方法进一 步包括以下步骤传输对应于所述HTTP查询的复原信号到所述客户终端、所述 特定服务器或所述客户终端及所述特定服务器。
19. 如权利要求15至18中任一项所述的方法,其特征在于, 所述的方法进一步包括以下步骤当从客户终端传输到特定服务器的网络信息的标题的目的端 口数据适合于HTTP查询时,确定所述网络信息为HTTP查询及检 索所述HTTP查询。
20. 如权利要求15至18中任一项所述的方法,其特征在于, 所述的方法进一 步包括以下步骤确定从客户终端传输到特定服务器的网络信息的标题的目的 IP地址是否储存于储存至少一 IP地址的IP数据库中,及当所述网 络信息的标题的目的IP地址储存于所述IP数据库中时,检索所述 网络信息;以及当所述网络信息的标题的目的端口数据适合于HTTP查询时, 确定所述网络信息为HTTP查询。
21. —种记录媒体,储存实施如权利要求15至18中任一项所 述的关^f建词的处理方法的程序。
全文摘要
本发明涉及一种使用网络信息处理关键词的方法和系统。该系统接收从客户终端传输来的网络信息之中的超文本传输协议(HTTP)查询、确定储存在标识符数据库中的输入存储单元标识符是否在该HTTP查询的标题的统一资源信息(URI)中存在,以及确定当储存在标识符数据库中的输入存储单元标识符在该HTTP查询的标题的URI中存在时,该HTTP查询是关于输入到客户端网络浏览器的地址窗口中的关键词查询。
文档编号G06F17/30GK101595479SQ200780050600
公开日2009年12月2日 申请日期2007年10月19日 优先权日2006年12月1日
发明者元钟淏, 房铉根, 李锡文, 金泰秀 申请人:拿丕.Com有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1