一种无线互联网sp业务url的记录方法及系统的制作方法

文档序号:7695256阅读:125来源:国知局

专利名称::一种无线互联网sp业务url的记录方法及系统的制作方法
技术领域
:本发明涉及SP业务URL的记录领域,尤其涉及一种无线互联网SP业务URL的记录方法及系统。
背景技术
:现有技术中实现SP(业务提供商)业务URL(统一资源定位符)的记录方法包括从SP业务的入口地址开始,逐层的遍历该SP业务,通过网络爬虫的方式把整个SP业务的URL链接结构遍历出来,并建立相应的数据结构记录这些URL信息,但是该方法存在如下的问题(1)、SP的业务内容是开放性的,业务的URL会经常发生变动,这就导致系统必须频繁的进行业务遍历,重新构建SP业务URL记录;(2)、某些SP业务的URL层次非常深,同时会出现交叉链接的情况,这就导致通过爬虫的方式无法得到完整准确的SP业务URL记录。现有技术实现SP业务定位方法根据IP地址和URL(统一资源定位符)前缀,但是存在很大的局限性,下面分别举例说明。一个SP业务分布在多台服务器下,如业务A分布在两台服务器下,这两台服务器的地址是"10.10.10.2"和"10.10.10.3",那么必须把两个地址都配置到监测系统的配置文件中,如果有服务器的IP要改变,或是又新加了服务器,都要更改配置文件。多个SP业务在一台服务器下,如两个业务A、B都在服务器"10.10.10.2"下,那么通过IP就不能判断某次访问属于哪个业务。根据URL前缀定位SP业务的问题,这种方法是比较URL的前一部分,来判断是否为我们要监测的业务,但有很多URL会判断错误。如我们事先配置好了要监测的SP业务A,他的URL为"http://baidu.com/",那么某用户访问了"http://baidu.com/",然后又访问了这个页面的一个子连接"http://hi.baidu.com/index.jsp",则第二次访问的URL无法与业务A对应上。每个页面的子链接的URL不一定要和他的父链接的URL前缀一样,所以用URL前缀来比较定位SP业务的方法是不准确的。从以上的描述可以看出,现有的SP业务URL记录的技术方案比较复杂,SP业务的定位也不准确,并且现有的SP业务定位与SP业务URL的记录相分离,SP业务定位没有充分利用所记录的URL信息。
发明内容为了解决上述的技术问题,本发明提供了一种无线互联网SP业务URL的记录方法及系统,其目的在于,准确地记录用户访问的URL及用户访问的ULR与其子链接之间的关系,以便利用URL之间的关系定位SP业务。本发明提供了一种无线互联网SP业务URL的记录方法,包括步骤l,设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;步骤2,从WAP数据中获取用户访问的URL和用户的手机号码;步骤3,依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,用于记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系。步骤l中,用户访问表保存用户的手机号码、URL访问记录和SP业务的入口URL,所述URL访问记录包括用户访问的URL及其子链接;公共URL记录表保存用户访问过的URL及其子链接,并保存所述子链接对应的父URL。公共URL记录表还保存所有用户访问过的URL及其子链接对应的索引值;所述URL访问记录保存用户访问的URL及其子链接为用户访问的URL及其子链接对应的索引值;所述SP业务的入口URL为该SP业务的入口URL对应的索引值。所述子链接对应的父URL为该父URL对应的索引值。步骤2和步骤3之间包括步骤31,判断用户访问的URL是否为SP业务的入口URL。步骤31中,若用户访问的URL为SP业务的入口URL,则步骤3中,依据用户的手机号码和用户访问的URL对用户访问表进行处理包括如果该用户的手机号码存在于用户访问表中且用户访问表中保存的SP业务的入口URL与该用户访问的URL相同,则不更新用户访问表;如果该用户的手机号码不存在于用户访问表中,则在用户访问表中添加该用户,并更新对应的URL访问记录,保存SP业务的入口URL;如果该用户的手机号码存在于用户访问表中,并且用户访问表中保存的SP业务的入口URL与该用户访问的URL不同,则修改用户访问表中的SP业务的入口URL为所述用户访问的URL,清除用户访问表中该用户原有的URL访问记录,并在用户的访问记录中保存所述用户访问的URL及其子链接。所述更新对应的URL访问记录包括在对应的URL访问记录中保存所述用户访问的URL及其子链接。步骤31中,若用户访问的URL非SP业务的入口URL,则步骤3中,依据用户的手机号码和用户访问的URL对用户访问表进行处理包括如果用户的手机号码存在于用户访问记录表中,并且用户访问表中存在用户访问的URL、但不存在用户访问的URL的子链接,则保存其子链接;如果用户的手机号码存在于用户访问记录表中,并且用户访问表中存在用户访问的URL和该用户访问的URL的子链接,则不更新用户访问表;如果用户的手机号码存在于用户访问记录表中,但URL访问记录中不存在用户访问的URL,则结束;如果用户的手机号码不存在于用户访问记录表中,则结束。步骤3中,依据用户访问的URL对公共URL记录表进行处理包括如果公共URL记录表中不存在用户访问的URL,则保存用户访问的URL、用户访问的URL的子链接以及该子链接对应的父URL;如果公共URL记录表中存在用户访问的URL、但不存在用户访问的URL的子链接,则保存其子链接以及该子链接对应的父URL;如果公共URL记录表中存在用户访问的URL和该用户访问的URL的子链接,则不更新公共URL记录表。本发明提供了一种无线互联网SP业务URL的记录系统,包括列表设置模块,用于设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;用户信息获取模块,用于从WAP数据中获取用户访问的URL和用户的手机号码;列表处理模块,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,以记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系。用户访问表保存用户的手机号码、URL访问记录和用户访问的SP业务的入口URL,所述URL访问记录包括用户访问的URL及其子链接;公共URL记录表保存所有用户访问过的URL及其子链接,并保存所述子链接对应的父URL。公共URL记录表还保存所有用户访问过的URL及其子链接对应的索引值;所述URL访问记录保存用户访问的URL及其子链接为用户访问的URL及其子链接对应的索引值;所述SP业务的入口URL为该SP业务的入口URL对应的索引值。所述子链接对应的父URL为该父URL对应的索引值。列表处理模块包括SP业务的入口URL判断模块,用于依据SP业务表判断用户访问的URL是否为SP业务的入口URL;用户访问表处理模块,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理;公共URL记录表处理模块,用于根据用户访问的URL对公共URL记录表进行处理。本发明提供了一种无线互联网SP业务的定位方法,包括步骤l,设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;步骤2,从WAP数据中获取用户访问的URL和用户的手机号码;步骤3,依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,用于记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系;步骤4,依据用户访问的URL在公共URL记录表中定位SP业务。本发明提供了一种无线互联网SP业务的定位系统,包括列表设置模块,用于设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;用户信息获取模块,用于从WAP数据中获取用户访问的URL和用户的手机号码;列表处理模块,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,以记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系;SP业务定位模块,用于依据用户访问的URL在公共URL记录表中定位SP业务。本发明能够记录用户访问的URL信息,快速的定位服务提供商(SP)业务,快速得到用户访问路径,并且尽量少的内存资源占用。图1为本发明提供的SP业务URL记录流程图2和图4为URL访问顺序图3和图5为URL记录关系图6为本发明提供的SP业务URL记录系统结构图7为列表处理模块详细结构示意图。具体实施例方式本发明中提供的SP记录方法采用用户访问站点跟踪方法,准确记录到每个页面,并记录用户访问业务的路径。该方法用到的数据结构如下SP业务表<table>tableseeoriginaldocumentpage10</column></row><table>用户访问表<table>tableseeoriginaldocumentpage10</column></row><table>公共URL记录表索引URL父URL1http:〃wap.zrxc.com,cn/hyfk20/index.jsp20http://wap.zrxc.comcn/hyfk20/1/index.jsphttp:〃wap.zrxc.com.cn/hyfk20/index.jspSP业务表这个表会定期更新,SP业务表的内容主要包含SP代码、SP名称、业务代码、业务名称、业务入口URL,在记录系统启动或表更新时加载表。用户访问表以用户手机号码作为分类,记录每个用户访问的URL信息及该URL对应的页面中的子链接的URL,用户访问表中只记录与该用户最新一次访问的业务入口地址具有从属关系的URL。如果ffl户手机号码、当前访问的URL及该URL的子链接己经存在于该表中,则无需对该表的内容进行更新。公共URL记录表用于记录用户访问的URL及其子链接,并记录父链接与其子链接的关系。如果当前的访问的URL和该URL的子链接已经存在于该表中,则无需对该表的内容进行更新。下面举例说明一个手机用户访问一个计费SP业务时这三个表的填写情况SP业务表是在预先配置的,假设配置SP业务表的内容如下索弓lSP代码SP名称业务代码业务名称业务入口URL199003联通新时讯通502990030行业分析http:〃wap.zrxc.com.信有限公司Ucn/hy6c20/index.jsp另外两个表开始吋都为空,是在程序执行后动态填入或修改的。当一个手机用户(手机号13012345678)访问了上表中的业务入口URL,在公共URL记录表中将填入如下URL记录<table>tableseeoriginaldocumentpage12</column></row><table>假设URL:http:〃wap.zrxc.com.cn/hyfk20/index.jsp中有三个子链接,那么URL:http://wap.zrxc.com.en/hyfe20/index.jsp和它的三个子链接都填到公共URL记录表中,并且每个子链接都要填入他的父链接的索引值,以便记录每个链接在一个网站中的层次关系。这里三个子链接的父链接是相同的,所以值都是l。只填入索引值,不填入URL字符串也是为了节省内存空间。用户访问表将填入记录如下记录<table>tableseeoriginaldocumentpage12</column></row><table>以用户的手机号作为用户ID。在用户访问URL记录中填入用户访问过的URL及其子链接,这里填入的也是公共URL记录表中的索引值。"SP业务"中填入SP的索引值。在用户访问表中不仅记录用户访问过的URL,没访问的子链接也要记录,这样做的目的是为了判断用户下次访问的URL是否是从上一页链接过去的。实际的URL字符串只在公共URL记录表中保存一份,其他地方如果要使用都为引用方式。SP业务URL的记录方法如下1)当收到WAP数据时,获取底层送上来的此次访问的URL、用户手机号、访问的WAP数据。然后在SP业务表中査找此URL。2)如果在SP业务表中找到该URL,继续3),如果没有,继续4)。3)在SP业务表中找到该URL的情况下如果在用户访问表中也找到该用户,并且用户访问表中保存的SP业务对应的入口URL和用户访问的URL相同,则不更新用户访问表和公共URL记录表;如果在用户访问表中也找到该用户,并且用户访问表中保存的SP业务对应的入口URL和用户访问的URL不同,则清除用户访问表中保存的SP业务对应的入口URL以及访问的URL记录,并将用户访问的URL保存为SP业务对应的入口URL,在访问的URL记录中填入用户访问的URL以及该URL的子链接;进一步地,如果在公共URL记录表中存在用户访问的URL及该URL的子链接,则不更新公共URL记录表;如果用户访问的URL已经存在于公共URL记录表中,但该URL的子链接不存在于公共URL记录表中,则在公共URL记录表中添加该URL的子链接;如果用户访问的URL以及该URL的子链接均不存在于公共URL记录表中,则在公共URL记录表中添加该用户访问的URL及其子链接。如果在用户访问表中没找到该用户,则添加该用户,并更新用户访问记录表;进一步地,如果用户访问的URL以及该URL的子链接已经存在于公共URL记录表中,则不更新公共URL记录表;如果用户访问的URL已经存在于公共URL记录表中,但该URL的子链接不存在于公共URL记录表中,则在公共URL记录表中添加该URL的子链接;如果用户访问的URL以及该URL的子链接均不存在于公共URL记录表中,则在公共URL记录表中添加该用户访问的URL及其子链接。4)如果在SP业务表中没找到该URL,则在用户访问表中查找是否有该用户,如果有,继续5),如果没有,结束。5)如果在SP业务表中没找到该URL,但在用户访问表中找到该用户,则说明该用户访问过某SP业务,那么就要在该用户的访问记录中查找是否存在当前URL,如果不存在,则结束;如果存在当前URL,则进一步査找是否存在当前URL的子链接如果用户访问表中存在当前URL的子链接,则不更新用户访问表和公共URL记录表;如果用户访问表中不存在当前URL的子链接,并且在公共URL记录表中也不存在当前URL的子链接,则在用户访问表的访问记录中添加当前URL的子链接,在公共URL记录表中添加当前URL的子链接;如果用户访问表中不存在当前URL的子链接,但在公共URL记录表中存在当前URL的子链接,则在用户访问表中添加当前URL的子链接,不更新公共URL记录表。在更新用户访问表时,最关键的地方就是如何把用户访问路径准确的记录下来,一旦用户访问了一个SP业务的入口URL,就会把用户访问的这个URL和这个URL对应的SP信息存入该用户的访问记录中,这个URL中的所有子链接也会被提取出来,同样存放在用户访问记录中,并且在公共记录表中,每个子链接都会记住他的父链接。如果访问记录中已经存在了该入口URL,则不再更新用户访问表。如图2所示当用户访问一个SP业务,其URL为A,他的子链接有A1、A2、A3、A4,当更新用户访问表时,该用户的访问记录中保存的URL有A、Al、A2、A3、A4,且A1A4的父链接为A,现在用户只访问了A,还没有访问A中的任何链接,但是现在一定要把A的子链接也保存下来,作为下次判断该用户访问的URL是否还是该SP中的链接的依据,所以A1A4要从页面A的内容中提取出来,并把它们的父链接归为A。然后用户访问了A1,更新用户访问表,访问记录中保存的链接为A、Al、A2、A3、A4、All、A12、A13、A14,且A11A14的父链接为Al,用户再访问A12,访问记录又变为A、Al、A2、A3、A4、All、A12、A13、A14、A121、A122、A123、A124,同样A12卜A124的父链接记录为A12。这样用户访问的所有链接甚至未访问过的子链接都被记录下来了。且它们的关系如图3所示,箭头指向每个URL的父URL。如果用户通过返回键退回到某个页面下,再访问那个页面下的链接,按照上面的方法同样可以判断被访问的URL是不是某个SP业务,也能正确的记录下他的访问路径。如图4所示用户访问到A12页面后退回到A1,然后又访问了A13,这时系统会把A13的所有子链接加入到用户访问记录中,用户访问记录会变为A、Al、A2、A3、A4、All、A12、A13、A14、A121、A122、A123、A124、A131,A132,A133。它们的逻辑关系图5所示。通过以上流程及举例说明可以看出,本系统可以根据用户访问准确的记录出每个URL属于哪个SP的业务。而且记录了用户访问的这些URL的层次关系,为后续准确的得到用户访问路径做好了准备。SP业务URL的记录方法的流程如图1所示,包括步骤101,当收到WAP数据时,系统得到底层送上来的此次访问的URL、用户手机号、访问的WAP数据,然后在SP业务表中查找此URL。步骤102,判断是否在SP业务列表中找到,如果是,执行步骤108,否则执行步骤103;步骤103,在用户访问表中查找该用户,如果有,执行步骤105,否则执行步骤104;步骤104,结束。步骤105,在该用户访问的记录中査找是否有当前URL,如果有,执行歩骤108,否则执行步骤104;步骤10S,对用户访问表进行处理;步骤109,对公共URL记录表进行处理。为了进一步利用公共URL记录表定位SP业务,还可以包括步骤IIO,定位SP业务。步骤108中,如果用户访问的URL为SP业务的入口URL,并且在用户访问表中存在该用户而且用户访问表中当前保存的与该SP业务对应的入口URL和用户访问的URL相同,则不更新用户访问的URL记录;如果用户访问的URL为SP业务的入口URL,并且在用户访问表中存在该用户而且当前保存的与该SP业务对应的入口URL和用户访问的URL不相同,则清除原有的URL访问记录以及与该SP业务对应的入口URL(即用户访问表中"SP业务"一栏),并在访问的URL记录中保存当前用户访问的URL及其子链接,并保存当前用户访问的URL为该SP业务对应的入口URL(即用户访问表中"SP业务"一栏);如果用户访问的URL为SP业务的入口URL,并且在用户访问表中不存在该用户,则添加该用户,并增加用户访问的URL记录,保存该用户访问的URL为SP业务对应的入口URL;如果用户访问的URL非SP业务的入口URL,在更新用户访问的URL记录时,如果用户访问的URL已经存在并且URL记录中存在用户访问的URL的子链接,则不更新用户访问的URL记录;如果用户访问的URL已经存在并且URL记录中不存在用户访问的URL的子链接,则在用户访问的URL记录中保存该用户访问的URL的子链接。步骤109中,如果用户访问的URL以及该URL的子链接已经存在于公共URL记录表中,则不更新公共URL记录表;如果用户访问的URL已经存在于公共URL记录表中,但该URL的子链接不存在于公共URL记录表中,则在公共URL记录表中添加该URL的子链接;如果用户访问的URL以及该URL的子链接均不存在于公共URL记录表中,则在公共URL记录表中添加该用户访问的URL及其子链接。上述的歩骤109中,对公共URL记录表进行了更新之后,将所添加的URL对应的索引添加到用户访问表中的访问记录中。步骤110中,通过当前用户访问的URL在公共URL记录表的父URL字段逐级往上追溯,直到不存在父URL为止,列出用户访问该URL的访问路径,得到该SP业务的入口URL;如果用户访问的URL不存在父URL,则直接可以定位该URL为SP业务的入口URL。下面举例说明SP业务URL的记录流程图中描述的各分支假设SP业务表配置如下,用户访问表和公共URL表都为空。<table>tableseeoriginaldocumentpage16</column></row><table>10000北京微智1000000000微智简介http:〃mvtech.com.cn/index.html流程分支为步骤IOI、102、103和104一个手机用户(手机号13012345678)访问了一个URL:http:〃a.index(SP业务表中不存在),在SP业务访问表中没找到,进入步骤103,在用户访问表中査找用户13012345678,没有找到,说明该用户以前也没访问过SP业务表中的业务,进入步骤104。流程分支为步骤IOI、102、108和109根据用户访问表中是否存在该用户,可以分为下面两种情况A、手机用户(手机号13012345678)访问了URL:http:〃wap.zrxc.com.cn/hyfk20/index.jsp,在SP业务表中找到,是SP业务,进入步骤108,在用户访问表中査找用户13012345678不存在,因为这个用户之前没访问过SP业务,在用户访问表中添加用户13012345678,添加用户1613012345678的信息,并更新用户13012345678的访问URL记录,同时要在公共URL记录表中査找^1口://&口.2^0^0111.01/1^&20/^1(16乂」5口和它的三个子链接(假设这个URL有后面三个子链接)http:〃wap.zrxc.com.cn/hyfic20/l/index.jsp、http:〃wap.zrxc.com.cn/hyfx20/2/index.jsp禾口http:〃wap.zrxc.com.cn/hyfk20/3/indexjsp,如果公共URL表中没有这4条记录,则进入步骤109,先添加他们,然后将这4条记录的索引值填入用户访问表中。步骤108和步骤109执行后公共URL记录表和用户访问表中的记录情况如下公共URL记录表索引<table>tableseeoriginaldocumentpage17</column></row><table>用户访问表<table>tableseeoriginaldocumentpage17</column></row><table>B、对于用户访问表中已经存在该用户的情形,进入该分支的流程也包含两种情况。第一种是用户之前访问了SP业务http:〃wap.zrxc.com.cn/hy&20/index.jsp,现在又访问了http:〃wap.zrxc.comxn/hyfk20/index.jsp。在这种情况下,步骤108和步骤109中无需更新用户访问表和公共URL记录表。第二种是用户之前访问了一个SP业务,现在又访问了另一个SP业务,如用户(手机号13012345678)之前访问了SP业务http:〃wap.zrxc.com.cn/hyfk20/index.jsp(行业分析),现在访问了另一个SP业务http:〃mvtech.com.cn/index.html(微智简介),因为也是SP业务,所以在SP业务表中找到,进入步骤108,在用户访问表中查找用户13012345678,找到,更新用户访问表,进入步骤109。假设http:〃mvtech.com.cn/index.html页面中有两个子f连接http:〃mvtech.com.cn/l/index.html和http:〃mvtech.com.cn/2/index.html,则进入步骤108、109后公共URL记录表和用户访问表中的内容更新为如下公共URL记录表索<table>tableseeoriginaldocumentpage18</column></row><table>用户访问表用户访问表中的"SP业务"由1修改为2,访问的URL记录由1,20,23,30,32,33修改为50,51,52。流程分支为步骤IOI、102、103、105和104手机用户(手机号13012345678)访问了一个URL:http:〃a.index,在SP业务访问表中没找到,进入步骤103,在用户访问表中査找用户13012345678,找到,说明该用户以前访问过SP业务表中的业务,进入步骤105,査找用户13012345678的访问记录,此时用户13012345678的访问记录为1,20,23,30,表示有4个URL:http:〃wap.zrxc.com.cn/hyfx20/index.jsp、http:〃wap.zrxc.com.cn/hyfe20/l/index.jsp、http:〃wap.zrxc.com.cn/hyfk20/2/index.jsp禾口http:〃wap.zrxc.com.cn/hyfk20/3/index.jsp,没有找至U当前访问的URL:http://a.index,则进入步骤104,认为不是SP业务。流程分支为步骤IOI、102、103、105、108、109当用户(手机号13012345678)访问了http:〃wap.zrxc.com.cn/hyfk20/l/index.jsp,在SP业务访问表中没找到,进入步骤103,在用户访问表中查找用户13012345678,找到,进入步骤105,査找用户13012345678的访问记录,此时用户13012345678的访问记录为http:〃wap.zrxc.com.cn/hyfx20/index.jsp、http:〃wap.zrxc.com.cn/hy&20/1/index.jsp、http:〃wap.zrxc.com.cn/hyfk20/2/index.jsp禾口http:〃wap.zrxc.com.cn/hyfk20/3/index.jsp,找至U了当前访问的URL:http:〃wap.zrxc.com.cn/hyfk20/l/index.jsp,说明http://wap.zrxc.com.en/hyfk20/l/index.jsp是SP业务中的一个链接,则进入步骤108、109。假设http:〃wap.zrxc.com.cn/hyfe:20/l/index.jsp中有两个子链接http:〃wap.zrxc.com.cn/hyfk20/l/al.jsp禾口http:〃wap.zrxc.com.cn/hyfk20/l/a2.jsp,则公共URL记录表和用户访问表中的内容更新为如下公共URL记录表<table>tableseeoriginaldocumentpage19</column></row><table>23<table>tableseeoriginaldocumentpage20</column></row><table>用户访问表<table>tableseeoriginaldocumentpage20</column></row><table>每个SP业务的站点都可能有很多层页面,每个页面又会有很多链接地址,如果把所有的链接都取出来,组成一个树形结构,那么每个SP业务都会形成一颗可能会有上万个节点的枝繁叶茂的大树,在检查一个URL是不是这颗树的一个节点时真的要花些时间了。但通过上面记录用户访问路径的例子可以看出,只记录了用户访问到的节点,去掉了大量的其他分支,这样在检査一个URL是不是被监测的SP业务时,大大减少了检査的节点个数,节省了处理时间。每个用户访问记录的逻辑结构都构成了一棵树,如果从根节点向下查找,每次都要查多个子节点,一个SP业务的中有多少个URL链接就有多少子节点,而且这只是检査一个URL的工作量。这颗树的每个节点都记录了他的父节点,树的根节点就是被监测的入口URL,一旦用户访问的内容违规,就会从这个违规节点开始找到他的父节点,直到找到根节点。这样就得到了用户访问的整个路径。采用从树的子节点向上査找的方法,大大减少了要检查的节点个数,因为每个子节点只有一个父节点。系统中的SP业务表、用户访问表、公共URL记录表都有很多的记录,尤其是后两个表,有多少个用户同时在访问SP业务,在用户访问表中就会有多少条记录,它们访问的URL也都存放到了公共URL记录表中,如果每次都要逐条的遍历这些记录,要浪费很多时间,降低系统处理效率。所以系统中所有要査表的地方都用了Hash算法,最大限度的提高搜索速度。一台普通服务器,要高效的处理来自网络的海量数据,这些数据就一定要放在内存中。那么如何尽量少的占用内存呢,上面提过的公共URL访问记录表就是做这个的。把所有用户访问过的URL都存放在这个表中,其他所有用到URL的地方,都用的是这个表中URL的地址,避免了重复存储。即使这样,如果要把所有SP业务的URL都存储起来也是不太现实的,所以也只存放用户访问过的URL及其子链接。系统中所有Hash表的元素都是指针,表的加载,记录的添加和释放都是动态控制,尽量避免内存空间的浪费。本发明提供了一种无线互联网SP业务URL的记录系统,如图6所示,包括列表设置模块601,用于设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;用户信息获取模块602,用于从WAP数据中获取用户访问的URL和用户的手机号码;列表处理模块603,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,以记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系。用户访问表保存用户的手机号码、URL访问记录和用户访问的SP业务的入口URL,所述URL访问记录包括用户访问的URL及其子链接;公共URL记录表保存所有用户访问过的URL及其子链接,并保存所述子链接对应的父URL。公共URL记录表还保存所有用户访问过的URL及其子链接对应的索引值;所述URL访问记录保存用户访问的URL及其子链接为用户访问的URL及其子链接对应的索引值;所述SP业务的入口URL为该SP业务的入口URL对应的索引值。所述子链接对应的父URL为该父URL对应的索引值。如图7所示,列表处理模块603进一步包括SP业务的入口URL判断模块701,用于依据SP业务表判断用户访问的URL是否为SP业务的入口URL;用户访问表处理模块702,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理;公共URL记录表处理模块703,用于根据用户访问的URL对公共URL记录表进行处理。本发明提供了一种无线互联网SP业务的定位方法,包括步骤l,设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;步骤2,从WAP数据中获取用户访问的URL和用户的手机号码;步骤3,依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,用于记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系;步骤4,依据用户访问的URL在公共URL记录表中定位SP业务。本发明提供了一种无线互联网SP业务的定位系统,包括列表设置模块,用于设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;用户信息获取模块,用于从WAP数据中获取用户访问的URL和用户的手机号码;列表处理模块,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,以记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系;SP业务定位模块,用于依据用户访问的URL在公共URL记录表中定位SP业务。本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于以上的说明,而是由权利要求书的范围来确定的。权利要求1、一种无线互联网SP业务URL的记录方法,其特征在于,包括步骤1,设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;步骤2,从WAP数据中获取用户访问的URL和用户的手机号码;步骤3,依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,用于记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系。2、如权利要求1所述的无线互联网SP业务URL的记录方法,其特征在于,步骤1中,用户访问表保存用户的手机号码、URL访问记录和SP业务的入口URL,所述URL访问记录包括用户访问的URL及其子链接;公共URL记录表保存用户访问过的URL及其子链接,并保存所述子链接对应的父URL。3、如权利要求2所述的无线互联网SP业务URL的记录方法,其特征在于,公共URL记录表还保存所有用户访问过的URL及其子链接对应的索引值;所述URL访问记录保存用户访问的URL及其子链接为用户访问的URL及其子链接对应的索引值;所述SP业务的入口URL为该SP业务的入口URL对应的索引值。4、如权利要求2所述的无线互联网SP业务URL的记录方法,其特征在于,所述子链接对应的父URL为该父URL对应的索引值。5、如权利要求2、3或4所述的无线互联网SP业务URL的记录方法,其特征在于,步骤2和步骤3之间包括步骤31,判断用户访问的URL是否为SP业务的入口URL。6、如权利要求5所述的无线互联网SP业务URL的记录方法,其特征在于,步骤31中,若用户访问的URL为SP业务的入口URL,则步骤3中,依据用户的手机号码和用户访问的URL对用户访问表进行处理包括如果该用户的手机号码存在于用户访问表中且用户访问表中保存的SP业务的入口URL与该用户访问的URL相同,则不更新用户访问表;如果该用户的手机号码不存在于用户访问表中,则在用户访问表中添加该用户,并更新对应的URL访问记录,保存SP业务的入口URL;如果该用户的手机号码存在于用户访问表中,并且用户访问表中保存的SP业务的入口URL与该用户访问的URL不同,则修改用户访问表中的SP业务的入口URL为所述用户访问的URL,清除用户访问表中该用户原有的URL访问记录,并在用户的访问记录中保存所述用户访问的URL及其子链接。7、如权利要求6所述的无线互联网SP业务URL的记录方法,其特征在于,所述更新对应的URL访问记录包括在对应的URL访问记录中保存所述用户访问的URL及其子链接。8、如权利要求5所述的无线互联网SP业务URL的记录方法,其特征在于,步骤31中,若用户访问的URL非SP业务的入口URL,则步骤3中,依据用户的手机号码和用户访问的URL对用户访问表进行处理包括如果用户的手机号码存在于用户访问记录表中,并且用户访问表中存在用户访问的URL、但不存在用户访问的URL的子链接,则保存其子链接;如果用户的手机号码存在于用户访问记录表中,并且用户访问表中存在用户访问的URL和该用户访问的URL的子链接,则不更新用户访问表;如果用户的手机号码存在于用户访问记录表中,但URL访问记录中不存在用户访问的URL,则结束;如果用户的手机号码不存在于用户访问记录表中,则结束。9、如权利要求5所述的无线互联网SP业务URL的记录方法,其特征在于,步骤3中,依据用户访问的URL对公共URL记录表进行处理包括如果公共URL记录表中不存在用户访问的URL,则保存用户访问的URL、用户访问的URL的子链接以及该子链接对应的父URL;如果公共URL记录表中存在用户访问的URL、但不存在用户访问的URL的子链接,则保存其子链接以及该子链接对应的父URL;如果公共URL记录表中存在用户访问的URL和该用户访问的URL的子链接,则不更新公共URL记录表。10、一种无线互联网SP业务URL的记录系统,其特征在于,包括列表设置模块,用于设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;用户信息获取模块,用于从WAP数据中获取用户访问的URL和用户的手机号码;列表处理模块,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,以记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系。11、如权利要求10所述的无线互联网SP业务URL的记录系统,其特征在于,用户访问表保存用户的手机号码、URL访问记录和用户访问的SP业务的入口URL,所述URL访问记录包括用户访问的URL及其子链接;公共URL记录表保存所有用户访问过的URL及其子链接,并保存所述子链接对应的父URLo12、如权利要求11所述的无线互联网SP业务URL的记录系统,其特征在于,公共URL记录表还保存所有用户访问过的URL及其子链接对应的索引值;所述URL访问记录保存用户访问的URL及其子链接为用户访问的URL及其子链接对应的索引值;所述SP业务的入口URL为该SP业务的入口URL对应的索引值。13、如权利要求12所述的无线互联网SP业务URL的记录系统,其特征在于,所述子链接对应的父URL为该父URL对应的索引值。14、如权利要求IO、11、12或13所述的无线互联网SP业务URL的记录系统,其特征在于,列表处理模块包括SP业务的入口URL判断模块,用于依据SP业务表判断用户访问的URL是否为SP业务的入口URL;用户访问表处理模块,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理;公共URL记录表处理模块,用于根据用户访问的URL对公共URL记录表进行处理。15、一种无线互联网SP业务的定位方法,其特征在于,包括步骤l,设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;步骤2,从WAP数据中获取用户访问的URL和用户的手机号码;步骤3,依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,用于记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系;步骤4,依据用户访问的URL在公共URL记录表中定位SP业务。16、一种无线互联网SP业务的定位系统,其特征在于,包括列表设置模块,用于设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;用户信息获取模块,用于从WAP数据中获取用户访问的URL和用户的手机号码;列表处理模块,用于依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,以记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系;SP业务定位模块,用于依据用户访问的URL在公共URL记录表中定位SP业务。全文摘要本发明涉及一种无线互联网SP业务URL的记录方法及系统。该记录方法包括步骤1,设置SP业务表、用户访问表和公共URL记录表,其中SP业务表中包含SP业务的入口URL;步骤2,从WAP数据中获取用户访问的URL和用户的手机号码;步骤3,依据用户的手机号码和用户访问的URL对用户访问表进行处理,并依据用户访问的URL对公共URL记录表进行处理,用于记录用户访问的URL及其子链接,以及该子链接与用户访问的URL之间的关系。本发明能够记录用户访问的URL信息,快速的定位服务提供商(SP)业务,快速得到用户访问路径,并且尽量少的内存资源占用。文档编号H04L12/24GK101309292SQ200810114519公开日2008年11月19日申请日期2008年6月6日优先权日2008年6月6日发明者冯双建,刘健民,刘如君,剑常,王明会,罗勤勇,博董,佶蔡,迪黄申请人:中国联合通信有限公司;北京微智信业科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1