一种自动获取指定页面内容更新的方法和装置的制作方法

文档序号:6439670阅读:190来源:国知局
专利名称:一种自动获取指定页面内容更新的方法和装置的制作方法
技术领域
本发明涉及一种自动获取指定页面内容更新的方法和装置。
背景技术
通常,我们需要在某个服务器网站中浏览新闻,查找资源,查看论坛的某一个帖子,在论坛中提问等相关的一些获取信息操作,这个获取信息的页面的地址(URL)是经常是固定不变的,然而,有时我们同样是访问一个URL页面,会发现显示的内容是我们之前已经看过的,或是根本就没有更新过。例如经常浏览的一个新闻网页,里面有很多新闻标题的链接,可能最近已经看过全部标题对应的链接内容了,等再次看这个新闻网页查看时,发现这些标题链接从来没有更新过,竟然跟上一次看的是一样的,让你"白跑了一趟"。又比如查看某论坛的帖子时,通常无法获知所关注帖子什么时候可能会有更新内容,现有技术只能通过用户手动不断的请求查看或刷新以便查看某一个网页(URL)页面是否有更新内容,使浏览及查看的操作效率下降,浪费用户时间。

发明内容
本发明的目的是提供一种自动获取指定页面内容更新的方法和装置,它方便用户对获取指定页面更新内容,提高了操作效率。为达到上述目的,本发明采用如下技术方案一种自动获取指定页面内容更新的方法,包括步骤1 获取最新页面;步骤2 对比页面更新内容;步骤3 发送页面更新内容。进一步地,所述步骤1具体地包括步骤11 读取并遍历URL队列,若判断存在未遍历的URL,则转至步骤2,若否,则结束遍历;步骤12 读取URL,根据URL创建网站连接,请求服务器返回页面内容;步骤13 获取页面内容,根据URL对应的ID,将更新的页面内容存放在临时位置 tmpl,将页面上一次访问内容存放在临时位置tmp2。进一步地,所述步骤2具体地包括步骤21 读取tmpl并将对应的ID存入Iistl列表,读取tmp2并将对应的ID存 Λ list2 列表;步骤22 循环遍历Iistl列表,若Iistl列表中还存在对应的ID,则读取文件ID, 若否,结束遍历;步骤23 循环遍历list2列表,若list2列表中还存在对应的ID,则读取文件ID, 若否,结束遍历,并将tmpl下的ID移至tmp2目录下;步骤M 分别读取tmpl和tmp2中对应的ID的页面内容进行对比,若两个页面内容一致,则转至步骤22,若否,转至步骤25 ;步骤25 逐行对比tmpl和tmp2中对应的ID的页面内容,得出差异内容并将其存放在临时位置tmp3。进一步地,所述步骤3具体地包括步骤31 读取tmp3并将对应的ID存入list3列表;步骤32 循环遍历list3列表,若list3列表中还存在对应的ID,则读取文件ID, 若否,结束遍历;步骤33 根据读取的ID生成一个邮件体,创建与邮件服务器的连接并把邮件体发送到指定收件人;步骤34 删除该文件ID的文件内容。进一步地,所述步骤1中还包括设置定时程序,用于定时轮询URL队列获取内容。一种自动获取指定页面内容更新的装置,包括获取模块,用于获取最新页面内容;对比模块,用于对比页面更新内容;发送模块,用于发送页面更新内容。进一步地,所述获取模块具体地包括读取及遍历模块,用于判断是否存在未遍历的URL ;连接及请求模块,用于根据URL创建网站连接并请求服务器返回页面内容;获取及存放模块,用于获取页面内容,并根据URL对应的ID将更新的页面内容存放在临时位置tmpl,将页面上一次访问内容存放在临时位置tmp2。进一步地,所述对比模块具体地包括存储ID模块用于读取tmpl并将对应的ID存入Iistl列表及读取tmp2并将对应的ID存入list2列表;遍历清单1模块用于循环遍历Iistl列表,若Iistl列表中还存在对应的ID,则读取文件ID,若否,结束遍历;遍历清单2模块用于循环遍历list2列表,若list2列表中还存在对应的ID,则读取文件ID,若否,结束遍历,并将tmpl下的ID移至tmp2目录下;页面比较模块用于分别读取tmpl和tmp2中对应的ID的页面内容进行对比,若两个页面内容一致,则转至步骤22,若否,转至步骤25 ;存放差异模块用于逐行对比tmpl和tmp2中对应的ID的页面内容,得出差异内容并将其存放在临时位置tmp3。进一步地,所述发送模块具体地包括存储ID模块用于读取tmp3并将对应的ID存入list3列表;遍历清单3模块用于循环遍历list3列表,若list3列表中还存在对应的ID,则读取文件ID,若否,结束遍历;生成邮件体模块用于根据读取的ID生成一个邮件体,创建与邮件服务器的连接并把邮件体发送到指定收件人;删除ID模块用于删除该文件ID的文件内容。进一步地,所述装置还包括定时模块,用于定时轮询URL队列获取内容。
本发明解决了为获取指定页面内容的更新而不断手工去请求页面的麻烦,实现了自动获取功能,特别是当需要获取页面内容更新的页面较多时,通过本发明更易节省用户的时间,并省去用户烦冗的操作,提高操作效率。


图1为本发明的自动获取指定页面内容更新方法中获取最新页面内容的流程示意图;图2为本发明的自动获取指定页面内容更新方法中对比页面更新内容的流程示意图;图3为本发明的自动获取指定页面内容更新方法中发送页面更新内容的流程示意图4为本发明的自动获取指定页面内容更新的方法中发送页面更新内容的流程示意
图5为本发明的自动获取指定页面内容更新的装置的模块结构示意图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。如图1所示,一种自动获取指定页面内容更新的方法,包括一种自动获取指定页面内容更新的方法,包括步骤1 获取最新页面;步骤2 对比页面更新内容;步骤3 发送页面更新内容。作为一种优选方案,如图2所示,所述步骤1具体地包括步骤11 读取并遍历URL队列,若判断存在未遍历的URL,则转至步骤2,若否,则结束遍历;步骤12 读取URL,根据URL创建网站连接,请求服务器返回页面内容;步骤13 获取页面内容,根据URL对应的ID,将更新的页面内容存放在临时位置 tmpl,将页面上一次访问内容存放在临时位置tmp2。作为一种优选方案,如图3所示,所述步骤2具体地包括步骤21 读取tmpl并将对应的ID存入Iistl列表,读取tmp2并将对应的ID存 Λ list2 列表;步骤22 循环遍历Iistl列表,若Iistl列表中还存在对应的ID,则读取文件ID, 若否,结束遍历;步骤23 循环遍历list2列表,若list2列表中还存在对应的ID,则读取文件ID, 若否,结束遍历,并将tmpl下的ID移至tmp2目录下;步骤M 分别读取tmpl和tmp2中对应的ID的页面内容进行对比,若两个页面内容一致,则转至步骤22,若否,转至步骤25 ;
具体地,本发明设置内容对比程序,定时轮询两个临时位置tmp 1和tmp2存放的页面内容,例如,可设置每5分钟轮询一次.把两个临时位置的相同ID的页面内容进行对比。 对比的结果会有三种情况Dtmpl中存在的ID,tmp2不存在,这时,就把该ID在tmpl中存放的内容复制到 tmp2存放;2) tmpl中存在的ID,tmp2也存在,但它们二个的内容经过对比后,是确认相同的, 这时不做其它处理;3) tmpl中存在的ID,tmp2也存在,但它们二个的内容经过对比后,确认不相同,这时就将不相同的部分抓取出来并存放在tmp3中,同样是用ID来标识,再把tmpl中该ID对应的内容复制到tmp2中存放。步骤25 逐行对比tmpl和tmp2中对应的ID的页面内容,得出差异内容并将其存放在临时位置tmp3。作为一种优选方案,如图4所示,所述步骤3具体地包括步骤31 读取tmp3并将对应的ID存入list3列表;步骤32 循环遍历list3列表,若list3列表中还存在对应的ID,则读取文件ID, 若否,结束遍历;步骤33 根据读取的ID生成一个邮件体,创建与邮件服务器的连接并把邮件体发送到指定收件人;步骤34 删除该文件ID的文件内容。具体地,本发明设置一个发送邮件程序,定时轮询临时位置tmp3,如果tmp3中存在有以ID标识的内容,则读取该ID的内容,把内容作为邮件内容,ID对应的URL可以作为邮件的标题,发送到指定的收件人。最后,要在磁盘中删除该ID对应的内容文件。本领域技术人员应当理解的是,步骤3的实现并不局限于上述邮件方式来提醒用户更新,邮件方式提醒指示本发明的一种优选方案,本发明还可以采用本领域技术人员容易想到的能够提醒用户更新的任何其他方式。步骤1中还优选地包括设置定时程序,用于定时轮询URL队列获取内容。定时程序不断轮询URL队列,例如,可设置每2分钟轮询一次,把队列中的每一个分别URL取出来, 并根据这个URL建立网络连接,获取最新的页面内容,把它存放在磁盘的临时位置tmpl,并且每一个页面内容的存放都有唯一的ID来标识。如图5所示,与上述的自动获取指定页面内容更新的方法相对应,本发明还提供了一种自动获取指定页面内容更新的装置,其包括获取模块,用于获取最新页面内容;对比模块,用于对比页面更新内容;发送模块,用于发送页面更新内容。进一步地,所述获取模块具体地包括读取及遍历模块,用于判断是否存在未遍历的URL ;连接及请求模块,用于根据URL创建网站连接并请求服务器返回页面内容;获取及存放模块,用于获取页面内容,并根据URL对应的ID将更新的页面内容存放在临时位置tmpl,将页面上一次访问内容存放在临时位置tmp2。
进一步地,所述对比模块具体地包括存储ID模块用于读取tmpl并将对应的ID存入Iistl列表及读取tmp2并将对应的ID存入list2列表;遍历清单1模块用于循环遍历Iistl列表,若Iistl列表中还存在对应的ID,则读取文件ID,若否,结束遍历;遍历清单2模块用于循环遍历list2列表,若list2列表中还存在对应的ID,则读取文件ID,若否,结束遍历,并将tmpl下的ID移至tmp2目录下;页面比较模块用于分别读取tmpl和tmp2中对应的ID的页面内容进行对比,若两个页面内容一致,则转至步骤22,若否,转至步骤25 ;存放差异模块用于逐行对比tmpl和tmp2中对应的ID的页面内容,得出差异内容并将其存放在临时位置tmp3。进一步地,所述发送模块具体地包括存储ID模块用于读取tmp3并将对应的ID存入list3列表;遍历清单3模块用于循环遍历list3列表,若list3列表中还存在对应的ID,则读取文件ID,若否,结束遍历;生成邮件体模块用于根据读取的ID生成一个邮件体,创建与邮件服务器的连接并把邮件体发送到指定收件人;删除ID模块用于删除该文件ID的文件内容。进一步地,所述装置还包括定时模块,用于定时轮询URL队列获取内容。综上,本发明解决了为获取指定页面内容的更新而不断手工去请求页面的麻烦, 实现了定时自动获取功能。特别是需要获取页面内容更新的页面较多时,通过本发明的实现方法更能节省用户的时间,并省去用户烦冗的操作。以上所述仅为本发明的较佳实施例,并非用来限定本发明的实施范围;如果不脱离本发明的精神和范围,对本发明进行修改或者等同替换,均应涵盖在本发明权利要求的保护范围当中。
权利要求
1.一种自动获取指定页面内容更新的方法,其特征在于,包括 步骤1 获取最新页面;步骤2:对比页面更新内容; 步骤3:发送页面更新内容。
2.根据权利要求1所述的方法,其特征在于,所述步骤1具体地包括步骤11 读取并遍历URL队列,若判断存在未遍历的URL,则转至步骤2,若否,则结束遍历;步骤12 读取URL,根据URL创建网站连接,请求服务器返回页面内容; 步骤13 获取页面内容,根据URL对应的ID,将更新的页面内容存放在临时位置tmpl, 将页面上一次访问内容存放在临时位置tmp2。
3.根据权利要求1所述的方法,其特征在于,所述步骤2具体地包括步骤21 读取tmpl并将对应的ID存入Iistl列表,读取tmp2并将对应的ID存入list2 列表;步骤22 循环遍历Iistl列表,若Iistl列表中还存在对应的ID,则读取文件ID,若否, 结束遍历;步骤23 循环遍历list2列表,若list2列表中还存在对应的ID,则读取文件ID,若否, 结束遍历,并将tmpl下的ID移至tmp2目录下;步骤24 分别读取tmpl和tmp2中对应的ID的页面内容进行对比,若两个页面内容一致,则转至步骤22,若否,转至步骤25 ;步骤25 逐行对比tmpl和tmp2中对应的ID的页面内容,得出差异内容并将其存放在临时位置tmp3。
4.根据权利要求1所述的方法,其特征在于,所述步骤3具体地包括 步骤31 读取tmp3并将对应的ID存入list3列表;步骤32 循环遍历list3列表,若list3列表中还存在对应的ID,则读取文件ID,若否, 结束遍历;步骤33 根据读取的ID生成一个邮件体,创建与邮件服务器的连接并把邮件体发送到指定收件人;步骤34 删除该文件ID的文件内容。
5.根据权利要求1所述的方法,其特征在于,所述步骤1中还包括设置定时程序,用于定时轮询URL队列获取内容。
6.一种自动获取指定页面内容更新的装置,其特征在于,包括 获取模块,用于获取最新页面内容;对比模块,用于对比页面更新内容; 发送模块,用于发送页面更新内容。
7.根据权利要求6所述的装置,其特征在于,所述获取模块具体地包括 读取及遍历模块,用于判断是否存在未遍历的URL ;连接及请求模块,用于根据URL创建网站连接并请求服务器返回页面内容; 获取及存放模块,用于获取页面内容,并根据URL对应的ID将更新的页面内容存放在临时位置tmpl,将页面上一次访问内容存放在临时位置tmp2。
8.根据权利要求6所述的装置,其特征在于,所述对比模块具体地包括存储ID模块用于读取tmpl并将对应的ID存入Iistl列表及读取tmp2并将对应的 ID存入list2列表;遍历清单1模块用于循环遍历Iistl列表,若Iistl列表中还存在对应的ID,则读取文件ID,若否,结束遍历;遍历清单2模块用于循环遍历list2列表,若list2列表中还存在对应的ID,则读取文件ID,若否,结束遍历,并将tmpl下的ID移至tmp2目录下;页面比较模块用于分别读取tmpl和tmp2中对应的ID的页面内容进行对比,若两个页面内容一致,则转至步骤22,若否,转至步骤25 ;存放差异模块用于逐行对比tmpl和tmp2中对应的ID的页面内容,得出差异内容并将其存放在临时位置tmp3。
9.根据权利要求6所述的装置,其特征在于,所述发送模块具体地包括 存储ID模块用于读取tmp3并将对应的ID存入list3列表;遍历清单3模块用于循环遍历list3列表,若list3列表中还存在对应的ID,则读取文件ID,若否,结束遍历;生成邮件体模块用于根据读取的ID生成一个邮件体,创建与邮件服务器的连接并把邮件体发送到指定收件人;删除ID模块用于删除该文件ID的文件内容。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括定时模块,用于定时轮询URL队列获取内容。
全文摘要
本发明公开了一种自动获取指定页面内容更新的方法和装置,所述方法包括步骤1获取最新页面;步骤2对比页面更新内容;步骤3发送页面更新内容。本发明解决了为获取指定页面内容的更新而不断手工去请求页面的麻烦,实现了自动获取功能,特别是当需要获取页面内容更新的页面较多时,通过本发明更易节省用户的时间,并省去用户烦冗的操作,提高操作效率。
文档编号G06F17/30GK102521295SQ20111038901
公开日2012年6月27日 申请日期2011年11月30日 优先权日2011年11月30日
发明者鲁林 申请人:深圳市五巨科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1