记录及搜索网页的方法以及记录浏览网页的方法

文档序号:6607821阅读:263来源:国知局
专利名称:记录及搜索网页的方法以及记录浏览网页的方法
技术领域
本发明涉及一种搜索引擎搜集数据的方法以及使用者记录自己浏览过的网页的方法。
背景技术
图1为现有搜索引擎86运作的示意图,搜索引擎86会自动抓取网页84并搜集于网页数据库85内。另外使用者也可通过网页浏览装置82 (如个人电脑)主动将网页83位置(web address)输入搜索引擎86 (如Google ,Yahoo 等搜索网站),通常使用者必须填入一些数据以登录于搜索引擎86,譬如美国专利第6631496号的个人化管理网页信息系统 (System for personalizing, organizing and managing web information)艮口揭不此功能。一个搜索引擎的好坏,主要由使用者所感受的准确度来决定。然而根据商业规模大小,现今搜索引擎可能必须索引数千万或更多的网页内容,远远超过人力能够负荷的程度,因此搜索引擎背后,都有相当多的数字与统计数据辅助排序与查询判断。另一方面,对于网站经营者而言,其被搜索到的次数,以及出现在搜索结果的顺位,会直接影响使用者点击的意愿,所以能够让自己网站最容易被找到,以及排在最前面,成了搜索引擎市场上的游戏规则。虽然搜索引擎带来相当多的方便,但由于互联网的网页数量实在太过庞大,使用者常常必须花大量的时间寻找资料。当使用者找到想要的资料并且可能还会再用到,使用者则常记录网页地址放入网页书签(bookmarks)。然而记录网页书签也造成使用者许多负担,网页书签的数量会一直增加,使用者进而对网页书签进行分类管理以方便管理,然而随着分类数量增加,且每一类别内的网址数目持续增加,使用者最后还是要面对大量网页书签的问题。美国专利第6631496号的个人化管理网页信息系统(System forpersonalizing, organizing and managing web information),除了如上所述可让使用者填入一些数据以登录于搜索引擎之外,搜索引擎会根据使用者所填入的数据以及网站内容以树状结构方式自动帮书签分类,以解决书签分类麻烦的问题。这些书签也可分享给不同的使用者,美国专利第6631496号企图建立一个群组式的书签,而以统一的分类方式对书签分类,然而自动分类的分类方式不一定符合每一个使用者的习惯,搜索引擎也提供关键词搜索的方式。另外第6631496号的搜索引擎因为要自动抓取网页内容,因此搜索引擎会产生极大的负担, 而且第6631496号的搜索引擎也如传统的搜索引擎会将网页内容所关联的网页内容一起储存。另外美国专利第6,366,923号的由互联网搜集所选择的数据 (Gatheringselected information from the world wide web)提供查询网页功能,使用者可将网页的内容记录下来成为一个文件,并且储存于自己的电脑。然而这样的方式必须记录于自己的电脑,并且仅能搜索自己的记录而不能分享。
为了记录自己浏览网页的记录,浏览器提供“历史记录”。另外Google 工具也提供此记录,然而“历史记录”因个人隐私并不适合公开与其他人分享。

发明内容
本发明中的搜索引擎可让使用者找到自己过去浏览过的网页,浏览过的网页可以分成自动记录或人工记录,本发明的方法不像是传统的网络书签,使用者必须输入关键词以找到浏览过的网页,另外传统的网络书签基本上使用者是记录主域名的网址而不包括内容,而本发明是让使用者记录有兴趣的网页内容。通过浏览过网页的记录,多个使用者能够键入关键词以找到大家曾经浏览过且记录的网页,即本发明的搜索引擎服务器比起传统搜索引擎服务器而言,本发明的搜索引擎服务器仅提供大家曾经浏览过且记录的网页。另外为节省搜索引擎的负担,网页的内容建议由使用者的浏览器上传至搜索引擎服务器。本发明搜索引擎服务器的重点是由使用者(网页浏览装置)触发的搜索引擎,即搜索引擎服务器中的网页数据库的内容是由使用者决定的,并非搜索引擎服务器自动抓取,而使用者不需经过麻烦的程序将网页登录于引擎服务器。使用者的浏览程序需要嵌入一搜索嵌入界面,根据实施例搜索嵌入界面包括关键词输入界面、检索确认键、手动传送键以及设定键。设定键包括自动加入、搜索个人、设定个人代号、设定黑白名单、加标签、本日精选、我的记录以及登录等按键。自动加入按键为开启 (ON)的设定时,只要使用者浏览的网页都会自动上传至搜索引擎服务器;但当自动加入按键为关闭(OFF)的设定时,使用者需要点击手动传送键才会将浏览的网页传至搜索引擎服务器。为了避免私密的网页上传,使用者可以将特定域名设为黑名单。另外对于使用者而言,在点击我的记录后,使用者可以浏览所记录的网页,并且使用者可点击删除键以删除过去的记录。


图1为现有搜索引擎运作的示意图。图2为本发明搜索引擎服务器运作的示意图。图3为本发明的流程图。图4为本发明关于搜索嵌入界面的实施例。图5为本发明关于搜索嵌入界面的实施例,显示下拉选项的情形。图6为本发明关于搜索嵌入界面的实施例,显示“设定个人代号”的功能。图7为本发明关于搜索嵌入界面的实施例,显示“设定黑白名单”的功能。图8为本发明关于搜索嵌入界面的实施例,显示“设定加标签”的功能。图9为本发明关于网页数据库的示意图。图10为本发明关于搜索嵌入界面的实施例,显示“本日精选”的功能。图11为本发明关于搜索嵌入界面的实施例,显示“我的记录”的功能。图12为本发明关于搜索嵌入界面的实施例,显示“搜索”的功能。图13为本发明关于搜索嵌入界面的实施例,显示“搜索”结果的网页。
图14为本发明关于搜索嵌入界面的实施例,显示“搜索”结果的网页,但网页仅限于个人的记录。图15为本发明第二实施例的流程图。
主要元件符号说明
搜索引擎服务器10处理器11
存储器12网页数据库15
索引内容16网址位置字段16a
索引字段16b来源子段16c
其他字段16d网页内容17
网页浏览装置31a、31b第二网页浏览装置:
检索用信息40记录信息50
个人代号51标签M
网址55搜索信息60
关键词61搜索嵌入界面70
关键词输入界面71检索确认键71a
手动传送键72设定键73
自动加入731搜索个人732
设定个人代号733设定黑白名单734
加标签735本日精选736
我的记录737删除键737a
分享键737b登录738
网页浏览装置81、82搜索引擎86
网页数据库85网页83、84网络 90网页 91、91a浏览程序9具体实施例方式为能更了解本发明的技术内容,特举一个较佳具体实施例说明如下。以下请一并参考图2,关于本发明搜索引擎服务器10运作的示意图。搜索引擎服务器10包括一处理器11及一存储器12,存储器12内有搜索引擎程序,使得处理器11执行搜索引擎程序并管理网页数据库15以达到搜索引擎的功能。搜索引擎服务器10通常由许多电脑、大量硬盘等设备所构成,图2仅为示意图。网页浏览装置31a、31b、31c将其所想要记录的网页91通过网络90上传到搜索引擎服务器10,而网页浏览装置32a、32b也可通过网络90进行搜索。本发明搜索引擎服务器10是由使用者(网页浏览装置31a、31b、31c)触发的搜索引擎,即网页数据库15的内容是由使用者决定的,并非搜索引擎服务器10自动抓取。需注意的是,图2上网页浏览装置 31a.31b.31c当然也可进行搜索,而网页浏览装置32a、3^也可上传网页至搜索引擎服务器10,图2仅是为了更清楚解释的目的。图3请参见本发明的流程图,并请一并参考图4 图14,以下以网页浏览装置31a
6及网页浏览装置32a为例。步骤Sl 第一使用者(图未示)通过网页浏览装置31a的浏览程序95浏览一网页91a,如图4。步骤S2 请一并参考图5,第一使用者如果喜欢网页91a,第一使用者点击手动传送键72将网页91a对应的记录信息50传送至搜索引擎服务器10。手动传送键72为搜索嵌入界面70其中的一按键,在本发明中搜索嵌入界面70嵌入于浏览程序95上,如图5所示。搜索嵌入界面70在本实施例主要包括关键词输入界面 71、检索确认键71a、手动传送键72以及设定键73。设定键73包括自动加入731、搜索个人 732、设定个人代号733、设定黑白名单734、加标签735、本日精选736、我的记录737以及登录738等按键。在图5的状态,自动加入731的设定为OFF,表示当第一使用者在浏览网页91a时, 网页91a对应的记录信息50不会自动传送至搜索引擎服务器10,但当自动加入731的设定为ON(图5未示)时,当第一使用者在浏览网页91a时,网页91a对应的记录信息50会自动传送至搜索引擎服务器10。记录信息50至少包括网址55,但建议还包括网页内容53。网页浏览装置31a传送网页内容53 (描述网页的程序代码,如文字内容、HTML、XHTMAL, JavaScript、CSS等)给搜索引擎服务器10可以降低搜索引擎服务器10的负担,这是与传统搜索引擎不同的方法。 另外记录信息50也可包括传送至搜索引擎服务器10的网页为手动传送或自动传送(根据自动加入731设定),譬如以M代表手动传送,而以A代表自动传送,如此搜索引擎服务器 10可以根据这些信息来判断网页的重要性。请参考图6,使用者可点击设定个人代号733以设定个人代号(如ID、会员代码)。 若有设定个人代号51,记录信息50可以包括个人代号51以便搜索引擎服务器10可以记录是谁上传的(有关记录个人代号的优点请参考步骤5有关图10的说明)。当个人代号已设定,使用者可点击登录738。有时使用者因为涉及个人隐私不想上传某特定域名的网页,不管在自动加入731 的设定为0N(启动)或OFF(关闭),使用者可以点击设定黑白名单734,如图7所示,使用者可以输入特定域名以防止网页内容上传,当然使用者也可将黑名单再变更为白名单。使用者还可以将想要记录的网页91a设定标签,请参考图8,使用者可点击加标签 735后再点击手动传送键72。譬如使用者输入标签M "Green Life”,记录信息50还可以包括标签M以便搜索引擎服务器10可以记录网页91a相对应的标签M,使用者以后可以输入‘‘Green Life”以方便搜索记录的网页91a。步骤S3 搜索引擎服务器10接收记录信息50,记录信息50如步骤S2所述,可至少包括网址55,也可能还包括网页内容53、标签M、个人代号51及手动传送或自动传送的记录(如 M 或 A)。步骤S4 网页内容53进行索引化以产生一检索用信息40。搜索引擎服务器10可以根据网址55抓取对应的网页内容53,也可由网页浏览装置31a所传送的记录信息50中取得。网页内容53进行索引化是现有的技术,主要是将网页内容53中不需要的内容去除,不需要的内容主要是程序代码,以及将重复的文字去除。搜索引擎服务器10也可有黑名单的设定,若发现上传的网址为涉及隐私的网址, 搜索引擎服务器10不会记录使用者上传的网址及其网页内容。步骤S5 将网址55与检索用信息40建立一对应关系。请参考图9,搜索引擎服务器10的网页数据库15包括多个索引内容16及对应的网页内容17。网页内容17 —般作为数据库存用,可作为网页备用或者索引内容16出现问题的备用。索引内容16可以看作一页页的数据,每一索引内容16对应一网址55。索引内容 16主要包括网址位置字段16a、索引字段16b、来源字段16c以及其他字段16d,索引内容16 的各字段都有对应关系。网址位置字段16a记录记录信息50中的网址55,譬如www. savetheearthsite. org。索引字段16b记录步骤S4所产生的检索用信息40。来源字段16c记录记录信息50中的个人代号51及标签M以及网页上传为手动传送或自动传送(譬如M或A作为区分,请参考步骤S2)。如果有十位设定个人代号的使用者都上传同一网址,则来源字段16c会记录此十位使用者的个人代号。另外使用者若有为此网址设定标签,则标签可以连同个人代号储存于来源字段16c,譬如MarkOl (Green Life, Μ),即个人代号MarkOl以手动方式上传此网页,并加上标签Green Life ;而Linda (Earth, Α)指个人代号Linda在浏览此网页时自动上传此网页,而此网页没有设标签(Null)。其他字段16d譬如记录此索引内容16所产生的时间,多少使用者上传,被浏览次数及时间,重要性等。请参考图10,使用者点击本日精选736后,由于索引内容16的其他字段16d可记录被浏览次数及时间等,因此网页91b可显示本日精选的网页。请参考图11,使用者点击我的记录737后,由于索引内容16的来源字段16c可记录个人代号51,因此使用者“MarkOl”所记录的网址可如网页91c显示出来。使用者可以浏览所记录的网页,并且使用者可点击删除键737a以删除过去的记录,当然在删除记录后, 需要传送删除。另外使用者也可决定其所记录的网页是否分享给其他人,譬如原来设定只要上传记录信息50传送至搜索引擎服务器10后(步骤S》,原先预设是会分享记录的网页给其他人(也可预设为不分享),当使用者点击我的记录737后,可通过分享键737b改变是否分享,譬如图11分享键737b若为黑色方块代表分享,若为空心方块代表不分享。当然点击删除键737a或点击分享键737b之后,网页浏览装置31a要送出改变的信息给搜索引擎服务器10以便改变网页数据库15。步骤S6:请参考图12,第二使用者(图未示)通过网页浏览装置32a的浏览程序95d搜索网页,键入关键词61 (譬如“save earth”),并按下检索确认键71a。假设第二使用者搜索网页时在设定键73的搜索个人732设定为“Off”的情况,则表示第二使用者想搜索检索用信息40中合乎关键词61的所有网址。步骤S7 网页浏览装置3 传送搜索信息60给搜索引擎服务器10。搜索信息60包括关键词61,也可还包括其他信息譬如第二使用者的使用代号(尤其假设步骤S6中搜索个人732 设定为“On”的情况)。步骤S8 搜索引擎服务器10接收搜索信息60。步骤S9 搜索引擎服务器10比对关键词61是否在该检索用信息40,此为一般搜索引擎的现有技术,不在此赘述。步骤SlO 搜索引擎服务器10传送合乎搜索条件的网址55及节录信息(通常是部分包括有关键词的网页内容)给网页浏览装置32a。步骤Sll:网页浏览装置3 接收网址55节录信息并显示于网页91d,如图13所示。需注意的是,假设步骤S6中搜索个人732设定为“On”的情况,搜索信息60除关键词61外也还包括第二使用者的使用代号,此时步骤S9搜索引擎服务器10除了比对关键词61是否在该检索用信息40之外,还需比对是否为第二使用者的记录。譬如图14所示的网页91e仅显示第二使用者所记录且符合关键词61的网址。另外需注意的是,本发明是提供给多人使用,每一个使用者可以记录网址,也可搜索自己或其他使用者记录的网址。图3的流程图是以第一及第二使用者为例子,主要是方便说明本发明的重点。图15是以单一使用者进行记录及搜索的流程图,图15的流程图与图3大同小异,图15的所有步骤的动作都与图3 —样,只是步骤6a、7a、lla发生在网页浏览装置31a这一方。综上所述,本发明无论就目的、方案及效果,均显示其不同于现有技术的特征。应注意的是,上述实施例仅为了便于说明而举例而已,本发明所主张的保护范围应以权利要求所述为准,而非仅限于上述实施例。
权利要求
1.一种记录及搜索网页的方法,用于一搜索引擎服务器,其特征在于,一第一网页浏览装置及一第二网页浏览装置通过一网络与该搜索引擎服务器连接,该搜索引擎服务器提供网页搜索服务给该第一网页浏览装置及该第二网页浏览装置,该方法包括下列步骤接收一记录信息,该记录信息由该第一网页浏览装置通过该网络传送,该记录信息包括一网址;将该网址所对应的网页内容进行索引化以产生一检索用信息;将该网址与该检索用信息建立一对应关系;接收一搜索信息,该搜索信息由该第二网页浏览装置通过该网络传送,该搜索信息包括至少一关键词;以及比对该至少一关键词是否在该检索用信息中,若该检索用信息包括该至少一关键词, 则将该检索用信息所对应的该网址传送至该第二网页浏览装置。
2.如权利要求1所述的记录及搜索网页的方法,其特征在于,该记录信息还包括该网页内容,该网页内容由该第一网页浏览装置通过该网络传送。
3.如权利要求2所述的记录及搜索网页的方法,其特征在于,该记录信息还包括记录该记录信息是否由该第一网页浏览装置以手动上传。
4.如权利要求3所述的记录及搜索网页的方法,其特征在于,该记录信息还包括一第一身份码,且该第一身份码与该网址及该检索用信息建立一对应关系。
5.如权利要求4所述的记录及搜索网页的方法,其特征在于,该记录信息还包括一标签,且该标签包含于该检索用信息中。
6.一种记录及搜索网页的方法,用于一搜索引擎服务器,其特征在于,一第一网页浏览装置通过一网络与该搜索引擎服务器连接,使得该搜索引擎服务器提供网页搜索服务给该第一网页浏览装置,该方法包括下列步骤接收一记录信息,该记录信息由该第一网页浏览装置通过该网络传送,该记录信息包括一网址及一第一身份码;将该网址所对应的网页内容进行索引化以产生一检索用信息;将该网址、该第一身份码与该检索用信息建立一对应关系;接收一搜索信息,该搜索信息由该第一网页浏览装置通过该网络传送,该搜索信息包括至少一关键词;以及比对该至少一关键词是否在该检索用信息中,若该检索用信息包括该至少一关键词, 则将该检索用信息所对应的该网址传送至该第一网页浏览装置。
7.如权利要求6所述的记录及搜索网页的方法,其特征在于,该记录信息还包括该网页内容,该网页内容由该第一网页浏览装置通过该网络传送。
8.如权利要求7所述的记录及搜索网页的方法,其特征在于,该记录信息还包括记录该记录信息是否由该第一网页浏览装置以手动上传。
9.如权利要求8所述的记录及搜索网页的方法,其特征在于,该记录信息还包括一标签,且该标签包含于该检索用信息中。
10.如权利要求9所述的记录及搜索网页的方法,其特征在于,该搜索信息包括该第一身份码。
11.一种记录浏览网页的方法,其特征在于,一使用者使用一浏览程序浏览一网页时,该使用者将对应该网页的记录信息通过一网络传送至一搜索引擎服务器,使得该搜索引擎服务器记录该网页的存在,用以以便将来该使用者搜索到该网页,该方法包括下列步骤提供一搜索嵌入界面,该搜索嵌入界面嵌入于该浏览程序上,该搜索嵌入界面包括一关键词输入界面及一手动传送键;接受该使用者点击该手动传送键,以传送该记录信息至该搜索引擎服务器,该记录信息包括该网页对应的一网址;以及接受该使用者在关键词输入界面输入的至少一关键词。
12.如权利要求11所述的记录浏览网页的方法,其特征在于,该记录信息还包括该网页对应的网页内容。
13.如权利要求11所述的记录浏览网页的方法,其特征在于,该搜索嵌入界面还包括一设定键,该设定键包括一设定黑白名单按键,以让该使用者输入不想上传的域名的对应网页。
14.如权利要求13所述的记录浏览网页的方法,其特征在于,该设定键还包括一自动加入的按键,以让该使用者设定该自动加入为启动状态或关闭状态,当该自动加入为启动状态时,该网页会自动传送该记录信息至该搜索引擎服务器;当该自动加入为关闭状态时, 该使用者需点击该手动传送键,以传送该记录信息至该搜索引擎服务器。
15.如权利要求14所述的记录浏览网页的方法,其特征在于,该记录信息还包括该网页对应的网页内容。
16.如权利要求15所述的记录浏览网页的方法,其特征在于,该设定键还包括一设定个人代号的按键,以让该使用者输入一身份码。
17.如权利要求16所述的记录浏览网页的方法,其特征在于,该记录信息还包括该使用者对应的该身份码。
18.如权利要求17所述的记录浏览网页的方法,其特征在于,该搜索嵌入界面还包括加标签的按键,以让该使用者输入对应于该网页的一标签。
19.如权利要求13所述的记录浏览网页的方法,其特征在于,该设定键还包括一我的记录按键,以显示该网页对应的该网址,其中该网址对应一分享键,用以使该使用者决定是否分享该使用者记录的该网址。
全文摘要
一种记录及搜索网页的方法,可让使用者找到自己过去浏览过的网页,通过浏览过网页的记录,多个使用者能够键入关键词以找到大家曾经浏览过且记录的网页。本发明搜索引擎服务器比起传统搜索引擎服务器而言,本发明搜索引擎服务器仅提供大家曾经浏览过且记录的网页,而且为节省搜索引擎的负担,网页的内容建议是由使用者的浏览器上传至搜索引擎服务器。
文档编号G06F17/30GK102375833SQ20101025565
公开日2012年3月14日 申请日期2010年8月12日 优先权日2010年8月12日
发明者李宏麟, 陈善达 申请人:橘子电视股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1