基于可视化搜索的网络购物导航方法

文档序号:6430870阅读:157来源:国知局
专利名称:基于可视化搜索的网络购物导航方法
技术领域
本发明涉及一种网络购物导航方法,尤其涉及一种基于可视化搜索引擎系统实现的网络购物导航方法,属于互联网垂直搜索技术领域。
背景技术
互联网已经成为人们获取信息的主要来源之一。为了帮助用户从漫无边际的互联网数据中快速获取所需的信息,搜索引擎发挥着不可替代的作用。搜索引擎(search engine)是根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,从而为用户提供检索服务的信息服务系统。它并不真正搜索互联网的网页,而是搜索预先整理好的网页索引数据库。垂直搜索引擎(vertical search engine)是针对某一特定领域、某一特定人群或某一特定需求提供的具有一定价值的信息和相关服务,是通用搜索引擎的细分和延伸。它对网页索引数据库中的某类专门信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎的特点是“专、精、深”,且具有行业色彩。相较于通用搜索引擎的海量信息无序化,垂直搜索引擎显得更加专注、具体和深入。垂直搜索引擎大体上包括以下几方面的技术1.搜索引擎爬虫用于抓取互联网上的相关网页;2.网页结构化信息抽取技术或元数据采集技术用于从网页中抽取出结构化的数据;3.分词、索引用于存储并索引数据;4.数据展现由于存储的数据并非简单的网页数据,需要考虑根据行业需求进行展示。在分词、索引方面,现有的搜索引擎根据用户输入信息进行搜索时,往往是根据其输入的内容进行分析,即进行分词,将输入信息分为所谓的“元词汇”后,根据这些“元词汇” 来进行大规模的检索运算。当输入的信息越多时,进行的检索运算也越多,因此搜索引擎的计算能力开销较大。例如当用户一次输入两个词汇时,搜索引擎理论上要进行一次千万数量级的矩阵运算。因此,现在的搜索引擎在硬件上投入越来越大,而搜索效果并未获得明显的改善。在数据展现方面,目前主流的搜索引擎如谷歌(Google)、百度(Baidu)、必应 (Bing)等都以纯文字方式逐条显示搜索结果。对于每一项搜索结果显示网页标题,并且在网页标题后面跟上一个网页描述摘要。这种版面设计方式可以在一个页面中呈现更多的搜索结果,但是由于仅显示网页的文字摘要,用户根据文字摘要的内容点击一个搜索结果,却发现出现的页面与其想要的页面相差甚远。于是用户只能点击返回,再去点击另一个搜索结果,造成用户的体验很差。为此,谷歌公司在2010年推出了搜索结果可视预览功能,允许用户在搜索结果列表中直接以缩略图的形式预览每个页面。用户将在搜索结果右侧看到一个放大镜标志,点击放大镜就可以看到这个页面的缩略图预览。用户还可以向下滑动,查看所有搜索结果的预览图。但是,实现上述效果所付出的硬件成本和软件成本都是巨大的。目前有一些技术手段可以实现页面预览功能,例如使用CGI程序抓取浏览器的图像区,利用浏览器的绘图功能生成图片等。但是,现有技术中并没有利用搜索引擎爬虫实现页面预览功能的解决方案。在现有搜索引擎爬虫的运行过程中,普遍只将网页的内容按网页文件进行分析,抽取其中的内容。一些搜索引擎爬虫则更进一步,对这些内容进行简单的处理,如加以语义标注等,方便搜索引擎进行整理排序。但是,这些搜索引擎爬虫普遍不具备页面渲染的功能,因此并不能方便地实现搜索结果页面预览功能。垂直搜索引擎的应用方向很多,例如企业库搜索、供求信息搜索引擎、购物搜索、 房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索等。以购物搜索引擎为例,整体工作流程大致如下抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介等,然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。在申请号为201010501027.0的中国发明专利申请中,公开了一种网络购物导航方法。在该方法中,客户端通过图片搜索引擎在服务器端查找实体商品图片的关联群的商品图片展示,包括以下步骤所述服务器端接收商品图片,建立所有商品图片相似度的关联群;所述客户端的显示页面通过所述图片搜索引擎发送被点击商品图片的检索指令;所述服务器端将被点击商品图片的关联群的商品图片通过搜索引擎发送给所述客户端在显示页面展示。该网络购物导航方法以商品图片关联群的方式为用户导购商品,使用户能够在减少点击次数的情况下迅速找到目标商品,提高网络购物的效率。但是,现有基于搜索引擎的网络购物导航技术普遍存在一个缺点,就是从搜索到查看再到购买的整个体验过程存在网页跳转的脱节,用户到最后往往找不到最初的购买路径,只能重新使用搜索引擎再次进行搜索,白白浪费大量的时间精力。

发明内容
本发明所要解决的技术问题在于提供一种基于可视化搜索引擎系统实现的网络购物导航方法。该导航方法使网络购物过程中的“搜索”、“查看”和“比较”形成一个完整的过程,改善了用户的网络购物体验。为实现上述的发明目的,本发明采用下述的技术方案一种网络购物导航方法,基于可视化搜索引擎系统实现,所述可视化搜索引擎系统包括网络爬虫装置和显示控制装置,其中所述网络爬虫装置用于抓取并生成网页缩略图,其特征在于在所述可视化搜索引擎系统用于网络购物导航时,首先根据用户输入的购物对象关键词,由所述显示控制装置在搜索结果页面的左侧显示购物对象的文字搜索结果,搜索结果页面的右上角和右下角显示与所述文字搜索结果所对应的网页缩略图,搜索结果页面的中心区域显示用户当前所选择的购物对象的焦点网页缩略图;在所述搜索结果页面中设置挑选栏,用户将所选择的搜索结果放入所述挑选栏中进行比较,再从挑选栏中进入购物对象所在的网页进行购买。其中较优地,在所述挑选栏中,为每一个针对购物对象的目标网页设定一个网页 ID,对所述网页ID开展中转管理。其中较优地,所述挑选栏暂时保存所述网页ID,通过对所述网页ID的操作实现加入或抛弃想购买的物品。其中较优地,在所述搜索结果页面中还设置收藏夹,所述收藏夹对注册用户开放,长期保存所述注册用户所挑选的网页ID。其中较优地,在进行比较时,将由所述网络爬虫装置抓取并生成的购物对象缩略图集中在一起供用户挑选。其中较优地,用户确定要购买的购物对象后,通过链接进入该购物对象所在的网店页面进行购买,所述网店页面采用虚浮方式进行显示。本发明所提供的网络购物导航方法将网络购物过程中的“搜索”、“查看”和“比较” 集成在可视化搜索引擎系统的内部完成,由此形成一个完整的网络购物导航过程,有效改善了用户的网络购物体验。


下面结合附图和具体实施方式
对本发明作进一步的详细说明。图1为本网络购物导航方法中使用的可视化搜索引擎系统的整体架构示意图;图2为可视化搜索引擎系统的显示页面示意图;图3为可视化搜索引擎系统作为网络购物搜索引擎的首页示例图;图4为根据用户输入信息进行“搜索”时的搜索结果页面示例图;图5为用户将初步挑选的购物对象集中在一起“查看”,以便进行“比较”的显示页面示例图;图6为用户经“比较”确定要购买的购物对象后,进入该购物对象所在的网店页面的示例图。
具体实施例方式本发明所提供的网络购物导航方法是基于图1所示的可视化搜索引擎系统实现的。下面首先对该可视化搜索引擎系统进行说明,然后再详细介绍本网络购物导航方法的具体实施步骤。如图1所示,该可视化搜索引擎系统可以包括网页搜集、网页整理与索引、页面渲染、查询服务等多项服务功能。这些服务功能主要是通过网络爬虫装置和显示控制装置共同配合实现的,具体说明如下在可视化搜索引擎系统中,网络爬虫装置主要由以下各部分组成1.信息采集器每个信息采集器是一个网页蜘蛛(Web Spider),处于网络爬虫装置的底层,是网络爬虫装置与海量的互联网信息(如论坛、博客、WAP、文档、音视频资料等)直接进行交互的接口部分。信息采集器的作用是获取Web页面。它通常从信息源(如用户查询、URL列表或某一页面)出发,通过http协议请求,下载Web页面,页面分析器分析页面并提取链接, 然后信息采集器再以迭代的方式访问网络。在本发明的一个具体实施例中,信息采集器优选采用图的遍历算法(如广度优先或深度优先策略)搜索Web页面。2.链接(URL)过滤器在URL库里存放的是从采集到的页面中提取出来的所有URL,为避免采集页面出现“主题漂移”问题,这些URL在进入URL库前都必须经过主题相关性预测。我们利用扩展元数据(即HTML Tag如Anchor等信息)的语义信息,对从采集到的页面内提取出来的链接(URL)进行主题相关性预测,按照相关链接进行采集、不相关链接直接丢弃的原则进行剪枝处理,减少系统采集无关页面的数量,从而大量节省系统运行成本,有效提高主题信息搜索的速度和效率。链接过滤器将被预测为指向主题相关页面的链接(URL)入库存储,进而作为待采集URL由URL管理器分配给各个信息采集器采集该URL链接所指向的Web页面。3.页面过滤器为进一步提高系统的查准率,需要对采集下来的页面进行主题相关性判断,也就是页面过滤。这实质上是一个文本主题分类的过程。通过去除相关性较小的页面(小于设定的阈值),提高系统的查准率。根据全信息理论,自然语言作为认识主体所表述的“事物运动状态及其变化方式”,包括形式、含义和其对认识主体的效用等三方面,分别称为事物的语法信息、语义信息和语用信息,而这三者的整体则称为“全信息”。自然语言文本具有词语同义性、词语多义性等特点,而Web文本是自然语言的一种特殊载体,因此在判断一篇文本是否与系统的采集主题相关时,我们不但要关心文本的语法信息,还需要关心文本的语义准确性。本网络爬虫装置的页面过滤器以此为依据,吸收传统向量空间模型的思想,采用基于概念的向量空间法进行页面内容的过滤,通过将词汇映射到概念一级,从词所表达的概念意义层次也就是语义层次对文本进行相关性分析。4.页面分析器页面分析器的主要功能是解析抓取下来的页面内容,可以分为两部分工作一部分是解析出带有链接标记的URL,交给URL过滤器解析,提取出链接;另一部分是将页面内容解析为文本格式,交给页面过滤器处理。5. URL 管理器URL管理器的主要功能是管理URL任务。一方面URL管理器从URL库中获得URL 列表,并将它们进行任务排列后分配给多个信息采集器,另一方面URL管理器从多个信息采集器中获得新的URL列表,将这些列表以一定的策略保存到URL库中。网络爬虫装置在实现网络爬虫的基本功能时,首先由URL管理器启动信息采集器开始Web页面的采集工作,并对采集的Web页面进行存储。然后由页面分析器进行分析,获得标记和页面两部分。其中的标记由送入URL过滤器进行解析,而页面部分送入页面过滤器,由页面过滤器进行内容冗余检测后,存入页面库中。Web页面在由URL过滤器进行限定站点范围和主题的过滤之后,送入URL库中。此后,与URL库连接的图片生成器开始工作, 针对URL库中存储的URL生成页面对应的图片。关于该网络爬虫装置的进一步说明,可以参阅本发明人的在先申请《具备页面渲染功能的网络爬虫系统及其实现方法》(专利申请号201010590806. 2),在此就不详细赘述了。利用本可视化搜索引擎系统中的网络爬虫装置,当我们根据网页的地址进行检索后,不仅可以了解该页面的基本内容,更重要的是能够看到其基本的显示效果,从而更多地了解整个页面的内容。在本可视化搜索引擎系统中,所要显示的互联网搜索结果包括两类类型的数据-文字搜索结果数据和相对应的网页缩略图数据,而不是单一类型的文字数据或图形数据。为了在同一显示页面中同时显示尽可能多的搜索结果,同时又要实现对多种数据的有效控制,体现两类类型数据的关联关系。本可视化搜索引擎系统中的显示控制装置采用如图2所示的显示位置设置方案,即文字显示区域与图形显示区域纵向并行排列,在显示页面的中心部分设置焦点显示区域。被选中的文字焦点和相对应的图形焦点结合起来,排列在同一水平线上。这种显示位置设置方案是考虑到文字的阅读顺序是从左至右,为遵守人们的阅读习惯,同一关联内容(即相互对应的文字焦点和图形焦点)必须从左至右在同一水平线上列示。如图2所示,本可视化搜索引擎系统中的显示控制装置在显示页面中同时显示搜索结果的文字摘要(即文字搜索结果)和相对应的网页缩略图。为了实现较佳的显示效果,该显示控制装置中至少包括三个显示功能单元,分别是文字搜索结果显示单元、焦点网页缩略图显示单元和图形搜索结果显示单元。其中,文字搜索结果显示单元位于整个显示页面的左侧中间位置,焦点网页缩略图显示单元位于整个显示页面的中心区域,而图形搜索结果显示单元可以有多个,分别位于焦点网页缩略图显示单元的右上角和右下角(也可以是其它的位置)。在文字搜索结果显示单元中,可以以列表方式显示网络搜索的文字搜索结果。例如在图2所示的实施例中,以列表方式显示了文字搜索结果1 文字搜索结果5。在该显示控制装置作为计算机显示器的情况下,用户可以使用鼠标进一步在这些文字搜索结果中进行点选,例如点选文字搜索结果3作为感兴趣的文字搜索结果,并可以进一步点击其对应的链接。为了避免客户点击一个文字搜索结果后,却发现出现的页面与其想要的页面相差甚远,本显示控制装置中对文字搜索结果显示单元与焦点网页缩略图显示单元、图形搜索结果显示单元之间设置了显示内容上的相互关联,其中将文字搜索结果显示单元中被用户点选的文字搜索结果(即文字焦点)所对应的网页与焦点网页缩略图显示单元关联起来, 而其它的文字搜索结果所对应的网页与图形搜索结果显示单元关联起来。换句话说,焦点网页缩略图显示单元中始终显示用户所点选的文字搜索结果(即文字焦点)所对应的网页缩略图(即图形焦点),而图形搜索结果显示单元中显示未被用户点选的其它文字搜索结果所对应的网页缩略图。该焦点网页缩略图显示单元和图形搜索结果显示单元可以利用上述的网络爬虫装置实现网页缩略图的显示。在本显示控制装置中,焦点网页缩略图显示单元所占据的显示面积较大且始终位于显示页面的中心区域。这样,用户所点选的文字搜索结果所对应的网页缩略图可以得到清晰、全面的展示,便于用户决定是否进行进一步的点击操作。当上述可视化搜索引擎系统作为面向网络购物场合服务的垂直搜索引擎(以下简称图购搜索)时,所提供的网络购物导航网站入口首页如图3所示。在图购搜索的首页中,搜索框位于页面的上方,其左侧是醒目的“图购”标识,下方是一系列常用的搜索快捷方式,包括“最新”、“推荐”、“化妆品”、“团购”、“综合购物”、“购物打折”、“数码家电”、“女性时尚”、“母婴儿童”、“服装服饰”等。在上述搜索框及搜索快捷方式的下方是由一系列网页缩略图组成的主题精选。这些网页缩略图都是由可视化搜索引擎系统中的网络爬虫装置抓取生成的。本发明所提供的图购搜索的使用过程充分尊重普通用户的使用习惯,包括搜索-筛选-比较-再筛选(该步骤可以省略)-进入购物对象所在的网店页面购买等步骤。 这些步骤与使用其它购物搜索引擎是十分类似的。但现有的购物搜索引擎在使用时,“查看”和“比较”的操作往往需要离开购物搜索引擎所在的网站,操作很不方便,而且经过复杂的网页跳转之后用户往往找不到最初的搜索入口。为了解决这一问题,本图购搜索通过网络爬虫装置和显示控制装置的共同配合,将网络购物过程中的“搜索”、“查看”和“比较”集成在可视化搜索引擎系统的内部完成,由此形成一个完整的网络购物导航过程,极大地改善用户的购物体验。图4为根据用户输入信息进行“搜索”时的搜索结果页面示例图。在该示例图中, 用户在搜索框中输入了“汽车”的购物对象关键词,于是在显示页面的左侧显示了与购物对象“汽车”相关的文字搜索结果,而显示页面的右上角和右下角显示了与文字搜索结果所对应的网页缩略图。用户当前所选择的购物对象的焦点网页缩略图位于整个显示页面的中心区域。图4所示的显示页面的基本框架是由可视化搜索引擎系统中的显示控制装置决定的,因此与图2所示的显示页面十分类似。由于图4所示的显示页面可以清楚地显示某一购物对象所在的网页缩略图,因此用户不必点击该购物对象所在的网页即可完成“查看”的操作。由于该“查看”操作完全在图购搜索的内部完成,使用户的操作大为简化。另一方面,用户仅仅使用图购搜索就可以看到所要购买的对象及其价格等关联信息,通过对网页的挑选实现对购物对象的挑选,实现了在搜索引擎层面寻找购物对象,使图购搜索所发挥的网络购物导航作用更加突出。为了方便用户在使用图购搜索时进行挑选与比较,在图4所示的搜索结果页面中设置了挑选栏和收藏夹。在挑选栏中,为每一个针对购物对象的目标网页设定一个网页ID, 在目标购物对象处理过程中对这个网页ID开展中转管理。挑选栏可以利用cookie和后台挑选暂存库,存储暂时保存的网页ID,并通过对网页ID的操作实现加入或抛弃想购买的物品。在用户使用图购搜索时进行网络购物时,搜索出的结果很多,必须先放入到挑选栏以便进行“比较”,再从挑选栏中进入目标购物对象所在的网页。图购搜索中的挑选栏对于任何用户都是开放的,而收藏夹只针对注册用户开放。存放在挑选栏中的网页ID只是暂时保存。在用户一段时间没有使用图购搜索时,相应的挑选栏会自动清空。注册用户所使用的收藏夹则可以长期保存用户所挑选的网页ID,以便以后随时可以调用。本图购搜索的一个显著特点在于用户的搜索结果必须先放入到挑选栏以便进行 “比较”,再从挑选栏中进入目标购物对象所在的网页。图5为用户将初步挑选的购物对象集中在一起“查看”,以便进行“比较”的显示页面示例图。该“比较”过程中所显示的购物对象缩略图仍然是由网络爬虫装置抓取并生成的。由于本图购搜索中的网络爬虫装置具有很强的网页缩略图抓取能力,因此能够在图购搜索的内部实现购物对象缩略图的任意显示, 以便用户集中放在一起进行“比较”。在“比较”过程中,用户仍然没有离开图购搜索所提供的平台,因此避免了现有购物搜索引擎在进行“比较”时需要进行反复网页跳转的麻烦,极大地简化了用户的操作。由于本图购搜索作为网络购物门户,仅仅提供网络购物导航功能,本身并不销售任何商品,因此用户在经过“比较”,确定要购买的对象后,需要通过图购搜索所提供的链接进入该购物对象所在的网店页面进行购买。图6为用户进入购物对象所在的网店页面的示例图。在这一操作过程中,购物对象所在的网店页面采用虚浮方式进行显示,并控制目标的走向,实现在搜索引擎结果内的直接转换,从而使用户没有离开图购搜索本地的感觉,进一步改善用户的购物体验。
以上对本发明所提供的基于可视化搜索的网络购物导航方法进行了详细的说明。 对本领域的技术人员而言,在不背离本发明实质精神的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。
权利要求
1.一种网络购物导航方法,基于可视化搜索引擎系统实现,所述可视化搜索引擎系统包括网络爬虫装置和显示控制装置,其中所述网络爬虫装置用于抓取并生成网页缩略图, 其特征在于在所述可视化搜索引擎系统用于网络购物导航时,首先根据用户输入的购物对象关键词,由所述显示控制装置在搜索结果页面的左侧显示购物对象的文字搜索结果,搜索结果页面的右上角和右下角显示与所述文字搜索结果所对应的网页缩略图,搜索结果页面的中心区域显示用户当前所选择的购物对象的焦点网页缩略图;在所述搜索结果页面中设置挑选栏,用户将所选择的搜索结果放入所述挑选栏中进行比较,再从挑选栏中进入购物对象所在的网页进行购买。
2.如权利要求1所述的网络购物导航方法,其特征在于在所述挑选栏中,为每一个针对购物对象的目标网页设定一个网页ID,对所述网页ID 开展中转管理。
3.如权利要求2所述的网络购物导航方法,其特征在于所述挑选栏暂时保存所述网页ID,通过对所述网页ID的操作实现加入或抛弃想购买的物品。
4.如权利要求1所述的网络购物导航方法,其特征在于在所述搜索结果页面中还设置收藏夹,所述收藏夹对注册用户开放,长期保存所述注册用户所挑选的网页ID。
5.如权利要求1所述的网络购物导航方法,其特征在于在进行比较时,将由所述网络爬虫装置抓取并生成的购物对象缩略图集中在一起供用户挑选。
6.如权利要求1所述的网络购物导航方法,其特征在于用户在确定要购买的购物对象后,通过链接进入该购物对象所在的网店页面进行购买,所述网店页面采用虚浮方式进行显示。
全文摘要
本发明公开了一种网络购物导航方法,基于可视化搜索引擎系统实现。首先根据用户输入的购物对象关键词,在搜索结果页面的左侧显示购物对象的文字搜索结果,搜索结果页面的右上角和右下角显示与文字搜索结果所对应的网页缩略图,搜索结果页面的中心区域显示用户当前所选择的购物对象的焦点网页缩略图;在搜索结果页面中设置挑选栏,用户将所选择的搜索结果放入挑选栏中进行比较,再从挑选栏中进入购物对象所在的网页进行购买。本发明将网络购物过程中的“搜索”、“查看”和“比较”集成在可视化搜索引擎系统的内部完成,由此形成一个完整的网络购物导航过程,有效改善了用户的网络购物体验。
文档编号G06F17/30GK102270331SQ20111023435
公开日2011年12月7日 申请日期2011年8月14日 优先权日2011年8月14日
发明者黄斌 申请人:黄斌
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1