一种用于基于查询序列获取黄页信息的方法与设备的制作方法

文档序号:6335328阅读:645来源:国知局
专利名称:一种用于基于查询序列获取黄页信息的方法与设备的制作方法
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于基于查询序列获取黄页信息的技 术。
背景技术
随着互联网应用的普及推广和对人们生活的渗透,越来越多的用户开始习惯于从 互联网获取其所需的信息,例如机构的地址、电话、传真、联系人、邮箱等黄页信息。然而,随着人机交互等计算机技术的进一步发展,人们从主动获取资源开始转为 依赖于互联网主动提供所需的资源。例如,用户在查找某些机构的黄页信息时,其并不知道 哪些网页中包含有其所想要查找的黄页信息。因此,如何基于用户输入的查询序列在全互联网范围内向其提供黄页信息,以提 高用户高效获取信息的搜索浏览体验,成为现今亟需解决的一个问题。

发明内容
本发明的目的是提供一种用于基于查询序列获取黄页信息的方法与设备。根据本发明的一个方面,提供了一种用于基于查询序列获取黄页信息的方法,该 方法包括以下步骤a获取用户通过用户设备输入的查询序列;b根据所述查询序列,判断所述查询序列是否包含黄页需求相关信息;c当所述查询序列包含黄页需求相关信息时,根据所述黄页需求相关信息,在黄页 索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄 页信息与所述黄页需求相关信息相匹配;d将所述一个或多个匹配网页提供给所述用户设备。根据本发明的另一方面,还提供了一种用于基于查询序列获取黄页信息的设备, 该设备包括第一获取装置,用于获取用户通过用户设备输入的查询序列;判断装置,用于根据所述查询序列,判断所述查询序列是否包含黄页需求相关信 息;查询装置,用于当所述查询序列包含黄页需求相关信息时,根据所述黄页需求相 关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个 匹配网页中的黄页信息与所述黄页需求相关信息相匹配;第一提供装置,用于将所述一个或多个匹配网页提供给所述用户设备。根据本发明的又一方面,还提供了一种搜索引擎,包括上述基于查询序列获取黄 页信息的装置。与现有技术相比,本发明基于用户输入的查询序列获取与之相匹配的黄页信息, 不仅提高了用户获取黄页信息的效率,也改善了用户的搜索浏览体验。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显图1示出根据本发明一个方面的用于基于查询序列获取黄页信息的系统拓扑图;图2示出根据本发明一个方面的用于基于查询序列获取黄页信息的设备示意图;图3示出根据本发明一个优选实施例的用于基于查询序列获取黄页信息的设备 示意图;图4示出根据本发明另一个方面的用于基于查询序列获取黄页信息的方法流程 图;图5示出根据本发明一个优选实施例的用于基于查询序列获取黄页信息的方法 流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1示出根据本发明一个方面的用于基于查询序列获取黄页信息的系统拓扑图, 其中包括网络设备1以及多个与之经由网络相连接的用户设备2。其中,网络设备1可与多 个用户设备2经由网络相连接,并获取用户通过用户设备2输入的查询序列;根据所述查询 序列,判断所述查询序列是否包含黄页需求相关信息;当所述查询序列包含黄页需求相关 信息时,根据所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配 网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配;将所 述一个或多个匹配网页提供给所述用户设备。在此,网络包括但不限于互联网、广域网、城 域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。另外,网络设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或 多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务 器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚 拟计算机。而用户设备2包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、 或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或IPTV 等。网络设备1与用户设备2之间的通信相互独立,可以是基于诸如TCP/IP协议、UDP协 议等的分组数据传输。本领域技术人员应能理解上述网络设备1、用户设备2以及连接其间的网络或通 信方式仅为举例,其他现有的或今后可能出现的网络设备、用户设备或网络、通信方式如可 适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解,图1中仅为简明起见而示出的各类网络元素的数量 可能小于一个实际网络中的数量,但这种省略无疑地是以不会影响对本发明进行清楚、充 分的公开为前提的。为简明起见,下面以一个用户设备2为例进行描述。本领域技术人员应能理解,网 络设备1可以同时与多个用户设备2交互,并根据从不同用户设备2输入的查询序列;根据所述查询序列,判断所述查询序列是否包含黄页需求相关信息;当所述查询序列包含黄页 需求相关信息时,根据所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一个或 多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相 匹配;将所述一个或多个匹配网页提供给与之相对应的用户设备2。图2示出根据本发明一个方面的基于查询序列获取黄页信息的设备示意图,其 中,网络设备1包括第一获取装置11、判断装置12、查询装置13和第一提供装置14。其中,第一获取装置11用于获取用户通过用户设备输入的查询序列。具体地,用 户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、或手写设备, 在浏览器软件、应用程序或客户端软件中输入查询序列;第一获取装置11通过页面技术, 例如JSP、ASP、PHP技术,实时地获取用户输入的查询序列。本领域技术人员应能理解上述 页面技术仅为举例,其他现有的或今后可能出现的页面技术如可适用于本发明,也应包含 在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述获 取用户浏览行为的技术仅为举例,其他现有的或今后可能出现的获取用户浏览行为的技术 如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。判断装置12用于根据所述查询序列,判断所述查询序列是否包含黄页需求相关 信息。具体地,判断装置12根据第一获取装置11获取的用户输入的查询序列,通过例如词 义分析、查询用户历史查询操作等方式,判断所述查询序列是否包含黄页需求相关信息。以 词义分析为例,所述查询序列中可能包含多个黄页需求相关信息,当判断装置12检测到其 中一个黄页需求相关信息时,即可以判断所述查询序列包含黄页需求相关信息,但此后,判 断装置12仍需继续执行操作,以获取所述查询序列中的全部黄页需求相关信息,以方便查 询装置13根据所述全部黄页需求相关信息进行匹配查询。优选地,所述判断装置12也可 以先进行获取的操作,获取所述查询序列中的全部黄页需求相关信息,再判断有无获取到 所述黄页需求相关信息,若有,则查询装置13继续执行下一步操作。例如,第一获取装置 11获取到用户输入的查询序列为“百度地址”,判断装置12检测到该查询序列中包含的“百 度”为黄页需求相关信息,判断该查询序列包含黄页需求相关信息,此后,判断装置12继续 进行检测,获取该查询序列中的另一个黄页需求相关信息“地址”。又如,判断装置12可以 获取该查询序列中的全部黄页需求相关信息“百度”和“地址”,再判断该查询序列中包含有 黄页需求相关信息。本领域技术人员应能理解上述判断查询序列是否包含黄页需求相关信 息的方式仅为举例,其他现有的或今后可能出现的判断查询序列是否包含黄页需求相关信 息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于 此。查询装置13用于当所述查询序列包含黄页需求相关信息时,根据所述黄页需求 相关信息,在黄页索引库15中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或 多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配。具体地,当判断装置12判断 得出所述查询序列包含黄页需求相关信息时,查询装置13根据所述黄页需求相关信息,在 黄页索引库15中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配网 页中的黄页信息与所述黄页需求相关信息相匹配。在此,所述黄页索引库15中存储有大量 包含有黄页信息网页,例如,网络设备1可以根据大量的网页和其中的黄页信息,通过建立 或更新数据表等形式,建立或更新所述黄页索引库15,在所述数据表中,可以是一个黄页信息对应一个网页,也可以是一个黄页信息对应包含有该黄页信息的几个网页。查询装置13 根据所述黄页需求相关信息,在黄页索引库15中进行匹配查询,首先获取与所述黄页需求 相关信息相匹配的黄页信息,再根据所述黄页信息,匹配获取一个或多个与所述黄页信息 相对应的匹配网页。例如,在黄页索引库15中,存储有“百度时代网络技术(北京)有限公 司”、“百度在线网络技术有限公司”、“百度时代网络技术(北京)有限公司客户发展部”三 个标题的网页及其中的黄页信息,用户输入查询序列“百度北京”,查询装置13根据其中的 黄页需求相关信息“百度北京”,在黄页索引库15中匹配到与之相对应的上述三个网页的 黄页信息,并根据所述黄页信息,匹配获取到上述三个网页。本领域技术人员应能理解上述 获取匹配网页的方式仅为举例,其他现有的或今后可能出现的获取匹配网页的方式如可适 用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。第一提供装置14用于将所述一个或多个匹配网页提供给所述用户设备2。具体 地,第一提供装置14根据查询装置13获取的一个或多个匹配网页,其中,所述一个或多个 匹配网页中的黄页信息与所述黄页需求相关信息相匹配,通过页面技术,例如JSP、ASP、PHP 技术,将所述一个或多个匹配网页以链接、摘要或缩略图等形式,按一定顺序和格式,嵌入 在搜索结果页面中,提供给所述用户设备2,供用户进行浏览。接前例,第一提供装置14将 查询装置13获取的“百度时代网络技术(北京)有限公司”、“百度在线网络技术有限公司”、 “百度时代网络技术(北京)有限公司客户发展部”三个标题的网页,以链接、摘要或缩略图 等形式,按一定顺序和格式,嵌入于搜索结果页面之中或之上,提供给所述用户设备2。本领 域技术人员应能理解上述将匹配网页提供给用户设备的方式仅为举例,其他现有的或今后 可能出现的将推荐信息提供给用户设备的方式如可适用于本发明,也应包含在本发明保护 范围以内,并在此以引用方式包含于此。优选地,网络设备1的各个装置之间是持续不断工作的。具体地,第一获取装置11 获取用户通过用户设备2输入的查询序列;随后,判断装置12根据所述查询序列,判断所 述查询序列是否包含黄页需求相关信息;当所述查询序列包含黄页需求相关信息时,查询 装置13根据所述黄页需求相关信息,在黄页索引库15中进行匹配查询,获取一个或多个匹 配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配;接 着,第一提供装置14再将所述一个或多个匹配网页提供给所述用户设备。在此,本领域技 术人员应理解“持续”是指网络设备1的各装置分别按照设定的或实时调整的工作模式要 求进行查询序列的获取、黄页需求相关信息的判断、匹配网页的获取及提供,直至该用户在 较长时间内停止通过用户设备2输入查询序列。优选地,网络设备1还可以包括第二提供装置(未示出)。所述第二提供装置用于 将所述黄页信息以突显的形式提供给所述用户设备。具体地,第二提供装置根据查询装置 13获取的一个或多个匹配网页中的黄页信息,通过页面技术,例如JSP、ASP、PHP技术,将所 述黄页信息以摘要、悬浮框或缩略图等形式,按一定顺序和格式,嵌入于搜索结果页面之中 或之上,提供给所述用户设备2,供用户进行浏览。在此,黄页信息的展现应与前述匹配网页 的展现相对应,例如当所述黄页信息以摘要的形式展现在搜索结果页面时,可以在所述匹 配网页的链接的下方展现给用户。优选地,还可以将所述黄页信息加粗、加黑,或改变字体、 字形、颜色,或增加背景颜色等方式,将其进行突显展现。当以悬浮框的形式提供给用户设 备时,可以是在页面的某个固定的区域显示,也可以由用户设定或根据浏览对象的位置确定,其窗口大小可以进行调节。例如,将所述黄页信息以悬浮框的形式显示在用户设备2的 输入框中,其可以是透明的以不影响用户的输入,并随着用户的输入操作不断变换其所处 的位置,例如随着输入序列变长,所述悬浮框不断右移。优选地,所述悬浮框还可以根据光 标与之的距离自动调整自身的透明度,以不影响用户的正常浏览;当光标移动到距所述悬 浮框的设定距离范围外时隐藏所述悬浮框;当在所述悬浮框之外点击时,隐藏所述悬浮框。 本领域技术人员应能理解上述提供黄页信息的方式仅为举例,其他现有的或今后可能出现 的提供黄页信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引 用方式包含于此。本领域技术人员应能理解,上述第一提供装置、第二提供装置仅为示例,在实践 中,它们可以是两个独立的模块,也可全部集成在一个模块中。优选地,网络设备1还可以包括规范化处理装置(未示出)。所述规范化处理装置 用于对所述黄页信息进行规范化处理,以获得规范化的黄页信息;其中,所述第二提供装置 还用于将所述规范化的黄页信息以突显的形式提供给所述用户设备2。查询装置13匹配查 询到的匹配网页中的黄页信息可能存在多种问题1)形式上并不统一,例如有的网页在电 话号码前加上了区号,有的没有加区号,再如有的匹配网页中的黄页信息包含电子邮箱地 址,有的则不包含;2)表述上不规范,如将“中国人民大学附属中学”记为“人大附中”。规范 化处理装置可以将所述黄页信息进行规范化处理,以获得形式统一、表述规范的黄页信息。 例如,规范化处理装置根据预置的黄页模板,对所述黄页信息进行规范化处理,例如将电话 号码统一按照“国际区号-国内区号-电话号码”的形式显示,又如假设规定提供给用户的 黄页信息包含有项目“机构名称、地址、邮编、网址、电话、传真、法定代表人”并按照一定的 格式排版,若该网页中不包含某一项的信息,则相应的项目空置。又如,规范化处理装置可 以根据对应于同一个黄页需求相关信息的多个匹配网页中的黄页信息,通过归类去重处理 得到对应于该黄页需求相关信息的黄页模板,然后根据此黄页模板对这多个匹配黄页中的 行黄页信息进行规范化,如将这些黄页信息按归类去重处理所得到的黄页模板进行格式排 版,将该黄页信息中的信息项填入该黄页模板的对应项目中,若该黄页信息不包含某个信 息项,则空置该黄页模板中的对应项目。再如,该规范化处理装置还可以通过自然语言处理 技术,使得黄页信息中的信息项表述更为规范,例如该规范处理装置利用自然语言处理技 术,将机构名称按Term切分,诸如“人大附中”,可分割为“人大”、“附中”;并结合同义词列 表、别名列表,可将其规范化为“中国人民大学附属中学”。此后,第二提供装置再通过页面 技术,例如JSP、ASP、PHP技术,将所述模板嵌入于返回给用户设备的搜索结果页面之中或 之上,以突显的形式提供给用户设备2。本领域技术人员应能理解,该规范化处理装置还可 以通过黄页模板与自然语言处理技术的结合,获取形式统一且表述规范的黄页信息。本领 域技术人员还应能理解上述规范化处理黄页信息的方式仅为举例,其他现有的或今后可能 出现的规范化处理黄页信息的方式如可适用于本发明,也应包含在本发明保护范围以内, 并在此以引用方式包含于此。优选地,网络设备1还可以包括第二获取装置(未示出)。所述第二获取装置用于 根据所述黄页需求相关信息,并结合所述查询序列,获取所述查询序列中的黄页附加需求 相关信息;根据所述黄页信息与所述黄页附加需求相关信息,获取与所述黄页附加需求相 关信息相匹配的黄页附加信息;其中,所述第二提供装置还用于将所述黄页信息与所述黄页附加信息以突显的形式提供给所述用户设备2。在用户输入的查询序列中,除与机构名 称有关、与机构联系方式有关或与机构法人有关的黄页需求相关信息外,还可能包含黄页 附加需求相关信息,例如与该机构有关的地图相关信息、路线相关信息等需求。具体地,第 二获取装置根据判断装置12所获取的黄页需求相关信息,并结合第一获取装置11获取的 查询序列,通过词义分析、数据库查询等方式,获取所述查询序列中的黄页附加需求相关信 息;此后,第二获取装置根据所述黄页信息与所述黄页附加需求相关信息,通过数据库查询 或利用第三方设备提供的应用程序接口(API)从第三方设备获取等方式,获取与所述黄页 附加需求相关信息相匹配的黄页附加信息;随后,第二提供装置通过页面技术,例如JSP、 ASP、PHP技术,将所述黄页信息与所述黄页附加信息嵌入于返回给用户设备2的搜索结果 页面之中或之上,以突显的形式提供给用户设备2。例如,用户通过用户设备2输入查询 序列“百度北京怎么去”,判断装置12通过词义分析,获取到该用户的黄页需求相关信息为 “百度北京”,第二获取装置根据该用户的黄页需求相关信息,并结合该用户输入的查询序 列,通过词义分析,获取到黄页附加需求相关信息为“地图”(或“乘车路线”);此后,第二获 取装置再根据“百度北京”的黄页信息与所述黄页附加需求相关信息,通过调用第三方地图 搜索设备获取“百度北京”的地图信息(或者通过数据库查询获得“百度北京”周边的乘车 信息,如轨道交通与公交线路);随后,第二提供装置再将所述“百度北京”的黄页信息与地 图信息(或乘车路线)提供给用户设备2。优选地,第二获取装置还可以取用户输入的查询 序列所包括的另一位置信息或者用户当前的定位信息(假设用户设备2包含有GPS等地理 信息模块等)作为一个端点,提供该端点与所述黄页信息所对应的另一个端点之间的详细 的路线图。本领域技术人员应能理解上述获取与提供黄页附加信息的方式仅为举例,其他 现有的或今后可能出现的获取或提供黄页附加信息的方式如可适用于本发明,也应包含在 本发明保护范围以内,并在此以引用方式包含于此。 优选地,网络设备1还可以包括第三获取装置(未示出)。所述第三获取装置用 于根据所述黄页需求相关信息,并结合所述查询序列,获取所述查询序列中的黄页焦点需 求相关信息;根据所述黄页信息与所述黄页焦点需求相关信息,获取与所述黄页焦点需求 相关信息相匹配的黄页焦点信息;此后,第二提供装置将所述黄页焦点信息以突显的形式 提供给所述用户设备。由于对于某一部分用户来讲,其可能只需要黄页信息中的黄页焦点 信息,例如地址、电话、网站中的一个或多个,网络设备1需要获取该用户的黄页焦点需求 相关信息,并进一步获取与之相匹配的黄页焦点信息。具体地,第三获取装置根据判断装置 12所获取的黄页需求相关信息,并结合第一获取装置11获取的查询序列,获取所述查询序 列中的黄页焦点需求相关信息;此后,第三获取装置根据所述黄页信息与所述黄页焦点需 求相关信息,通过词义分析、数据库查询等方式,获取与所述黄页焦点需求相关信息相匹配 的黄页焦点信息;随后,第二提供装置通过页面技术,例如JSP、ASP、PHP技术,将所述黄页 焦点信息嵌入于返回给用户设备2的搜索结果页面之中或之上,以突显的形式提供给用户 设备2。例如,用户通过用户设备2输入查询序列“联想客服电话”,判断装置12通过词义 分析,获取到该用户的黄页需求相关信息为“联想lenovo”,第三获取装置根据该用户的黄 页需求相关信息,并结合该用户输入的查询序列,通过词义分析,获取到黄页焦点需求相关 信息为“客服电话”;此后,第三获取装置再通过词义分析、数据库查询等方式,获取与所述 黄页焦点需求相关信息相匹配的黄页焦点信息“8008108888”;随后,第二提供装置通过页面技术,例如JSP、ASP、PHP技术,将所述黄页焦点信息“8008108888”嵌入于返回给用户设 备2的搜索结果页面之中或之上,以突显的形式提供给用户设备2。例如,将所述黄页焦点 信息“8008108888”以悬浮框的形式显示在用户设备2的输入框中,其可以是透明的以不影 响用户的输入,并随着用户的输入操作不断变换其所处的位置,例如随着输入序列变长,所 述悬浮框不断右移。本领域技术人员应能理解上述获取与提供黄页焦点信息的方式仅为举 例,其他现有的或今后可能出现的获取或提供黄页焦点信息的方式如可适用于本发明,也 应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,第二提供装置将黄页信息提供给用户设备2的突显方式,包括但不限于, 以下至少一项摘要、悬浮框和缩略图等形式。第二提供装置可以通过页面技术,例如JSP、 ASP、PHP技术,将查询装置13获取的黄页信息以摘要的形式提供给所述用户设备2,黄页 信息的展现应与该黄页信息所属的匹配网页的展现相对应,可以在所述匹配网页的链接的 下方展现给用户。优选地,还可以将所述黄页信息加粗、加黑,或改变字体、字形、颜色,或增 加背景颜色等方式,将其进行突显展示。第二提供装置还可以将查询装置13获取的黄页信 息,以悬浮框的形式提供给所述用户设备2,用户通过点击网页上特定的按钮或用户自定义 的按钮或按键,或者将光标悬停指向搜索结果页面中的链接时,打开所述悬浮框,以浏览所 述黄页信息。优选地,所述悬浮框可以是在页面的某个固定的区域显示,也可以由用户设定 或根据浏览对象的位置确定,其窗口大小可以进行调节。所述悬浮框还可以根据光标与之 的距离自动调整自身的透明度,以不影响用户的正常浏览;当光标移动到距所述悬浮框的 设定距离范围外时隐藏所述悬浮框;当在所述悬浮框之外点击时,隐藏所述悬浮框。例如, 将所述黄页信息以悬浮框的形式显示在用户设备2的输入框中,其可以是透明的以不影响 用户的输入,并随着用户的输入操作不断变换其所处的位置,例如随着输入序列变长,所述 悬浮框不断右移。第二提供装置还可以将查询装置13获取的黄页信息,以缩略图的形式提 供给所述用户设备2,用户可以通过点击特定的或自定义的按钮放大或缩小所述缩略图,以 浏览所述黄页信息。在此,本领技术人员应能理解,上述突显的形式同样适用于第二提供装 置将规范化的黄页信息、黄页信息与黄页附加信息以突显的形式提供给所述用户设备2本 领域技术人员还应能理解上述突显的形式仅为举例,其他现有的或今后可能出现的突显的 形式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,判断装置12还用于对所述查询序列进行词义分析,当确定所述查询序列 符合预定条件时,判断所述查询序列包含黄页需求相关信息,其中,所述预定条件包括但不 限于以下至少一项a)所述查询序列包含与机构名称有关的特定类别关键词;b)所述查询 序列包含与机构联系方式有关的特定类别关键词;c)所述查询序列包含与机构法人有关 的特定类别关键词。具体地,判断装置12根据第一获取装置11获取的用户输入的查询序 列,通过词义分析,判断所述查询序列中是否包含与机构名称有关的特定类别关键词,例如 机构的部分名称或全部名称,是否包含与机构联系方式有关的特定类别关键词,例如电话、 邮箱、传真、网址等,是否包含与机构法人有关的特定类别关键词,例如法人代表、法定代表 人等;当所述查询序列包含上述特定类别关键词时,判断所述查询序列包含黄页需求相关 信息。本领域技术人员应能理解上述判断查询序列是否包含黄页需求相关信息的预定条件 仅为举例,其他现有的或今后可能出现的判断查询序列是否包含黄页需求相关信息的预定 条件如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
更优选地,判断装置12还用于根据所述查询序列,并结合该用户的历史查询操 作,判断所述查询序列是否包含黄页需求相关信息。具体的,判断装置12根据第一获取装 置11获取的用户输入的查询序列,并结合该用户的历史查询操作,如用户曾使用的查询关 键词、用户对包含黄页信息的网页的点击浏览记录,判断所述查询序列是否包含黄页需求 相关信息。例如,判断装置12根据用户当前的查询序列为“百度”,结合该用户的历史查询 操作,如曾经点击包含有“百度公司”黄页信息的网页的URL,则判断该查询序列包括黄页需 求相关信息。又如,判断装置12根据用户当前的查询序列为“百度”,结合该用户的历史查 询操作,如该用户曾经变换查询序列,例如用户输入查询序列“百度”,在获得的搜索结果页 面中点击联想查询序列“百度公司的地址”,后者为明确的黄页需求,则判断该查询序列包 括黄页需求相关信息。判断装置12还可以对所述查询序列进行词义分析,并结合该用户的 历史查询操作,当确定该查询序列满足预定条件时,判断该查询序列包含黄页需求相关信 息。例如,判断装置12根据用户当前的查询序列为“百度”,结合该用户的历史查询操作, 如该用户曾经变换查询序列,例如用户输入查询序列“百度”,在获得的搜索结果页面中点 击联想查询序列“百度公司法人代表”,后者为明确的黄页需求,则判断该查询序列包括黄 页需求相关信息。本领域技术人员还应能理解上述判断查询序列是否包含黄页需求相关信 息的方式仅为举例,其他现有的或今后可能出现的判断查询序列是否包含黄页需求相关信 息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于 此。在此,该用户的所述历史查询操作既可以是网络设备1独立获取的,也可以是接受来自 其他产品或第三方设备所完成的对该用户的所述历史查询操作的获取。例如,可通过检测 该用户使用网络设备1的搜索服务过程中的操作,或通过向用户设备2询问并获取该用户 的COOKIE信息来获得该用户的历史查询操作,优选地,可赋予该用户一个临时ID并为其建 立一个历史查询操作库,将此次搜索过程中用户的历史记录保存于该临时历史查询操作库 中。本领域技术人员还应能理解上述获取用户的历史查询操作的方式仅为举例,其他现有 的或今后可能出现的获取用户的历史查询操作的方式如可适用于本发明,也应包含在本发 明保护范围以内,并在此以引用方式包含于此。优选地,网络设备1还可以包括第一更新装置(未示出)。所述第一更新装置用于 根据大量网页及其中的黄页信息,建立或更新所述黄页索引库15。具体地,第一更新装置对 通过爬虫工具等网页抓取工具直接抓取的大量网页,或者从第三方设备中获取的存储于该 第三方设备的大量网页,进行特征分析,以获取包含黄页信息的潜在目标页,并根据这些潜 在目标页及其中的黄页信息,建立或更新所述黄页索引库15。在此,第一更新装置确定潜 在目标页的方式,包括但不限于1)根据网址中包含有例如“shOW_COmpany”、"huangye,,、 “yellowpage”等表意信息的网页为潜在目标页;2)根据网页Title和Meta信息域中含有 “公司、企业、公司介绍、企业简介”等表意信息的网页为潜在目标页;3)根据在网页原文中 提取有“地址、电话、传真、邮编、联系人、名称”等表意的信息对的网页为潜在目标页;4)或 者根据其它的指向信息,例如anchor(锚文本)信息中包含有以上表意信息等的网页为潜 在目标页;5)上述几种方式的任意组合。第一更新装置通过相互补充验证,提取潜在目标 页中的有效机构名称、地址信息、邮编、电话、联系人、传真等黄页信息。将所述黄页信息与 所述潜在目标页通过建立或更新数据表等形式,建立或更新所述黄页索引库15。在所述数 据表中,可以是一个黄页信息对应一个网页,也可以是一个黄页信息对应包含有该黄页信息的几个网页。例如,在黄页索引库15中,“百度在线网络技术有限公司”的黄页信息“公司 全称百度在线网络技术有限公司;网址:http://www. baidu. com ;电话86_10_82621188 ; 电子邮件webmaster@baidu. com”可以只对应“百度在线网络技术有限公司” 一个网页,也 可以同时对应“百度在线网络技术有限公司_百度在线网络技术有限公司简介_艾瑞网行 业公司”这个网页。本领域技术人员应能理解上述建立或更新黄页索引库15的方式仅为举 例,其他现有的或今后可能出现的建立或更新黄页索引库15的方式如可适用于本发明,也 应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,查询装置13还用于当所述查询序列包含黄页需求相关信息时,根据所述 黄页需求相关信息,并结合该用户的用户相关信息,在黄页索引库15中进行匹配查询,获 取一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相 关信息相匹配。具体地,当判断装置12判断所述查询序列包含黄页需求相关信息时,查询 装置13根据所述黄页需求相关信息,并结合该用户的用户相关信息,如该用户的搜索历史 记录或用户设备的地址,在黄页索引库15中进行匹配查询,以获得与用户实际需求相匹配 的一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相 关信息相匹配。例如,查询装置13先将用户相关信息的关键词与黄页需求相关信息组合 成第二查询序列,随后,查询装置13再根据所述第二查询序列,在黄页索引库15中进行查 询匹配,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄 页需求相关信息相匹配。在此,所述用户相关信息既可以是网络设备1独立获取的,也可 以是接受来自用户设备2记录的,或者接受来自其他产品或第三方设备所获取的用户相关 信息。本领域技术人员应能理解上述获取用户相关信息的方法仅为举例,其他现有的或今 后可能出现的获取用户相关信息的方法如可适用于本发明,也应包含在本发明保护范围以 内,并在此以引用方式包含于此。优选地,所述用户相关信息包括但不限于以下至少一项a)用户属性;b)用户偏 好;c)用户搜索历史记录;d)用户设备的地址。用户属性包括但不限于,用户预先输入的 个人背景信息,例如性别、年龄、职业、宗教、国籍、教育程度等。当所述查询序列包含黄页 需求相关信息时,查询装置13根据所述黄页需求相关信息,并结合该用户的用户属性,在 黄页索引库15中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配网 页中的黄页信息与所述黄页需求相关信息相匹配。例如,用户输入查询序列“新东方”进行 查询,当用户为学生时,提供有关“新东方学校”的黄页信息及相应的匹配网页,当用户为 厨师时,提供有关“新东方厨师学校”的黄页信息及相应的匹配网页。用户偏好包括但不限 于,用户预先设置的一些偏好选择,例如关注的机构类型、行业信息等。当所述查询序列包 含黄页需求相关信息时,查询装置13根据所述黄页需求相关信息,并结合该用户的用户偏 好,在黄页索引库15中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹 配网页中的黄页信息与所述黄页需求相关信息相匹配。例如,用户设置其偏好的机构类型 为客服公司,则当用户输入查询序列“百度北京”时,优先提供有关“百度公司客服”的黄页 信息及相应的网页,当用户设置其偏好的机构类型为研发公司时,其输入查询序列“百度北 京”,优先提供有关“百度在线网络技术(北京)有限公司”等的黄页信息及相应的网页。用 户搜索历史记录,其由系统来记录和统计用户先前的搜索和点击浏览历史,从而可判断或 预测用户的需求。其中,当用户为登录用户时,网络设备1可通过该用户的ID在网络端保存有该用户相关信息的用户特征库中进行查询;当用户为非登录用户时,可通过检测该用 户使用本网络设备1的搜索服务过程中的动作,或通过向用户设备2询问并获取该用户的 COOKIE信息来获得,优选地,可赋予该用户一个临时ID并为其建立一个用户特征库,将此 次搜索过程中用户的历史记录保存于该临时用户特征库中。例如,用户输入查询序列“复旦 大学”,提供的匹配网页可能包括关于“复旦大学”、“复旦大学医学院”、“复旦大学出版社” 等的黄页信息,当用户点击“复旦大学医学院”时,网络设备1或用户设备2记录下用户的 此次浏览操作记录,当用户再次输入“复旦大学”或其他大学的名称作为查询序列时,网络 设备1优先将关于“某某大学出版社”的黄页信息及相应的匹配网页提供给该用户。用户 设备的地址,其可以反映该用户当前所处地域,可由网络设备1实时检测用户设备2的IP 地址来获取。例如,用户通过用户设备2输入查询序列“新东方语言学校”,网络设备1检测 到该用户设备2的IP地址位于北京,则优先将北京新东方语言学校的黄页信息及相应的匹 配网页提供给该用户。本领域技术人员应能理解上述用户相关信息仅为举例,其他现有的 或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并 在此以引用方式包含于此。优选地,网络设备1还包括第二更新装置(未示出)。所述第二更新装置用于获取 该用户对所述一个或多个匹配网页的浏览操作;根据所述浏览操作,更新该用户的所述用 户相关信息。具体地,所述第二更新装置根据与用户设备2及用户的交互,例如通过JSP、 ASP、PHP等页面技术,获取该用户对所述一个或多个匹配网页的浏览操作;并根据这些浏 览操作更新该用户的用户相关信息。在此,所述第二更新装置更新用户相关信息的方式包 括但不限于1)第二更新装置根据用户更改的预设信息,更新该用户的用户相关信息;2) 第二更新装置可在用户一次浏览操作结束后记录用户在此浏览过程中的所有动作,例如点 击、浏览或关闭;3)第二更新装置在用户一次浏览过程中记录用户每次动作并实时对网络 端该用户的特征库进行更新,从而可在用户在此次浏览过程中点击其他黄页信息时提供最 新的用户相关信息。例如,用户输入“复旦大学”,提供的匹配网页可能包括关于“复旦大 学”、“复旦大学医学院”、“复旦大学出版社”等的黄页信息,当用户点击“复旦大学医学院” 时,记录该用户的浏览操作并更新该用户的历史记录。本领域技术人员应能理解上述更新 用户相关信息的方式仅为举例,其他现有的或今后可能出现的更新用户相关信息的方式如 可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解,上述第一更新装置、第二更新装置仅为示例,在实践 中,它们可以是两个独立的模块,也可全部集成在一个模块中。图3示出根据本发明一个优选实施例的用于基于查询序列获取黄页信息的设备 示意图,网络设备1还可以包括预处理装置16’。其中,第一获取装置11’、判断装置12’、查 询装置13’和第一提供装置14’分别与图2所示对应装置11-14相同,故此处不再赘述,并 通过引用的方式包含于此。其中,预处理装置16’用于根据所述黄页需求相关信息,对所述黄页需求相关信息 进行预处理操作;其中,查询装置13’根据预处理操作后的所述黄页需求相关信息,在黄页 索引库15’中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中 的黄页信息与所述黄页需求相关信息相匹配。具体地,预处理装置16’根据判断装置12’ 所获取的黄页需求相关信息,通过自然语言处理技术,例如近义词替换、同义词替换、词义拓展等方式,对所述黄页需求相关信息进行预处理操作;随后,查询装置13’根据预处理操 作后的所述黄页需求相关信息,在黄页索引库15’中进行匹配查询,获取一个或多个匹配网 页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配。例如, 判断装置12’获取的用户的黄页需求相关信息为“上海交通学校”,则预处理装置16’可以 对此进行预处理操作,将其变换成“上海交通大学”(或“上海交通大学附属中学”)等;此 后,查询装置13’再根据该预处理操作后的黄页需求相关信息“上海交通大学”(或“上海交 通大学附属中学”),在黄页索引库15’中进行匹配查询,获取与之相匹配的一个或多个匹配 网页,所述一个或多个匹配网页中包含有“上海交通大学”(或“上海交通大学附属中学”) 的黄页信息。优选地,所述预处理操作包括但不限于以下至少一项a)近义词替换;b)同义词 替换;c)词义拓展。近义词替换例如“学校”替换为“小学”、“中学”或“大学”等。在上例 中,预处理装置16’可以依次将“上海交通学校”替换成“上海交通小学”、“上海交通中学” 和“上海交通大学”,查询装置13’依次将替换后的黄页需求相关信息在黄页索引库15’中 进行匹配查询。同义词替换例如将“上海交大”替换为“上海交通大学”等;词义拓展例如 将“公司,,拓展为“有限公司”、“有限责任公司”等。本领域技术人员应能理解上述预处理 操作仅为举例,其他现有的或今后可能出现的预处理操作如可适用于本发明,也应包含在 本发明保护范围以内,并在此以引用方式包含于此。在另一个优选的实施例中(参照图3),网络设备1还可以包括排序装置17’。其 中,第一获取装置11’、判断装置12’、查询装置13’和第一提供装置14’分别与图2所示对 应装置11-14相同,故此处不再赘述,并通过引用的方式包含于此。其中,排序装置17’用于根据预设规则,确定所述一个或多个匹配网页的优先级; 其中,第一提供装置14’根据所述优先级,将所述一个或多个匹配网页提供给所述用户设 备。具体地,排序装置17’根据预设规则,例如根据网络设备1获取的或接收来自用户设备 2统计的,或接收来自其他产品或第三方设备统计的所述匹配网页的累计点击量、所述匹配 网页的搜索排名等,确定查询装置13’所获取的所述一个或多个匹配网页的优先级;此后, 第一提供装置14’根据所述排序装置17’所确定的优先级,通过页面技术,例如JSP、ASP、 PHP技术,将所述一个或多个匹配网页以链接、摘要或缩略图等形式,按一定顺序和格式,嵌 入在搜索结果页面之中或之上,提供给所述用户设备2。例如,排序装置17’可以根据所述 一个或多个匹配网页的权威性,确定所述一个或多个匹配网页的优先级,如,对于同样包含 “百度在线网络技术有限公司”的黄页信息的两个匹配网页“百度在线网络技术有限公司” 和“百度在线网络技术有限公司_百度在线网络技术有限公司简介_艾瑞网行业公司”,由 于前者的权威性更高,因此其优先级较后者高。第一提供装置14’根据排序装置17’确定 的所述一个或多个匹配网页的优先级,例如按照优先级由大到小的顺序自上而下或由内而 外,以链接、摘要或缩略图等形式,将排序后的所述一个或多个匹配网页提供给用户设备2, 供用户进行浏览。接前例,随后,第一提供装置14’根据这两个匹配网页的优先级,将这两 个匹配网页提供给所述用户设备,其中,匹配网页“百度在线网络技术有限公司”相对“百度 在线网络技术有限公司_百度在线网络技术有限公司简介_艾瑞网行业公司”更为优先展 示。本领域技术人员应能理解上述将匹配网页提供给用户的方式仅为举例,其他现有的或 今后可能出现的将匹配网页提供给用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述预设规则基于包括但不限于以下至少任一项a)所述匹配网页的权 威性;b)所述匹配网页的累计点击量;c)所述匹配网页的搜索排名;d)所述匹配网页中黄 页信息的更新时间。排序装置17’可以根据所述一个或多个匹配网页中各网页的权威性, 确定所述一个或多个匹配网页的优先级。例如,对于同样包含“百度在线网络技术有限公 司”的黄页信息的两个匹配网页“百度在线网络技术有限公司”和“百度在线网络技术有限 公司_百度在线网络技术有限公司简介_艾瑞网行业公司”,由于前者的权威性更高,因此 其优先级较后者高。排序装置17’还可以根据网络设备1获取的或接收来自用户设备2统 计的,或接收来自其他产品或第三方设备获取的所述匹配网页的累计点击量,确定所述一 个或多个匹配网页的优先级。例如,对于查询装置13’所获取的一个或多个匹配网页,排序 装置17’根据所述一个或多个匹配网页中各网页的累计点击量确定其优先级,累计点击量 多的匹配网页优先级较高,累计点击量少的匹配网页则优先级较低。排序装置17’还可以 根据网络设备1获取的或接收来自用户设备2统计的,或接收来自其他产品或第三方设备 获取的所述匹配网页的搜索排名,确定所述一个或多个匹配网页的优先级。例如,对于查询 装置13’所获取的一个或多个匹配网页,排序装置17’根据用户以所述匹配网页作为搜索 的搜索排名,确定其优先级,搜索排名靠前的匹配网页优先级较高,搜索排名靠后的匹配网 页则优先级较低。排序装置17’还可以根据所述匹配网页中黄页信息的更新时间,确定所 述一个或多个匹配网页的优先级。例如,对于查询装置13’所获取的一个或多个匹配网页, 排序装置17’根据所述匹配网页中黄页信息的更新时间,提高最近更新的匹配网页的优先 级。又如,对于查询装置13’匹配查询获取的一个或多个匹配网页,其上对于同一个机构的 黄页信息可能不同,这时,可以根据网页上该黄页信息的更新时间进行排序,更新时间越近 的优先级越高。优选地,排序装置17’还可以根据上述所述匹配网页的权威性、所述匹配网 页的累计点击量、所述匹配网页的搜索排名和所述匹配网页中黄页信息的更新时间的任意 组合,通过例如分配给每一项因素一个权重,使用加权等方式,确定所述一个或多个匹配网 页的优先级。本领域技术人员应能理解上述预设规则所基于的因素仅为举例,其他现有的 或今后可能出现的预设规则所基于的因素如可适用于本发明,也应包含在本发明保护范围 以内,并在此以引用方式包含于此。在一个优选的实施例中(参照图3),网络设备1还可以包括第四获取装置(未示 出)。所述第四获取装置用于获取搜索引擎基于所述查询序列提供的第一搜索结果;其中, 所述第一提供装置还用于将所述一个或多个匹配网页和所述第一搜索结果提供给所述用 户设备2,其中,优先提供所述一个或多个匹配网页。具体地,第一提供装置14’除将包含有 黄页信息的匹配网页提供给用户设备2之外,还可以将第四获取装置获取的搜索引擎基于 所述查询序列提供的第一搜索结果提供给所述用户设备2,其中,优先提供所述一个或多个 匹配网页,例如,将所述一个或多个匹配网页以比所述第一搜索结果更高的优先级提供给 所述用户设备2。本领域技术人员应能理解,上述第一获取装置、第二获取装置、第三获取装置和第 四获取装置仅为示例,在实践中,它们可以是四个独立的模块,或者任意两个装置集成在一 个模块中,或者任意三个装置集成在一个模块中,也可全部集成在一个模块中。优选地,网络设备1还可以包括合并装置(未示出),合并装置用于将所述一个或多个匹配网页与所述第一搜索结果进行合并去冗余处理,以获得第二搜索结果;此后,第一 提供装置14’将所述第二搜索结果提供给所述用户设备2。由于基于黄页需求相关信息匹 配查询得到的匹配网页与基于查询序列搜索得到的第一搜索结果可能存在相同的网页,需 要对此进行合并去冗余处理,以免提供给所述用户设备2相同的网页。例如,用户输入查 询序列“百度公司”,网络设备1通过查询装置13’在索引库中匹配查询得到的匹配网页中 包含有“百度在线网络技术有限公司”这个网页,而通过第四获取装置获取得到的搜索引擎 基于查询序列“百度公司”提供的第一搜索结果中也同样包含有“百度在线网络技术有限 公司”这个网页,合并装置可以将这两个网页进行合并去冗余处理,只留下其中一个匹配网 页;此后,第一提供装置14’将合并处理后的匹配网页提供给所述用户设备2。优选地,上述基于查询序列获取黄页信息的设备可以与现有的搜索引擎相结合, 构成一种搜索引擎。搜索引擎(search engine)是指万维网环境中的信息检索系统,根据 一定的策略、运用特定的计算装置搜集互联网上的信息,在对信息进行组织和处理后,将处 理后的信息显示给用户。现有的搜索引擎可以是例如百度、Google、雅虎、有道、腾讯、搜狗寸。图4示出根据本发明另一个方面的用于基于查询序列获取黄页信息的方法流程 图。其中,在步骤Sl中,网络设备1获取用户通过用户设备输入的查询序列。具体地, 用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、或手写设 备,在浏览器软件、应用程序或客户端软件中输入查询序列;在步骤Sl中,网络设备1通过 页面技术,例如JSP、ASP、PHP技术,实时地获取用户输入的查询序列。本领域技术人员应能 理解上述页面技术仅为举例,其他现有的或今后可能出现的页面技术如可适用于本发明, 也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理 解上述获取用户浏览行为的技术仅为举例,其他现有的或今后可能出现的获取用户浏览行 为的技术如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于 此。在步骤S2中,网络设备1根据所述查询序列,判断所述查询序列是否包含黄页需 求相关信息。具体地,在步骤S2中,网络设备1根据在步骤Sl中获取的用户输入的查询 序列,通过例如词义分析、查询用户历史查询操作等方式,判断所述查询序列是否包含黄页 需求相关信息。以词义分析为例,所述查询序列中可能包含多个黄页需求相关信息,当网络 设备1在步骤S2中检测到其中一个黄页需求相关信息时,即可以判断所述查询序列包含黄 页需求相关信息,但此后,网络设备1仍需继续执行操作,以获取所述查询序列中的全部黄 页需求相关信息,以方便在步骤S3中根据所述全部黄页需求相关信息进行匹配查询。优选 地,所述在步骤S2中,网络设备1也可以先进行获取的操作,获取所述查询序列中的全部 黄页需求相关信息,再判断有无获取到所述黄页需求相关信息,若有,则网络设备1执行步 骤S3。例如,网络设备1在步骤Sl中获取到用户输入的查询序列为“百度地址”,在步骤S2 中,检测到该查询序列中包含的“百度”为黄页需求相关信息,判断该查询序列包含黄页需 求相关信息,此后,网络设备1继续进行检测,获取该查询序列中的另一个黄页需求相关信 息“地址”。又如,在步骤S2中,网络设备1可以获取该查询序列中的全部黄页需求相关信 息“百度”和“地址”,再判断该查询序列中包含有黄页需求相关信息。本领域技术人员应能理解上述判断查询序列是否包含黄页需求相关信息的方式仅为举例,其他现有的或今后可 能出现的判断查询序列是否包含黄页需求相关信息的方式如可适用于本发明,也应包含在 本发明保护范围以内,并在此以引用方式包含于此。在步骤S3中,当所述查询序列包含黄页需求相关信息时,网络设备1根据所述黄 页需求相关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一 个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配。具体地,当网络设备1 在步骤S2中判断得出所述查询序列包含黄页需求相关信息时,在步骤S3中,网络设备1 根据所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其 中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配。在此,所述黄 页索引库中存储有大量包含有黄页信息网页,例如,网络设备1可以根据大量的网页和其 中的黄页信息,通过建立或更新数据表等形式,建立或更新所述黄页索引库,在所述数据表 中,可以是一个黄页信息对应一个网页,也可以是一个黄页信息对应包含有该黄页信息的 几个网页。在步骤S3中,网络设备1根据所述黄页需求相关信息,在黄页索引库中进行匹 配查询,首先获取与所述黄页需求相关信息相匹配的黄页信息,再根据所述黄页信息,匹配 获取一个或多个与所述黄页信息相对应的匹配网页。例如,在黄页索引库中,存储有“百度 时代网络技术(北京)有限公司”、“百度在线网络技术有限公司”、“百度时代网络技术(北 京)有限公司客户发展部”三个标题的网页及其中的黄页信息,用户输入查询序列“百度北 京”,在步骤S3中,网络设备1根据其中的黄页需求相关信息“百度北京”,在黄页索引库中 匹配到与之相对应的上述三个网页的黄页信息,并根据所述黄页信息,匹配获取到上述三 个网页。本领域技术人员应能理解上述获取匹配网页的方式仅为举例,其他现有的或今后 可能出现的获取匹配网页的方式如可适用于本发明,也应包含在本发明保护范围以内,并 在此以引用方式包含于此。在步骤S4中,网络设备1将所述一个或多个匹配网页提供给所述用户设备2。具 体地,在步骤S4中,网络设备1根据在步骤S3中获取的一个或多个匹配网页,其中,所述 一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配,通过页面技术,例如 JSP、ASP、PHP技术,将所述一个或多个匹配网页以链接、摘要或缩略图等形式,按一定顺序 和格式,嵌入在搜索结果页面中,提供给所述用户设备2,供用户进行浏览。接前例,在步骤 S4中,网络设备1将在步骤S3中获取的“百度时代网络技术(北京)有限公司”、“百度在 线网络技术有限公司”、“百度时代网络技术(北京)有限公司客户发展部”三个标题的网 页,以链接、摘要或缩略图等形式,按一定顺序和格式,嵌入于搜索结果页面之中或之上,提 供给所述用户设备2。本领域技术人员应能理解上述将匹配网页提供给用户设备的方式仅 为举例,其他现有的或今后可能出现的将推荐信息提供给用户设备的方式如可适用于本发 明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,上述各个步骤之间是持续不断工作的。具体地,网络设备1在步骤Sl中 获取用户通过用户设备2输入的查询序列;随后,在步骤S2中,网络设备1根据所述查询 序列,判断所述查询序列是否包含黄页需求相关信息;当所述查询序列包含黄页需求相关 信息时,网络设备1在步骤S3中根据所述黄页需求相关信息,在黄页索引库中进行匹配查 询,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需 求相关信息相匹配;接着,在步骤S4中,网络设备1再将所述一个或多个匹配网页提供给所述用户设备。在此,本领域技术人员应理解“持续”是指各步骤分别按照设定的或实时调整 的工作模式要求进行查询序列的获取、黄页需求相关信息的判断、匹配网页的获取及提供, 直至该用户在较长时间内停止通过用户设备2输入查询序列。优选地,在步骤S7(未示出)中,网络设备1还可以将所述黄页信息以突显的形式 提供给所述用户设备。具体地,在步骤S7中,网络设备1根据在步骤S3中获取的一个或 多个匹配网页中的黄页信息,通过页面技术,例如JSP、ASP、PHP技术,将所述黄页信息以摘 要、悬浮框或缩略图等形式,按一定顺序和格式,嵌入于搜索结果页面之中或之上,提供给 所述用户设备2,供用户进行浏览。在此,黄页信息的展现应与前述匹配网页的展现相对应, 例如当所述黄页信息以摘要的形式展现在搜索结果页面时,可以在所述匹配网页的链接的 下方展现给用户。优选地,还可以将所述黄页信息加粗、加黑,或改变字体、字形、颜色,或增 加背景颜色等方式,将其进行突显展现。当以悬浮框的形式提供给用户设备时,可以是在页 面的某个固定的区域显示,也可以由用户设定或根据浏览对象的位置确定,其窗口大小可 以进行调节。例如,将所述黄页信息以悬浮框的形式显示在用户设备2的输入框中,其可以 是透明的以不影响用户的输入,并随着用户的输入操作不断变换其所处的位置,例如随着 输入序列变长,所述悬浮框不断右移。优选地,所述悬浮框还可以根据光标与之的距离自动 调整自身的透明度,以不影响用户的正常浏览;当光标移动到距所述悬浮框的设定距离范 围外时隐藏所述悬浮框;当在所述悬浮框之外点击时,隐藏所述悬浮框。本领域技术人员应 能理解上述提供黄页信息的方式仅为举例,其他现有的或今后可能出现的提供黄页信息的 方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,在步骤S8(未示出)中,网络设备1还可以对所述黄页信息进行规范化处 理,以获得规范化的黄页信息;随后,在步骤S7(未示出)中,网络设备1将所述规范化的 黄页信息以突显的形式提供给所述用户设备2。在步骤S3中,网络设备1匹配查询到的匹 配网页中的黄页信息可能存在多种问题1)形式上并不统一,例如有的网页在电话号码前 加上了区号,有的没有加区号,再如有的匹配网页中的黄页信息包含电子邮箱地址,有的则 不包含;2)表述上不规范,如将“中国人民大学附属中学”记为“人大附中”。在步骤S8中, 网络设备1可以将所述黄页信息进行规范化处理,以获得形式统一、表述规范的黄页信息。 例如,在步骤S8中,网络设备1根据预置的黄页模板,对所述黄页信息进行规范化处理,例 如将电话号码统一按照“国际区号-国内区号_电话号码”的形式显示,又如假设规定提供 给用户的黄页信息包含有项目“机构名称、地址、邮编、网址、电话、传真、法定代表人”并按 照一定的格式排版,若该网页中不包含某一项的信息,则相应的项目空置。又如,在步骤S8 中,网络设备1可以根据对应于同一个黄页需求相关信息的多个匹配网页中的黄页信息, 通过归类去重处理得到对应于该黄页需求相关信息的黄页模板,然后根据此黄页模板对这 多个匹配黄页中的行黄页信息进行规范化,如将这些黄页信息按归类去重处理所得到的黄 页模板进行格式排版,将该黄页信息中的信息项填入该黄页模板的对应项目中,若该黄页 信息不包含某个信息项,则空置该黄页模板中的对应项目。再如,在步骤S8中,网络设备 1还可以通过自然语言处理技术,使得黄页信息中的信息项表述更为规范,例如在步骤S8 中,网络设备1利用自然语言处理技术,将机构名称按Term切分,诸如“人大附中”,可分割 为“人大”、“附中”;并结合同义词列表、别名列表,可将其规范化为“中国人民大学附属中 学”。此后,在步骤S7中,网络设备1再通过页面技术,例如JSP、ASP、PHP技术,将所述模板嵌入于返回给用户设备的搜索结果页面之中或之上,以突显的形式提供给用户设备2。本领 域技术人员应能理解,在步骤S8中,网络设备1还可以通过黄页模板与自然语言处理技术 的结合,获取形式统一且表述规范的黄页信息。本领域技术人员还应能理解上述规范化处 理黄页信息的方式仅为举例,其他现有的或今后可能出现的规范化处理黄页信息的方式如 可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,在步骤S9(未示出)中,网络设备1还可以根据所述黄页需求相关信息, 并结合所述查询序列,获取所述查询序列中的黄页附加需求相关信息;根据所述黄页信息 与所述黄页附加需求相关信息,获取与所述黄页附加需求相关信息相匹配的黄页附加信 息;随后,在步骤S7(未示出)中,网络设备1将所述黄页信息与所述黄页附加信息以突显 的形式提供给所述用户设备2。在用户输入的查询序列中,除与机构名称有关、与机构联系 方式有关或与机构法人有关的黄页需求相关信息外,还可能包含黄页附加需求相关信息, 例如与该机构有关的地图相关信息、路线相关信息等需求。具体地,在步骤S9中,网络设 备1根据在步骤S2中所获取的黄页需求相关信息,并结合在步骤Sl中所获取的查询序列, 通过词义分析、数据库查询等方式,获取所述查询序列中的黄页附加需求相关信息;此后, 网络设备1再根据所述黄页信息与所述黄页附加需求相关信息,通过数据库查询或利用第 三方设备提供的应用程序接口(API)从第三方设备获取等方式,获取与所述黄页附加需求 相关信息相匹配的黄页附加信息;随后,在步骤S7中,网络设备1通过页面技术,例如JSP、 ASP、PHP技术,将所述黄页信息与所述黄页附加信息嵌入于返回给用户设备的搜索结果页 面之中或之上,以突显的形式提供给用户设备2。例如,用户通过用户设备2输入查询序列 “百度北京怎么去”,在步骤S2中,网络设备1通过词义分析,获取到该用户的黄页需求相关 信息为“百度北京”,在步骤S9中,网络设备1根据该用户的黄页需求相关信息,并结合该 用户输入的查询序列,通过词义分析,获取到黄页附加需求相关信息为“地图”(或“乘车路 线”);此后,网络设备1再根据“百度北京”的黄页信息与所述黄页附加需求相关信息,通 过调用第三方地图搜索设备获取“百度北京”的地图信息(或者通过数据库查询获得“百度 北京”周边的乘车信息,如轨道交通与公交线路);随后,在步骤S7中,网络设备1再将所述 “百度北京”的黄页信息与地图信息(或乘车路线)提供给用户设备2。优选地,在步骤S9 中,网络设备1还可以取用户输入的查询序列所包括的另一位置信息或者用户当前的定位 信息(假设用户设备2包含有GPS等地理信息模块等)作为一个端点,提供该端点与所述黄 页信息所对应的另一个端点之间的详细的路线图。本领域技术人员应能理解上述获取与提 供黄页附加信息的方式仅为举例,其他现有的或今后可能出现的获取或提供黄页附加信息 的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,在步骤S10(未示出)中,网络设备1还可以根据所述黄页需求相关信 息,并结合所述查询序列,获取所述查询序列中的黄页焦点需求相关信息;根据所述黄页信 息与所述黄页焦点需求相关信息,获取与所述黄页焦点需求相关信息相匹配的黄页焦点信 息;此后,在步骤S7中,网络设备1将所述黄页焦点信息以突显的形式提供给所述用户设 备。由于对于某一部分用户来讲,其可能只需要黄页信息中的黄页焦点信息,例如地址、电 话、网站中的一个或多个,网络设备1需要获取该用户的黄页焦点需求相关信息,并进一步 获取与之相匹配的黄页焦点信息。具体地,在步骤SlO中,网络设备1根据在步骤S2中所 获取的黄页需求相关信息,并结合在步骤Sl中所获取的查询序列,获取所述查询序列中的黄页焦点需求相关信息;此后,在步骤SlO中,网络设备1根据所述黄页信息与所述黄页焦 点需求相关信息,通过词义分析、数据库查询等方式,获取与所述黄页焦点需求相关信息相 匹配的黄页焦点信息;随后,在步骤S7中,网络设备1通过页面技术,例如JSP、ASP、PHP技 术,将所述黄页焦点信息嵌入于返回给用户设备2的搜索结果页面之中或之上,以突显的 形式提供给用户设备2。例如,用户通过用户设备2输入查询序列“联想客服电话”,在步骤 S2中,网络设备1通过词义分析,获取到该用户的黄页需求相关信息为“联想lenovo”,在步 骤SlO中,网络设备1根据该用户的黄页需求相关信息,并结合该用户输入的查询序列,通 过词义分析,获取到黄页焦点需求相关信息为“客服电话”;此后,在步骤SlO中,网络设备 1再通过词义分析、数据库查询等方式,获取与所述黄页焦点需求相关信息相匹配的黄页焦 点信息“8008108888”;随后,在步骤S7中,网络设备1再通过页面技术,例如JSP、ASP、PHP 技术,将所述黄页焦点信息“8008108888”嵌入于返回给用户设备2的搜索结果页面之中或 之上,以突显的形式提供给用户设备2。例如,将所述黄页焦点信息“8008108888”以悬浮框 的形式显示在用户设备2的输入框中,其可以是透明的以不影响用户的输入,并随着用户 的输入操作不断变换其所处的位置,例如随着输入序列变长,所述悬浮框不断右移。本领域 技术人员应能理解上述获取与提供黄页焦点信息的方式仅为举例,其他现有的或今后可能 出现的获取或提供黄页焦点信息的方式如可适用于本发明,也应包含在本发明保护范围以 内,并在此以引用方式包含于此。优选地,在步骤S7(未示出)中,网络设备1将黄页信息提供给用户设备2的突显 方式,包括但不限于,以下至少一项摘要、悬浮框和缩略图等形式。在步骤S7中,网络设 备1可以通过页面技术,例如JSP、ASP、PHP技术,将在步骤S3中获取的黄页信息以摘要的 形式提供给所述用户设备2,黄页信息的展现应与该黄页信息所属的匹配网页的展现相对 应,可以在所述匹配网页的链接的下方展现给用户。优选地,还可以将所述黄页信息加粗、 加黑,或改变字体、字形、颜色,或增加背景颜色等方式,将其进行突显展示。在步骤S7中, 网络设备1还可以将在步骤S3中获取的黄页信息,以悬浮框的形式提供给所述用户设备2, 用户通过点击网页上特定的按钮或用户自定义的按钮或按键,或者将光标悬停指向搜索结 果页面中的链接时,打开所述悬浮框,以浏览所述黄页信息。优选地,所述悬浮框可以是在 页面的某个固定的区域显示,也可以由用户设定或根据浏览对象的位置确定,其窗口大小 可以进行调节。所述悬浮框还可以根据光标与之的距离自动调整自身的透明度,以不影响 用户的正常浏览;当光标移动到距所述悬浮框的设定距离范围外时隐藏所述悬浮框;当在 所述悬浮框之外点击时,隐藏所述悬浮框。例如,将所述黄页信息以悬浮框的形式显示在用 户设备2的输入框中,其可以是透明的以不影响用户的输入,并随着用户的输入操作不断 变换其所处的位置,例如随着输入序列变长,所述悬浮框不断右移。在步骤S7中,网络设备 1还可以将在步骤S3中获取的黄页信息,以缩略图的形式提供给所述用户设备2,用户可以 通过点击特定的或自定义的按钮放大或缩小所述缩略图,以浏览所述黄页信息。在此,本领 域技术人员应能理解,上述突显的形式同样适用于网络设备1在步骤S7中将规范化的黄页 信息、黄页信息与黄页附加信息以突显的形式提供给所述用户设备2本领域技术人员还应 能理解上述突显的形式仅为举例,其他现有的或今后可能出现的突显的形式如可适用于本 发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,在步骤S2中,网络设备1还可以对所述查询序列进行词义分析,当确定所述查询序列符合预定条件时,判断所述查询序列包含黄页需求相关信息,其中,所述预定条 件包括但不限于以下至少一项a)所述查询序列包含与机构名称有关的特定类别关键词; b)所述查询序列包含与机构联系方式有关的特定类别关键词;C)所述查询序列包含与机 构法人有关的特定类别关键词。具体地,在步骤S2中,网络设备1根据在步骤Sl中获取的 用户输入的查询序列,通过词义分析,判断所述查询序列中是否包含与机构名称有关的特 定类别关键词,例如机构的部分名称或全部名称,是否包含与机构联系方式有关的特定类 别关键词,例如电话、邮箱、传真、网址等,是否包含与机构法人有关的特定类别关键词,例 如法人代表、法定代表人等;当所述查询序列包含上述特定类别关键词时,判断所述查询序 列包含黄页需求相关信息。本领域技术人员应能理解上述判断查询序列是否包含黄页需求 相关信息的预定条件仅为举例,其他现有的或今后可能出现的判断查询序列是否包含黄页 需求相关信息的预定条件如可适用于本发明,也应包含在本发明保护范围以内,并在此以 引用方式包含于此。更优选地,在步骤S2中,网络设备1还可以根据所述查询序列,并结合该用户的历 史查询操作,判断所述查询序列是否包含黄页需求相关信息。具体的,在步骤S2中,网络设 备1根据在步骤Sl中获取的用户输入的查询序列,并结合该用户的历史查询操作,如用户 曾使用的查询关键词、用户对包含黄页信息的网页的点击浏览记录,判断所述查询序列是 否包含黄页需求相关信息。例如,在步骤S2中,网络设备1根据用户当前的查询序列为“百 度”,结合该用户的历史查询操作,如曾经点击包含有“百度公司”黄页信息的网页的URL, 则判断该查询序列包括黄页需求相关信息。又如,在步骤S2中,网络设备1根据用户当前 的查询序列为“百度”,结合该用户的历史查询操作,如该用户曾经变换查询序列,例如用户 输入查询序列“百度”,在获得的搜索结果页面中点击联想查询序列“百度公司的地址”,后 者为明确的黄页需求,则判断该查询序列包括黄页需求相关信息。在步骤S2中,网络设备 1还可以对所述查询序列进行词义分析,并结合该用户的历史查询操作,当确定该查询序列 满足预定条件时,判断该查询序列包含黄页需求相关信息。例如,在步骤S2中,网络设备1 根据用户当前的查询序列为“百度”,结合该用户的历史查询操作,如该用户曾经变换查询 序列,例如用户输入查询序列“百度”,在获得的搜索结果页面中点击联想查询序列“百度公 司法人代表”,后者为明确的黄页需求,则判断该查询序列包括黄页需求相关信息。本领域 技术人员还应能理解上述判断查询序列是否包含黄页需求相关信息的方式仅为举例,其他 现有的或今后可能出现的判断查询序列是否包含黄页需求相关信息的方式如可适用于本 发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,该用户的所述 历史查询操作既可以是网络设备1独立获取的,也可以是接受来自其他产品或第三方设备 所完成的对该用户的所述历史查询操作的获取。例如,可通过检测该用户使用网络设备1 的搜索服务过程中的操作,或通过向用户设备2询问并获取该用户的COOKIE信息来获得 该用户的历史查询操作,优选地,可赋予该用户一个临时ID并为其建立一个历史查询操作 库,将此次搜索过程中用户的历史记录保存于该临时历史查询操作库中。本领域技术人员 还应能理解上述获取用户的历史查询操作的方式仅为举例,其他现有的或今后可能出现的 获取用户的历史查询操作的方式如可适用于本发明,也应包含在本发明保护范围以内,并 在此以引用方式包含于此。优选地,在步骤Sll (未示出)中,网络设备1还可以根据大量网页及其中的黄页信息,建立或更新所述黄页索引库。具体地,在步骤Sll中,网络设备1对通过爬虫工具 等网页抓取工具直接抓取的大量网页,或者从第三方设备中获取的存储于该第三方设备 的大量网页,进行特征分析,以获取包含黄页信息的潜在目标页,并根据这些潜在目标页 及其中的黄页信息,建立或更新所述黄页索引库。在此,网络设备1在步骤Sll中确定潜 在目标页的方式,包括但不限于1)根据网址中包含有例如“ shOW_COmpany,,、“huangye,,、 "yellowpage"等表意信息的网页为潜在目标页;2)根据网页Title和Meta信息域中含 有“公司、企业、公司介绍、企业简介”等表意信息的网页为潜在目标页;3)根据在网页原 文中提取有“地址、电话、传真、邮编、联系人、名称”等表意的信息对的网页为潜在目标页; 4)或者根据其它的指向信息,例如anchor(锚文本)信息中包含有以上表意信息等的网 页为潜在目标页;5)上述几种方式的任意组合。网络设备1在步骤Sll中通过相互补充 验证,提取潜在目标页中的有效机构名称、地址信息、邮编、电话、联系人、传真等黄页信息。 将所述黄页信息与所述潜在目标页通过建立或更新数据表等形式,建立或更新所述黄页索 引库。在所述数据表中,可以是一个黄页信息对应一个网页,也可以是一个黄页信息对应 包含有该黄页信息的几个网页。例如,在黄页索引库中,“百度在线网络技术有限公司”的 黄页信息“公司全称百度在线网络技术有限公司;网址http://WWW.baidu. com;电话 86-10-82621188 ;电子邮件webmaster@baidu. com”可以只对应“百度在线网络技术有限 公司”一个网页,也可以同时对应“百度在线网络技术有限公司百度在线网络技术有限公司 简介艾瑞网行业公司”这个网页。本领域技术人员应能理解上述建立或更新黄页索引库的 方式仅为举例,其他现有的或今后可能出现的建立或更新黄页索引库的方式如可适用于本 发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,在步骤S3中,当所述查询序列包含黄页需求相关信息时,网络设备1还可 以根据所述黄页需求相关信息,并结合该用户的用户相关信息,在黄页索引库中进行匹配 查询,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页 需求相关信息相匹配。具体地,当网络设备1在步骤S2中判断所述查询序列包含黄页需求 相关信息时,在步骤S3中根据所述黄页需求相关信息,并结合该用户的用户相关信息,如 该用户的搜索历史记录或用户设备的地址,在黄页索引库中进行匹配查询,以获得与用户 实际需求相匹配的一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与 所述黄页需求相关信息相匹配。例如,网络设备1在步骤S3中先将用户相关信息的关键词 与黄页需求相关信息组合成第二查询序列,随后,网络设备1再根据所述第二查询序列,在 黄页索引库中进行查询匹配,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中 的黄页信息与所述黄页需求相关信息相匹配。在此,所述用户相关信息既可以是网络设备 1独立获取的,也可以是接受来自用户设备2记录的,或者接受来自其他产品或第三方设备 所获取的用户相关信息。本领域技术人员应能理解上述获取用户相关信息的方法仅为举 例,其他现有的或今后可能出现的获取用户相关信息的方法如可适用于本发明,也应包含 在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述用户相关信息包括但不限于以下至少一项a)用户属性;b)用户偏 好;c)用户搜索历史记录;d)用户设备的地址。用户属性包括但不限于,用户预先输入的 个人背景信息,例如性别、年龄、职业、宗教、国籍、教育程度等。当所述查询序列包含黄页 需求相关信息时,网络设备1在步骤S3中根据所述黄页需求相关信息,并结合该用户的用户属性,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个 匹配网页中的黄页信息与所述黄页需求相关信息相匹配。例如,用户输入查询序列“新东 方”进行查询,当用户为学生时,提供有关“新东方学校”的黄页信息及相应的匹配网页,当 用户为厨师时,提供有关“新东方厨师学校”的黄页信息及相应的匹配网页。用户偏好包括 但不限于,用户预先设置的一些偏好选择,例如关注的机构类型、行业信息等。当所述查询 序列包含黄页需求相关信息时,网络设备1在步骤S3中根据所述黄页需求相关信息,并结 合该用户的用户偏好,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所 述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配。例如,用户设置其 偏好的机构类型为客服公司,则当用户输入查询序列“百度北京”时,优先提供有关“百度 公司客服”的黄页信息及相应的网页,当用户设置其偏好的机构类型为研发公司时,其输入 查询序列“百度北京”,优先提供有关“百度在线网络技术(北京)有限公司”等的黄页信息 及相应的网页。用户搜索历史记录,其由系统来记录和统计用户先前的搜索和点击浏览历 史,从而可判断或预测用户的需求。其中,当用户为登录用户时,网络设备1可通过该用户 的ID在网络端保存有该用户相关信息的用户特征库中进行查询;当用户为非登录用户时, 可通过检测该用户使用本网络设备1的搜索服务过程中的动作,或通过向用户设备2询问 并获取该用户的COOKIE信息来获得,优选地,可赋予该用户一个临时ID并为其建立一个用 户特征库,将此次搜索过程中用户的历史记录保存于该临时用户特征库中。例如,用户输入 查询序列“复旦大学”,提供的匹配网页可能包括关于“复旦大学”、“复旦大学医学院”、“复 旦大学出版社”等的黄页信息,当用户点击“复旦大学医学院”时,网络设备1或用户设备2 记录下用户的此次浏览操作记录,当用户再次输入“复旦大学”或其他大学的名称作为查询 序列时,网络设备1优先将关于“某某大学出版社”的黄页信息及相应的匹配网页提供给该 用户。用户设备的地址,其可以反映该用户当前所处地域,可由网络设备1实时检测用户设 备2的IP地址来获取。例如,用户通过用户设备2输入查询序列“新东方语言学校”,网络 设备1检测到该用户设备2的IP地址位于北京,则优先将北京新东方语言学校的黄页信息 及相应的匹配网页提供给该用户。本领域技术人员应能理解上述用户相关信息仅为举例, 其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范 围以内,并在此以引用方式包含于此。 优选地,在步骤S12(未示出)中,网络设备1还可以获取该用户对所述一个或多 个匹配网页的浏览操作;根据所述浏览操作,更新该用户的所述用户相关信息。具体地,在 步骤S12中网络设备1根据与用户设备2及用户的交互,例如通过JSP、ASP、PHP等页面 技术,获取该用户对所述一个或多个匹配网页的浏览操作;并根据这些浏览操作更新该用 户的用户相关信息。在此,网络设备1在步骤S12中更新用户相关信息的方式包括但不限 于1)网络设备1根据用户更改的预设信息,更新该用户的用户相关信息;2)网络设备1 可在用户一次浏览操作结束后记录用户在此浏览过程中的所有动作,例如点击、浏览或关 闭;3)网络设备1在用户一次浏览过程中记录用户每次动作并实时对网络端该用户的特征 库进行更新,从而可在用户在此次浏览过程中点击其他黄页信息时提供最新的用户相关信 息。例如,用户输入“复旦大学”,提供的匹配网页可能包括关于“复旦大学”、“复旦大学医 学院”、“复旦大学出版社”等的黄页信息,当用户点击“复旦大学医学院”时,记录该用户的 浏览操作并更新该用户的历史记录。本领域技术人员应能理解上述更新用户相关信息的方式仅为举例,其他现有的或今后可能出现的更新用户相关信息的方式如可适用于本发明, 也应包含在本发明保护范围以内,并在此以引用方式包含于此。图5示出根据本发明一个优选实施例的用于基于查询序列获取黄页信息的方法 流程图。该方法还包括步骤S5’,其中,步骤Sl’-S4’分别与图4所示对应步骤S1-S4相同, 故此处不再赘述,并通过引用的方式包含于此。其中,在步骤S5’中,网络设备1根据所述黄页需求相关信息,对所述黄页需求相 关信息进行预处理操作;其中,在步骤S2’中,根据预处理操作后的所述黄页需求相关信 息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配 网页中的黄页信息与所述黄页需求相关信息相匹配。具体地,在步骤S5’中,网络设备1根 据在步骤S2’中所获取的黄页需求相关信息,通过自然语言处理技术,例如近义词替换、同 义词替换、词义拓展等方式,对所述黄页需求相关信息进行预处理操作;随后,在步骤S3’ 中根据预处理操作后的所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一个 或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息 相匹配。例如,在步骤S2’中,网络设备1获取的用户的黄页需求相关信息为“上海交通 学校”,则在步骤S5’中,网络设备1可以对此进行预处理操作,将其变换成“上海交通大 学”(或“上海交通大学附属中学”)等;此后,在步骤S3’中,网络设备1再根据该预处理操 作后的黄页需求相关信息“上海交通大学”(或“上海交通大学附属中学”),在黄页索引库 中进行匹配查询,获取与之相匹配的一个或多个匹配网页,所述一个或多个匹配网页中包 含有“上海交通大学”(或“上海交通大学附属中学”)的黄页信息。优选地,所述预处理操作包括但不限于以下至少一项a)近义词替换;b)同义词 替换;c)词义拓展。近义词替换例如“学校”替换为“小学”、“中学”或“大学”等。在上例 中,网络设备1在步骤S5’中可以依次将“上海交通学校”替换成“上海交通小学”、“上海交 通中学”和“上海交通大学”,在步骤S3’中依次将替换后的黄页需求相关信息在黄页索引 库中进行匹配查询。同义词替换例如将“上海交大”替换为“上海交通大学”等;词义拓展 例如将“公司,,拓展为“有限公司”、“有限责任公司”等。本领域技术人员应能理解上述预 处理操作仅为举例,其他现有的或今后可能出现的预处理操作如可适用于本发明,也应包 含在本发明保护范围以内,并在此以引用方式包含于此。在另一个优选的实施例中(参照图5),该方法还可以包括步骤S6’。其中,步骤 Si’ -S4’分别与图4所示对应步骤S1-S4相同,故此处不再赘述,并通过引用的方式包含于 此。其中,在步骤S6’中,网络设备1根据预设规则,确定所述一个或多个匹配网页的 优先级;随后,在步骤S4’中,网络设备1根据所述优先级,将所述一个或多个匹配网页提供 给所述用户设备。具体地,在步骤S6’中,网络设备1根据预设规则,例如根据网络设备1获 取的或接收来自用户设备2统计的,或接收来自其他产品或第三方设备统计的所述匹配网 页的累计点击量、所述匹配网页的搜索排名等,确定在步骤S3’中所获取的所述一个或多个 匹配网页的优先级;随后,在步骤S4’中,网络设备1根据在步骤S6’中所确定的优先级,通 过页面技术,例如JSP、ASP、PHP技术,将所述一个或多个匹配网页以链接、摘要或缩略图等 形式,按一定顺序和格式,嵌入在搜索结果页面之中或之上,提供给所述用户设备2。例如, 在步骤S6’中,网络设备1可以根据所述一个或多个匹配网页的权威性,确定所述一个或多个匹配网页的优先级,如,对于同样包含“百度在线网络技术有限公司”的黄页信息的两个 匹配网页“百度在线网络技术有限公司”和“百度在线网络技术有限公司_百度在线网络技 术有限公司简介_艾瑞网行业公司”,由于前者的权威性更高,因此其优先级较后者高。在 步骤S4’中,网络设备1根据在步骤S6’中确定的所述一个或多个匹配网页的优先级,例如 按照优先级由大到小的顺序自上而下或由内而外,以链接、摘要或缩略图等形式,将排序后 的所述一个或多个匹配网页提供给用户设备2,供用户进行浏览。接前例,随后,在步骤S4’ 中,网络设备1根据这两个匹配网页的优先级,将这两个匹配网页提供给所述用户设备,其 中,匹配网页“百度在线网络技术有限公司”相对“百度在线网络技术有限公司_百度在线 网络技术有限公司简介_艾瑞网行业公司”更为优先展示。本领域技术人员应能理解上述 将匹配网页提供给用户的方式仅为举例,其他现有的或今后可能出现的将匹配网页提供给 用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含 于此。 优选地,所述预设规则基于包括但不限于以下至少任一项a)所述匹配网页的权 威性;b)所述匹配网页的累计点击量;c)所述匹配网页的搜索排名;d)所述匹配网页中黄 页信息的更新时间。在步骤S6’中,网络设备1可以根据所述一个或多个匹配网页中各网 页的权威性,确定所述一个或多个匹配网页的优先级。例如,对于同样包含“百度在线网络 技术有限公司”的黄页信息的两个匹配网页“百度在线网络技术有限公司”和“百度在线网 络技术有限公司_百度在线网络技术有限公司简介_艾瑞网行业公司”,由于前者的权威性 更高,因此其优先级较后者高。在步骤S6’中,网络设备1还可以根据网络设备1获取的或 接收来自用户设备2统计的,或接收来自其他产品或第三方设备获取的所述匹配网页的累 计点击量,确定所述一个或多个匹配网页的优先级。例如,对于网络设备1在步骤S3’中所 获取的一个或多个匹配网页,在步骤S6’中根据所述一个或多个匹配网页中各网页的累计 点击量确定其优先级,累计点击量多的匹配网页优先级较高,累计点击量少的匹配网页则 优先级较低。网络设备1在步骤S6’中还可以根据网络设备1获取的或接收来自用户设备 2统计的,或接收来自其他产品或第三方设备获取的所述匹配网页的搜索排名,确定所述一 个或多个匹配网页的优先级。例如,对于网络设备1在步骤S3’中所获取的一个或多个匹配 网页,在步骤S6’中根据用户以所述匹配网页作为搜索的搜索排名,确定其优先级,搜索排 名靠前的匹配网页优先级较高,搜索排名靠后的匹配网页则优先级较低。网络设备1在步 骤S6’中还可以根据所述匹配网页中黄页信息的更新时间,确定所述一个或多个匹配网页 的优先级。例如,对于网络设备1在步骤S3’中所获取的一个或多个匹配网页,在步骤S6’ 中根据所述匹配网页中黄页信息的更新时间,提高最近更新的匹配网页的优先级。又如,对 于网络设备1在步骤S3’中匹配查询获取的一个或多个匹配网页,其上对于同一个机构的 黄页信息可能不同,这时,可以根据网页上该黄页信息的更新时间进行排序,更新时间越近 的优先级越高。优选地,在步骤S6’中,网络设备1还可以根据上述所述匹配网页的权威性、 所述匹配网页的累计点击量、所述匹配网页的搜索排名和所述匹配网页中黄页信息的更新 时间的任意组合,通过例如分配给每一项因素一个权重,使用加权等方式,确定所述一个或 多个匹配网页的优先级。本领域技术人员应能理解上述预设规则所基于的因素仅为举例, 其他现有的或今后可能出现的预设规则所基于的因素如可适用于本发明,也应包含在本发 明保护范围以内,并在此以引用方式包含于此。
在一个优选的实施例中(参照图5),在步骤S13’ (未示出)中,网络设备1还可 以获取搜索引擎基于所述查询序列提供的第一搜索结果;随后,在步骤S4’中,网络设备1 将所述一个或多个匹配网页和所述第一搜索结果提供给所述用户设备2,其中,优先提供所 述一个或多个匹配网页。具体地,在步骤S4’中,网络设备1除将包含有黄页信息的匹配网 页提供给用户设备2之外,还可以将在步骤S 13’中获取的搜索引擎基于所述查询序列提 供的第一搜索结果提供给所述用户设备2,其中,优先提供所述一个或多个匹配网页,例如, 将所述一个或多个匹配网页以比所述第一搜索结果更高的优先级提供给所述用户设备2。优选地,在步骤S14’(未示出)中,网络设备1还可以将所述一个或多个匹配网页 与所述第一搜索结果进行合并去冗余处理,以获得第二搜索结果;此后,在步骤S4’中,网 络设备1将所述第二搜索结果提供给所述用户设备2。由于基于黄页需求相关信息匹配查 询得到的匹配网页与基于查询序列搜索得到的第一搜索结果可能存在相同的网页,需要对 此进行合并去冗余处理,以免提供给所述用户设备2相同的网页。例如,用户输入查询序列 “百度公司”,网络设备1通过在步骤S3’中在索引库中匹配查询得到的匹配网页中包含有 “百度在线网络技术有限公司”这个网页,而通过步骤S13’(未示出)获取得到的搜索引擎 基于查询序列“百度公司”提供的第一搜索结果中也同样包含有“百度在线网络技术有限公 司”这个网页,在步骤S14’中,网络设备1可以将这两个网页进行合并去冗余处理,只留下 其中一个匹配网页;此后,在步骤S4,中,网络设备1将合并处理后的匹配网页提供给所述 用户设备2。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在 不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论 从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此 外,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多 个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来 表示名称,而并不表示任何特定的顺序。
权利要求
一种用于基于查询序列获取黄页信息的方法,其中,该方法包括以下步骤a获取用户通过用户设备输入的查询序列;b根据所述查询序列,判断所述查询序列是否包含黄页需求相关信息;c当所述查询序列包含黄页需求相关信息时,根据所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配;d将所述一个或多个匹配网页提供给所述用户设备。
2.根据权利要求1所述的方法,其中,该方法还包括 e将所述黄页信息以突显的形式提供给所述用户设备。
3.根据权利要求2所述的方法,其中,该方法还包括f对所述黄页信息进行规范化处理,以获得规范化的黄页信息; 其中,所述步骤e还包括_将所述规范化的黄页信息以突显的形式提供给所述用户设备。
4.根据权利要求2或3所述的方法,其中,该方法还包括步骤g-根据所述黄页需求相关信息,并结合所述查询序列,获取所述查询序列中的黄页附加 需求相关信息;-根据所述黄页信息与所述黄页附加需求相关信息,获取与所述黄页附加需求相关信 息相匹配的黄页附加信息; 其中,所述步骤e还包括-将所述黄页信息与所述黄页附加信息以突显的形式提供给所述用户设备。
5.根据权利要求2至4中任一项所述的方法,其中,该方法还包括步骤h-根据所述黄页需求相关信息,并结合所述查询序列,获取所述查询序列中的黄页焦点 需求相关信息;-根据所述黄页信息与所述黄页焦点需求相关信息,获取与所述黄页焦点需求相关信 息相匹配的黄页焦点信息; 其中,所述步骤e还包括-将所述黄页焦点信息以突显的形式提供给所述用户设备。
6.根据权利要求2至5中任一项所述的方法,其中,所述突显的形式包括以下至少任一项_摘要; -悬浮框; -缩略图。
7.根据权利要求1至6中任一项所述的方法,其中,所述步骤b还包括-对所述查询序列进行词义分析,当确定所述查询序列符合预定条件时,判断所述查询 序列包含黄页需求相关信息,其中,所述预定条件包括以下至少一项 -所述查询序列包含与机构名称有关的特定类别关键词; -所述查询序列包含与机构联系方式有关的特定类别关键词; -所述查询序列包含与机构法人有关的特定类别关键词。
8.根据权利要求1至7中任一项所述的方法,其中,所述步骤b还包括-根据所述查询序列,并结合该用户的历史查询操作,判断所述查询序列是否包含黄页 需求相关信息。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括 i根据大量网页及其中的黄页信息,建立或更新所述黄页索引库。
10.根据权利要求1至9中任一项所述的方法,其中,所述步骤C还包括-当所述查询序列包含黄页需求相关信息时,根据所述黄页需求相关信息,并结合该用 户的用户相关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述 一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配。
11.根据权利要求10所述的方法,其中,所述用户相关信息包括以下至少一项 -用户属性;-用户偏好; -用户搜索历史记录; -用户设备的地址。
12.根据权利要求10或11所述的方法,其中,该方法还包括步骤j -获取该用户对所述一个或多个匹配网页的浏览操作;-根据所述浏览操作,更新该用户的所述用户相关信息。
13.根据权利要求1至12中任一项所述的方法,其中,该方法还包括k根据所述黄页需求相关信息,对所述黄页需求相关信息进行预处理操作; 其中,所述步骤c还包括-根据预处理操作后的所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一 个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信 息相匹配。
14.根据权利要求13所述的方法,其中,所述预处理操作包括以下至少一项 -近义词替换;-同义词替换; -词义拓展。
15.根据权利要求1至14中任一项所述的方法,其中,该方法还包括 1根据预设规则,确定所述一个或多个匹配网页的优先级;其中,所述步骤d还包括_根据所述优先级,将所述一个或多个匹配网页提供给所述用户设备。
16.根据权利要求15所述的方法,其中,所述预设规则基于包括以下至少任一项 -所述匹配网页的权威性;-所述匹配网页的累计点击量;-所述匹配网页的搜索排名;-所述匹配网页中黄页信息的更新时间。
17.根据权利要求1至16中任一项所述的方法,其中,该方法还包括 m获取搜索引擎基于所述查询序列提供的第一搜索结果;其中,所述步骤d还包括-将所述一个或多个匹配网页和所述第一搜索结果提供给所述用户设备,其中,优先提供所述一个或多个匹配网页。
18.根据权利要求17所述的方法,其中,该方法还包括η将所述一个或多个匹配网页与所述第一搜索结果进行合并去冗余处理,以获得第二 搜索结果;其中,所述步骤d还包括 -将所述第二搜索结果提供给所述用户设备。
19.一种用于基于查询序列获取黄页信息的设备,其中,该设备包括 第一获取装置,用于获取用户通过用户设备输入的查询序列;判断装置,用于根据所述查询序列,判断所述查询序列是否包含黄页需求相关信息; 查询装置,用于当所述查询序列包含黄页需求相关信息时,根据所述黄页需求相关信 息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配 网页中的黄页信息与所述黄页需求相关信息相匹配;第一提供装置,用于将所述一个或多个匹配网页提供给所述用户设备。
20.根据权利要求19所述的设备,其中,该设备还包括第二提供装置,用于将所述黄页信息以突显的形式提供给所述用户设备。
21.根据权利要求20所述的设备,其中,该设备还包括规范化处理装置,用于对所述黄页信息进行规范化处理,以获得规范化的黄页信息; 其中,所述第二提供装置还用于_将所述规范化的黄页信息以突显的形式提供给所述用户设备。
22.根据权利要求20或21所述的设备,其中,该设备还包括第二获取装置,用于-根据所述黄页需求相关信息,并结合所述查询序列,获取所述查询序列中的黄页附加 需求相关信息;-根据所述黄页信息与所述黄页附加需求相关信息,获取与所述黄页附加需求相关信 息相匹配的黄页附加信息;其中,所述第二提供装置还用于-将所述黄页信息与所述黄页附加信息以突显的形式提供给所述用户设备。
23.根据权利要求20至22中任一项所述的设备,其中,该设备还包括第三获取装置,用于-根据所述黄页需求相关信息,并结合所述查询序列,获取所述查询序列中的黄页焦点 需求相关信息;-根据所述黄页信息与所述黄页焦点需求相关信息,获取与所述黄页焦点需求相关信 息相匹配的黄页焦点信息;其中,所述第二提供装置还用于-将所述黄页焦点信息以突显的形式提供给所述用户设备。
24.根据权利要求20至23中任一项所述的设备,其中,所述突显的形式包括以下至少 任一项_摘要; -悬浮框; -缩略图。
25.根据权利要求19至24中任一项所述的设备,其中,所述判断装置还用于-对所述查询序列进行词义分析,当确定所述查询序列符合预定条件时,判断所述查询 序列包含黄页需求相关信息,其中,所述预定条件包括以下至少一项 -所述查询序列包含与机构名称有关的特定类别关键词; -所述查询序列包含与机构联系方式有关的特定类别关键词; -所述查询序列包含与机构法人有关的特定类别关键词。
26.根据权利要求19至25中任一项所述的设备,其中,所述判断装置还用于-根据所述查询序列,并结合该用户的历史查询操作,判断所述查询序列是否包含黄页 需求相关信息。
27.根据权利要求19至26中任一项所述的设备,其中,该设备还包括第一更新装置,用于根据大量网页及其中的黄页信息,建立或更新所述黄页索引库。
28.根据权利要求19至27中任一项所述的设备,其中,所述查询装置还用于-当所述查询序列包含黄页需求相关信息时,根据所述黄页需求相关信息,并结合该用 户的用户相关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述 一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配。
29.根据权利要求28所述的设备,其中,所述用户相关信息包括以下至少一项 -用户属性;-用户偏好; _用户搜索历史记录; -用户设备的地址。
30.根据权利要求27或28所述的设备,其中,该设备还包括第二更新装置,用于 -获取该用户对所述一个或多个匹配网页的浏览操作;-根据所述浏览操作,更新该用户的所述用户相关信息。
31.根据权利要求19至30中任一项所述的设备,其中,该设备还包括预处理装置,用于根据所述黄页需求相关信息,对所述黄页需求相关信息进行预处理 操作;其中,所述查询装置还用于-根据预处理操作后的所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一 个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信 息相匹配。
32.根据权利要求31所述的设备,其中,所述预处理操作包括以下至少一项 -近义词替换;-同义词替换; -词义拓展。
33.根据权利要求19至32中任一项所述的设备,其中,该设备还包括 排序装置,用于根据预设规则,确定所述一个或多个匹配网页的优先级; 其中,所述第一提供装置还用于_根据所述优先级,将所述一个或多个匹配网页提供给所述用户设备。
34.根据权利要求33所述的设备,其中,所述预设规则基于包括以下至少任一项-所述匹配网页的权威性; “所述匹配网页的累计点击量; -所述匹配网页的搜索排名; -所述匹配网页中黄页信息的更新时间。
35.根据权利要求19至34中任一项所述的设备,其中,该设备还包括 第四获取装置,用于获取搜索引擎基于所述查询序列提供的第一搜索结果; 其中,所述第一提供装置还用于-将所述一个或多个匹配网页和所述第一搜索结果提供给所述用户设备,其中,优先提 供所述一个或多个匹配网页。
36.根据权利要求35所述的设备,其中,该设备还包括合并装置,用于将所述一个或多个匹配网页与所述第一搜索结果进行合并去冗余处 理,以获得第二搜索结果;其中,所述第一提供装置还用于 -将所述第二搜索结果提供给所述用户设备。
37.一种搜索引擎,包括如权利要求19至36中任一项所述的基于查询序列获取黄页信 息的设备。
全文摘要
本发明的目的是提供一种用于基于查询序列获取黄页信息的方法与设备,其中,网络设备获取用户通过用户设备输入的查询序列;根据所述查询序列,判断所述查询序列是否包含黄页需求相关信息;当所述查询序列包含黄页需求相关信息时,根据所述黄页需求相关信息,在黄页索引库中进行匹配查询,获取一个或多个匹配网页,其中,所述一个或多个匹配网页中的黄页信息与所述黄页需求相关信息相匹配;将所述一个或多个匹配网页提供给所述用户设备。与现有技术相比,本发明基于用户输入的查询序列获取与之相匹配的黄页信息,不仅提高了用户获取黄页信息的效率,也改善了用户的搜索浏览体验。
文档编号G06F17/30GK101986306SQ20101053430
公开日2011年3月16日 申请日期2010年11月3日 优先权日2010年11月3日
发明者兰强 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1