一种用于基于用户的需求进行搜索的方法和设备的制作方法

文档序号:6603269阅读:174来源:国知局
专利名称:一种用于基于用户的需求进行搜索的方法和设备的制作方法
技术领域
本发明涉及网络技术领域,尤其涉及基于用户的需求进行搜索的技术。
背景技术
自从70、80年代互联网普及以来,为满足用户在互联网上访问海量信息的要求, 出现了许多网络搜索技术,我们简单回顾如下90年代早期出现基于人工信息分类的EINet Galaxy搜索引擎。随后与19994年 Lycos搜索引擎推出,其包括基于机器人程序(Robot)的数据挖掘技术和支持搜索结果相 关性排序。1995年的AltaVista推出的搜索引擎第一个支持自然语言搜索的搜索引擎,具备 了基于网页内容分析,智能处理的能力,第一个实现高级搜索语法的搜索引擎(如AND、0R、 NOT 等)。1997年,Northernlight公司推出的搜索引擎第一个支持对搜索结果进行简单的 自动分类,也是当时拥有最大数据库的搜索引擎之一。1998年,Google推出基于其PAGERANK算法的搜索引擎,其根据网页之间相互的超 链接计算的网页排序。2000年,百度创始人李彦宏推出基于超链分析的百度搜索引擎。现有的搜索引擎的基本工作原理如下1)自动搜集信息搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络 蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网
页链到其中的超链接,就象日常生活中所说的“一传十,十传百......”一样,从少数几个网
页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人 便可以遍历绝大部分网页。2)建立索引库搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存 搜集起来的信息,还要将它们按照一定的规则进行编排并保存于索引库中。这样,搜索引擎 可以根据查询信息在索引库中迅速找到所要的资料。3)接受查询用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。 搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的 要求检查自己的索弓丨,在极短时间内找到用户需要的资料,并将搜索结果返回给用户,其 中搜索结果一般包括网页链接及摘要描述。在有多个搜索结果的情形下,需要利用各种 算法进行排序,其中,最著名的搜索排序算法为Google的I^geRank算法(参见美国专利 US6285999),其原理是根据网页之间相互的超链接计算进行网页排序,搜索引擎把从A网 页到B网页的链接解释为A网页给B网页投票,并根据投票来源(甚至来源的来源,即链接 到A网页的网页)和投票目标的等级来决定新的等级。简单的说,一个高等级的网页可以 使被其链接或引用的其他低等级网页的等级提升。其中,整理信息及接受查询的过程,大量应用了文本信息检索技术,并根据网络超文本的特点,引入了更多的信息。对于文本信息检索,早期的信息检索系统采用“布尔查询”的方法来进行全文检 索。用户必须详细的规划自己的查询,其复杂程度不亚于编程语言。这种检索方式并不提 供任何的文档相关性测度,对于文档与查询的评价就只有“匹配”,“不匹配”两种而已。这 两点问题决定了布尔查询不能被广泛应用。对于大规模的语料库,任何检索都可能返回数量众多的结果,因此对检索结果进 行排序是必须的。因此,一个好的信息检索模型必须提供文档相关性测度。一个好的测度 应该使与用户查询需求最相关的那些结果,排在最前面,同时允许尽可能多的,与用户查询 有一定关系的结果被包括进来。目前,最为常用的信息检索模型有三种I 向量空间模型(Vector Space Model, VSM)II 概率模型(Probabilistic Model)III 推理网络模型 Gnference Network Model)简而言之,现有的搜索技术基本上均基于用户查询请求信息中所含关键词对索引 库进行匹配搜索,根据匹配度或相似度获得多个搜索结果并根据点击率或超链信息进行筛 选或排序,也即仅根据一些外在的、或客观信息来进行搜索,因此不能在搜索结果中反映用 户的实际需求。

发明内容
本发明的目的是为克服现有技术的缺陷,提供一种基于用户需求进行搜索的方法 和设备。根据本发明的一个方面,还提供了一种用于基于用户的需求进行搜索的方法,该 方法包括以下步骤a获取该用户的查询请求;b根据所述查询请求进行匹配搜索,以获得与所述查询请求和用户需求相匹配的 一个或多个搜索选项;c将所述一个或多个搜索选项提供给所述用户,供其选择。根据本发明的另一个方面,提供了一种用于基于用户的需求进行搜索的设备,其 中,该设备包括获取装置,用于获取该用户的查询请求;查询装置,用于根据所述查询请求进行匹配搜索,以获得与所述查询请求和用户 需求相匹配的一个或多个搜索选项;提供装置,用于将所述一个或多个搜索选项提供给所述用户,供其选择。与之相比,本发明通过对查询请求进行文义分析获得其中内含的用户实际需求, 或进一步结合大样本统计信息、热点信息和/或用户的相关信息来更准确地判断用户的实 际需求,可以准确地获得与查询请求信息以及用户实际需求相匹配的搜索结构。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显
图1为根据本发明一个方面的根据用户需求提供检索结果的方法流程图;图2为根据本发明一个优选实施例的根据用户需求提供检索结果的方法流程3为根据本发明一个方面的根据用户需求提供检索结果的系统框图;图4为根据本发明一个优选实施例的根据用户需求提供检索结果的系统框图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。本发明可以用于网络搜索,也可用于桌面搜索。前者仅需在网络端实现,用户通过 常用的用户端与其进行互动,获得网络搜索的搜索选项;而后者仅需在用户端来实现,为用 户提供桌面搜索的搜索选项。图1示出根据本发明一个方面的根据用户需求提供检索结果的网络搜索流程图。如图1所示,在步骤Sl中,用户在利用用户设备1进行网络浏览时,可通过诸如 键盘、触摸屏、语音输入装置与用户设备1进行交互,输入其希望查询的查询信息(query), 从而发起搜索。用户设备1包括桌面搜索引擎,也即在其本地保存有该搜索发起过程可以 是用户首先通过用户设备1的浏览器软件访问一些搜索网站,如Yahoo, com, Google, com, Baidu. com后,在该搜索网站首页的搜索栏中发起搜索;也可通过嵌入浏览器的本地搜索 栏发起搜索。本领域技术人员应能理解本发明不限于上述两种搜索发起方式,任何已有的 或今后可能出现的搜索发起方式均适用于本发明,应包含在本发明的保护范围以内,并以 引用方式而包含于此。接着,在步骤S2中,用户设备1将用户所输入的查询信息发送给网络设备2。 在此,用户设备1包括,但不限于,计算机、智能手机、PDA等任何具有上网浏览功能的 设备。网络设备2包括,但不限于,网络服务器、网络主机、云计算模式下的其他用户设 备1等可以提供搜索服务的任何设备,其中网络设备2包括集中各种功能的单个设备, 或由多个分别完成单独功能的物理分离的设备的组合,例如执行搜索的设备与保存索引 信息的设备相互分离。此外,用户设备1与网络设备2之间的通信是基于各种通信协议 (CommunicationsftOtocol),在此“通信协议”指计算机通信的传送协议,如TCP/IP、UDP、 FTP、I CMP, NetBEUI等,同时还包括存在于计算机中的其他形式通信,例如面向对象编程 里面对象之间的通信;操作系统内不同程序或计算机不同模块之间的消息传送协议。但本 领域技术人员应理解本发明不限于所述几种通信传输协议,任何已有或今后可能出现的通 信协议均可适用于本发明,从而以引用方式而包含于此。随后,在步骤S3中,网络设备2基于接收到的查询信息在网络索引库中进行搜索。 本领域技术人员应能理解,网络索引库可位于网络设备2中或与之物理分离。其中,查询信息包含一个或多个关键词,关键词可以是字,词或者短语。在语音文 档检索中,还可以是混淆类、音子、音子串等等单元,或者还包括关键词之间的关联词。如前 所述,传统搜索引擎中,信息查询采用的模型,例如向量空间模型,一般通过将查询信息与 索引库中的索引信息进行对比以确定两者相似度,从而确定作为搜索结果的一个或多个搜 索引擎,其中,索引信息也由一些关键词来描述。对于所获得的多个搜索结果,传统搜索引擎一般通过其点击率或Google的I^geRank或百度的超链等算法来确定各个搜索结果的排序。但传统搜索引擎的信息查询或 排序过程中并未考虑用户输入查询信息的实际需求,事实上,即使用户输入的查询请求中 包含相同的关键词,但由于本身内涵文义的区别,反映的用户需求也相应不同,其中查询请 求的内涵文义可由关键词之间及关联词的相互顺序,例如当用户分别输入查询请求“川菜 最好吃”或“最好吃川菜”,虽然均包含相同关键词,但对于前者,用户更可能希望查询口碑 最好的川菜馆,;而对于后者,用户更希望查询最受欢迎的川菜做法,也即,对于前者,用户 需求“最好吃的川菜馆”优先级或可能性较高、用户需求“最好吃的川菜做法”优先级或可 能性较低;对于后者,正好相反。因此,在步骤S3中,网络设备2将对查询请求的文义分析与搜索技术相结合,获得 一个或多个较符合用户实际需求的搜索结果,而且这些搜索结果可以按与用户需求的匹配 度进行排序。步骤S3的实现方式包括但不限于,1)索引库中索引信息应包含用户需求这 一项,网络设备2可以对查询请求进行文义分析以确定其反映的一个或多个用户需求及其 对应的优先级或可能性,随后在基于查询请求对索引库进行查询时,将所确定的用户需求 作为信息查询的一个维度,以确定相匹配的一个或多个索引信息作为搜索结果;2)网络设 备2可以根据前述已有的各种搜索技术基于查询信息在索引库中进行查询,获得多个搜索 结果,随后再基于通过对查询请求文义分析所确定的一个或多个用户需求来对该多个搜索 结果进行筛选和排序,以获得最终确定的按用户需求进行排序的搜索结果。本领域技术人 员应理解本发明不限于上述两种方式,本领域技术人员根据本发明的构思应能想到的其他 实现方式也应包含在本发明的保护范围以内。随后,在步骤S4中,网络设备2将网络设备2将搜索得到的搜索结果及其排序信 息返回给用户设备1。最后,在步骤S5中,用户设备1基于排序信息将搜索结果按序排列显 示给用户。在一个优选实施例中,在前述步骤S3中,网络设备2还可根据大样本统计信息来 确定关键词与用户需求的关系,例如,对于关键词“Elton John”,网络设备2根据大量用户 对搜索结构的选择可以确定,通过对大量用户的选择的统计分析可确定其对应的用户需求 "EltonJohn的音乐”优先级或可能性较高、“Elton John的新闻”优先级沪可能性较低。在另一个优选实施例中,在步骤S3中,网络设备2还根据所述查询请求来查询预 先记录的与所述查询请求相关的大量用户选择的热门搜索项,并根据所述大量用户选择的 热门搜索项来确定所述用户的用户需求。例如2010年4月中国青海省玉树县发生7级以 上地震,而网络设备2中关键词“玉树”与该热门搜索项“玉树地震”相关联,从而当接收到 包含关键词“玉树”的查询请求时,可以确定用户希望了解“玉树地震”或“玉树地震赈灾” 新闻的需求的优先级或可能性较高,相对的了解“玉树旅游”或“玉树历史”的优先级或可 能性较低。优选地,在步骤S6(未示出)中,网络设备2可以自行经由网络在线搜索热门搜索 项,包括但不限于以下方式-首先,通过大样本统计信息,也即通过统计用户对网页的点击率,并对点击率排 序较高的网页进行信息抓取,确定相应的关键词;-接着,根据以下至少一项确定所述热门关键词的热门搜索项-所述热门关键词的时效性;
8
-所述热门关键词的主题类别;-所述热门关键词的主题需求类别。其中,主题类别是指关键词的所述类别,例如关键词“苹果”的主题类别上可以是 水果、计算机、电影。而主题需求类别是指相应于关键词的用户需求的类别,例如当用户输 入关键词“苹果”,如果其主题类型是属于计算机类别的,则主题需求类别可能是寻求苹果 公司信息,或是寻求苹果电脑的报价。在另一个优选实施例中,考虑由于用户的个体差异,使得当不同用户输入包含相 同关键词时,其实际需求也是因人而异,因此在步骤例如,对(成年)男性、(成年)女性、儿 童、老年人等,当输入查询请求中包含“**百货公司”时,其实际需求区别较大,其中,男性用 户可能对运动产品、男性服饰、金融商业书籍和重金属摇滚乐⑶等更感兴趣、女性用户可 能对护肤/化妆品、女性服饰、浪漫言情书籍和轻音乐CD更感兴趣,儿童用户对儿童服饰、 儿童读物和卡通DVD等更感兴趣,而老年用户对老年服饰、保养品、文史类书籍和古典音乐 CD更感兴趣。当然,用户的个人背景,例如教育背景、宗教背景等也会成为其实际需求的影 响要素,例如理工科毕业的用户可能对于技术类书籍更感兴趣,而经济类专业的用户对于 金融或商战类书籍更感兴趣。另外,例如,对于旅游网站时,当用户处于不同地域时其所感 兴趣的信息通常也是不同的,例如,对于处于北京地域的用户,当其输入的查询请求中包括 关键词“旅游”时,其实际需求可能是北京周边区域(例如,北戴河、河北)等自驾游和旅店 住宿信息,当其查询请求包括关键词“机票酒店”时,可能对由北京出发的特价机票更感兴 趣。此外,用户以往的搜索历史记录也可以成为确定其实际需求的指示信息,例如,网络设 备2通过查询一名用户的历史记录信息,发现其以往在访问红酒购物网站时更多地关注梅 乐(MERLOT)红酒,则可当其输入的查询请求包括“**红酒网站”时,其实际需求可能是与梅 乐红酒有关的信息。基于以上理解,在步骤S7(未示出)中,在网络设备2接收到来自用户设备1的查 询请求后,会查询该用户的用户相关信息,并在步骤S3中基于上述文义分析(或者进一步 结合热点搜索项)并结合用户的相关信息来判断用户的实际需求,以获得与用户实际需求 相匹配的搜索结果。如前所述,其中用户相关信息包括以下各项中至少一项-用户属性,其包含,但不限于,用户预先输入的个人背景信息,如性别、年龄、宗 教、国籍、教育程度等;-用户偏好,其包含,但不限于,用户预先设置的一些偏好选择,如喜爱的运动类 型、购物方式、红酒品种、音乐类型等;-用户查询历史记录,其由系统来记录和统计用户先前的搜索和点击浏览历史,从 而可判断或预测用户的需求。其中,当用户为登录用户时,网络设备2可通过该用户的ID 在网络端保存有该用户相关信息的用户特征库中进行查询;当用户为非登录用户时,可通 过检测该用户使用本网络设备2的搜索服务过程中的动作,或通过向用户设备1询问并获 取该用户的COOKIE信息来获得,优选地,可赋予该用户一个临时ID并为其建立一个用户特 征库,将此次搜索过程中用户的历史记录保存与该临时用户特征库中;-用户设备1的IP地址,其可以反映该用户当前所处地域,可由网络设备2实时检 测用户设备1的IP地址来获取。优选地,在步骤S8(未示出)中,网络设备2根据与用户设备1及用户的交互来记录和更新所述用户历史记录信息,具体地,包括但不限于以下方式1)网络设备2可在用户 一次搜索过程结束后记录用户在此搜索过程中的所有动作,例如点击和浏览;2)网络设备 2在用户一次搜索过程中记录用户每次动作并实时对网络端该用户的特征库进行更新,从 而可在用户在此次搜索过程中点击其他搜索结果时提供最新的用户历史记录信息。在另外一个优选实施例中,在步骤S5用户设备1向用户展示获得的搜索结果之 后,当用户对所显示的包含搜索结果的页面进行页面操作,例如包括但不限于,点击其中的 某一搜索结果项所含链接、或点击下一页按钮以显示随后的搜索结果、或点击刷新页面按 钮、或点击搜索按钮进行重新搜索时,该新交互信息经由用户设备1重新发送至网络设备 2,网络设备2将根据该新交互信息作为用户历史记录更新该用户的用户相关信息。优选 地,网络设备2还会将该新交互信息作为新的查询请求,重复上述步骤S3以及S6-S8,并将 进一步的搜索结果返回用户设备1。图2为根据本发明一个优选实施例的根据用户需求提供检索结果的方法流程图。除了以上参照图1描述的网络搜索方式,本发明同样适用于桌面端的搜索方式, 也即搜索引擎位于用户设备1。其主要对用户设备的本地信息进行搜索,包括用户设备1中 保存的全部可用信息,包括网页浏览器历史,电子邮件档案,字处理器文档等等。为实现本 地搜索的合理性能,用户设备1通常也需要建立和维护一个索引数据库,对应的索引信息 包括但不限于以下至少一项1)文件和目录名;2)元数据,例如标题,作者,注释;3)所支持文档的内容。如图2所示,在步骤Sl中,用户与用户设备1进行交互输入查询请求,具体过程与 前面参照图1描述的步骤Sl相同,为简明起见,将步骤Sl的描述以引用方式包含在此,而 不做赘述。随后,在步骤s2中,用户设备1基于查询请求对于本地索引库中保存的索引信息 进行查询,获得与用户需求相匹配的索引信息作为搜索结果,该信息包括但不限于文档、图 片、音乐等,具体过程与前面参照图1描述的步骤S3相同,为简明起见,将步骤S3的描述以 引用方式包含在此,而不做赘述。然后,在步骤S3中,用户设备1基于排序信息将搜索结果按序排列显示给用户。同样,在优选实施例中,当用户设备1与网络相连时,在步骤s4(未示出)中,用户 设备1优选地还可自行经由网络在线搜索热门搜索项,具体过程与前面参照图1描述的步 骤S6相同,为简明起见,将步骤S6描述以引用方式包含在此,而不做赘述。同样,在另一优选实施例中,在步骤s5中,当用户设备1收到来自用户的查询请求 后,会查询该用户的用户相关信息,并在步骤s2中基于上述文义分析(或者进一步结合热 点搜索项)并结合用户的相关信息来判断用户的实际需求,以获得与用户实际需求相匹配 的搜索结果。步骤s5的具体过程与与前面参照图1描述的步骤S7相同,为简明起见,将步 骤S7描述以引用方式包含在此,而不做赘述。在另一个优选实施例中,在步骤s6 (未示出)中,用户设备1会根据与用户的交互 来记录和更新所述用户历史记录信息,具体过程与与前面参照图1描述的步骤S8相同,为 简明起见,将步骤S8描述以引用方式包含在此,而不做赘述。
在另外一个优选实施例中,在步骤S3用户设备1向用户展示获得的搜索结果之 后,当用户对所显示的包含搜索结果的页面进行页面操作,例如包括但不限于,点击其中的 某一搜索结果项所含链接、或点击下一页按钮以显示随后的搜索结果、或点击刷新页面按 钮、或点击搜索按钮进行重新搜索时,用户设备1将根据该新交互信息作为用户历史记录 更新该用户的用户相关信息。优选地,用户设备1还会将该新交互信息将作为新的查询请 求将重复上述步骤s2以及s4_s6,并将进一步的搜索结果返回用户设备1。图3为根据本发明一个方面的根据用户需求提供检索结果的系统框图。如图3所示,用户在利用用户设备1进行网络浏览时,可通过诸如键盘、触摸屏、 语音输入装置与用户设备1进行交互,输入其希望查询的查询信息(query),从而发起搜 索。该搜索发起过程可以是用户首先通过用户设备1的浏览器软件访问一些搜索网站,如 Yahoo, com, Google, com, Baidu. com后,在该搜索网站首页的搜索栏中发起搜索;也可通过 嵌入浏览器的本地搜索栏发起搜索。本领域技术人员应能理解本发明不限于上述两种搜索 发起方式,任何已有的或今后可能出现的搜索发起方式均适用于本发明,应包含在本发明 的保护范围以内,并以引用方式而包含于此。接着,用户设备1将用户所输入的查询信息发送给网络设备2的获取装置21。 其中,在此,用户设备1包括,但不限于,计算机、智能手机、PDA等任何具有上网浏览功能 的设备。网络设备2包括,但不限于,网络服务器、网络主机、云计算模式下的其他用户设 备1等可以提供搜索服务的任何设备,其中网络设备2包括集中各种功能的单个设备, 或由多个分别完成单独功能的物理分离的设备的组合,例如执行搜索的设备与保存索引 信息的设备相互分离。此外,用户设备1与网络设备2之间的通信是基于各种通信协议 (CommunicationsftOtocol),在此“通信协议”指计算机通信的传送协议,如TCP/IP、UDP、 FTP、I CMP, NetBEUI等,同时还包括存在于计算机中的其他形式通信,例如面向对象编程 里面对象之间的通信;操作系统内不同程序或计算机不同模块之间的消息传送协议。但本 领域技术人员应理解本发明不限于所述几种通信传输协议,任何已有或今后可能出现的通 信协议均可适用于本发明,从而以引用方式而包含于此。随后,网络设备2的查询装置22基于获取装置21提供的查询信息在网络索引库 中进行搜索。本领域技术人员应能理解,网络索引库可位于网络设备2中或与之物理分离。其中,查询信息包含一个或多个关键词,关键词可以是字,词或者短语。在语音文 档检索中,还可以是混淆类、音子、音子串等等单元,或者还包括关键词之间的关联词。如前 所述,传统搜索引擎中,信息查询采用的模型,例如向量空间模型,一般通过将查询信息与 索引库中的索引信息进行对比以确定两者相似度,从而确定作为搜索结果的一个或多个搜 索引擎,其中,索引信息也由一些关键词来描述。对于所获得的多个搜索结果,传统搜索引擎一般通过其点击率或Google的 I^geRank或百度的超链等算法来确定各个搜索结果的排序。但传统搜索引擎的信息查询或 排序过程中并未考虑用户输入查询信息的实际需求,事实上,即使用户输入的查询请求中 包含相同的关键词,但由于本身内涵文义的区别,反映的用户需求也相应不同,其中查询请 求的内涵文义可由关键词之间及关联词的相互顺序,例如当用户分别输入查询请求“川菜 最好吃”或“最好吃川菜”,虽然均包含相同关键词,但对于前者,用户更可能希望查询口碑 最好的川菜馆,;而对于后者,用户更希望查询最受欢迎的川菜做法,也即,对于前者,用户需求“最好吃的川菜馆”优先级或可能性较高、用户需求“最好吃的川菜做法”优先级或可 能性较低;对于后者,正好相反。因此,查询装置2将对查询请求的文义分析与搜索技术相结合,获得一个或多个 较符合用户实际需求的搜索结果,而且这些搜索结果可以按与用户需求的匹配度进行排序。在一个实施方式中,索引库中索引信息应包含用户需求这一项,查询装置22包括 第一查询装置(未示出)、需求判断装置(未示出)、筛选装置(未示出),其中第一查询装 置根据前述已有的各种搜索技术基于查询信息在索引库中进行查询,获得多个搜索结果; 需求判断装置对查询请求进行文义分析以确定其反映的一个或多个用户需求及其对应的 优先级或可能性;筛选装置基于通过对查询请求文义分析所确定的一个或多个用户需求来 对该多个搜索结果进行筛选和排序,以获得最终确定的按用户需求进行排序的搜索结果。在另一实施方式中,查询装置22包括需求判断装置(未示出)、第二查询装置(未 示出)、需求判断装置对查询请求进行文义分析以确定其反映的一个或多个用户需求及其 对应的优先级或可能性;第二查询装置在基于查询请求对索引库进行查询时,将所确定的 用户需求作为信息查询的一个维度,以确定相匹配的一个或多个索引信息作为搜索结果。本领域技术人员应理解本发明不限于上述两种实施方式,本领域技术人员根据本 发明的构思应能想到的其他实施方式也应包含在本发明的保护范围以内。随后,网络设备2的提供装置23将查询装置22搜索得到的搜索结果及其排序信 息返回给用户设备1。最后,用户设备1基于排序信息将搜索结果按序排列显示给用户。在一个优选实施例中,查询装置22中的需求判断装置还可根据大样本统计信息 来确定关键词与用户需求的关系,例如,对于关键词“Elton John”,网络设备2根据大量用 户对搜索结构的选择可以确定,通过对大量用户的选择的统计分析可确定其对应的用户需 求“Eltonjohn的音乐”优先级或可能性较高、“Elton John的新闻”优先级沪可能性较低。在另一个优选实施例中,网络设备2还包括在先挖掘装置(未示出),其根据所述 查询请求来查询预先记录的与所述查询请求相关的大量用户选择的热门搜索项,并根据所 述大量用户选择的热门搜索项来确定所述用户的用户需求。例如2010年4月中国青海省 玉树县发生7级以上地震,而网络设备2中关键词“玉树”与该热门搜索项“玉树地震”相 关联,从而当接收到包含关键词“玉树”的查询请求时,可以确定用户希望了解“玉树地震” 或“玉树地震赈灾”新闻的需求的优先级或可能性较高,相对的了解“玉树旅游”或“玉树历 史”的优先级或可能性较低。优选地,在线挖掘装置可以自行经由网络在线搜索热门搜索项,包括但不限于以 下方式-首先,在线挖掘装置通过大样本统计信息,也即通过统计用户对网页的点击率, 并对点击率排序较高的网页进行信息抓取,确定相应的关键词;-接着,在线挖掘装置根据以下至少一项确定所述热门关键词的热门搜索项-所述热门关键词的时效性;-所述热门关键词的主题类别;-所述热门关键词的主题需求类别。其中,主题类别是指关键词的所述类别,例如关键词“苹果”的主题类别上可以是水果、计算机、电影。而主题需求类别是指相应于关键词的用户需求的类别,例如当用户输 入关键词“苹果”,如果其主题类型是属于计算机类别的,则主题需求类别可能是寻求苹果 公司信息,或是寻求苹果电脑的报价。在另一个优选实施例中,考虑由于用户的个体差异,使得当不同用户输入包含相 同关键词时,其实际需求也是因人而异,因此在步骤例如,对(成年)男性、(成年)女性、儿 童、老年人等,当输入查询请求中包含“**百货公司”时,其实际需求区别较大,其中,男性用 户可能对运动产品、男性服饰、金融商业书籍和重金属摇滚乐⑶等更感兴趣、女性用户可 能对护肤/化妆品、女性服饰、浪漫言情书籍和轻音乐CD更感兴趣,儿童用户对儿童服饰、 儿童读物和卡通DVD等更感兴趣,而老年用户对老年服饰、保养品、文史类书籍和古典音乐 CD更感兴趣。当然,用户的个人背景,例如教育背景、宗教背景等也会成为其实际需求的影 响要素,例如理工科毕业的用户可能对于技术类书籍更感兴趣,而经济类专业的用户对于 金融或商战类书籍更感兴趣。另外,例如,对于旅游网站时,当用户处于不同地域时其所感 兴趣的信息通常也是不同的,例如,对于处于北京地域的用户,当其输入的查询请求中包括 关键词“旅游”时,其实际需求可能是北京周边区域(例如,北戴河、河北)等自驾游和旅店 住宿信息,当其查询请求包括关键词“机票酒店”时,可能对由北京出发的特价机票更感兴 趣。此外,用户以往的搜索历史记录也可以成为确定其实际需求的指示信息,例如,网络设 备2通过查询一名用户的历史记录信息,发现其以往在访问红酒购物网站时更多地关注梅 乐(MERLOT)红酒,则可当其输入的查询请求包括“**红酒网站”时,其实际需求可能是与梅 乐红酒有关的信息。基于以上理解,网络设备2的查询装置22接收到获取装置21提供的用户设备1的 查询请求后,其中的需求判断装置会查询该用户的用户相关信息,基于上述文义分析(或 者进一步结合热点搜索项)并结合用户的相关信息来判断用户的实际需求,如前所述,其 中用户相关信息包括以下各项中至少一项-用户属性,其包含,但不限于,用户预先输入的个人背景信息,如性别、年龄、宗 教、国籍、教育程度等;-用户偏好,其包含,但不限于,用户预先设置的一些偏好选择,如喜爱的运动类 型、购物方式、红酒品种、音乐类型等;-用户查询历史记录,其由系统来记录和统计用户先前的搜索和点击浏览历史,从 而可判断或预测用户的需求。其中,当用户为登录用户时,需求判断装置可通过该用户的ID 在网络端保存有该用户相关信息的用户特征库中进行查询;当用户为非登录用户时,可通 过检测该用户使用本网络设备2的搜索服务过程中的动作,或通过向用户设备1询问并获 取该用户的Cookie信息来获得,优选地,可赋予该用户一个临时ID并为其建立一个用户特 征库,将此次搜索过程中用户的历史记录保存与该临时用户特征库中;-用户设备1的IP地址,其可以反映该用户当前所处地域,可由网络设备2实时检 测用户设备1的IP地址来获取。优选地,网络设备2还包括更新装置(未示出),其根据与用户设备1及用户的交 互来记录和更新所述用户历史记录信息,具体地,包括但不限于以下方式1)更新装置可 在用户一次搜索过程结束后记录用户在此搜索过程中的所有动作,例如点击和浏览;2)更 新装置在用户一次搜索过程中记录用户每次动作并实时对网络端该用户的特征库进行更新,从而可在用户在此次搜索过程中点击其他搜索结果时提供最新的用户历史记录信息。在另外一个优选实施例中,当用户设备1向用户展示获得的搜索结果之后,当用 户对所显示的包含搜索结果的页面进行页面操作,例如包括但不限于,点击其中的某一搜 索结果项所含链接、或点击下一页按钮以显示随后的搜索结果、或点击刷新页面按钮、或点 击搜索按钮进行重新搜索时,该新交互信息经由用户设备1重新发送至网络设备2,网络设 备2的更新装置将根据该新交互信息作为用户历史记录更新该用户的用户相关信息。优选 地,查询装置还会将该新交互信息将作为新的查询请求将重复上述查询过程,并将进一步 的搜索结果返回用户设备1。图4为根据本发明一个优选实施例的根据用户需求提供检索结果的系统框图。除了以上参照图3描述的网络搜索方式,本发明同样适用于桌面端的搜索方式, 也即搜索引擎位于用户设备1用,其主要对用户设备的本地信息进行搜索,包括用户设备1 中保存的全部可用信息,包括网页浏览器历史,电子邮件档案,字处理器文档等等。为实现 本地搜索的合理性能,用户设备1通常也需要建立和维护一个索引数据库,对应的索引信 息包括但不限于以下至少一项1)文件和目录名;2)元数据,例如标题,作者,注释;3)所支持文档的内容。如图4所示,用户设备1包括获取装置11、查询装置12、提供装置13,其所执行的 功能分别于前面参照图3中描述的网络设备2的获取装置21、查询装置22、提供装置23相 同,为简明起见,将前面针对获取装置21、查询装置22、提供装置23的描述以引用方式包含 在此,而不做赘述。同样,在优选实施例中,当用户设备1与网络相连时,用户设备1还包括在线挖掘 装置(未示出),其可以自行经由网络在线搜索热门搜索项,具体过程与前面参照图3描述 的网络设备2的在线挖掘装置相同,为简明起见,将该描述以引用方式包含在此,而不做赘 述。同样,在另一优选实施例中,当用户设备1收到来自用户的查询请求后,会查询该 用户的用户相关信息,用户设备1中查询装置12的需求判断装置(未示出)基于上述文义 分析(或者进一步结合热点搜索项)并结合用户的相关信息来判断用户的实际需求,以获 得与用户实际需求相匹配的搜索结果,具体过程与前面参照图3描述的网络设备2中查询 装置22的需求判断装置相同,为简明起见,将该描述以引用方式包含在此,而不做赘述。在另一个优选实施例中,用户设备1还包括更新装置(未示出)会根据与用户的 交互来记录和更新所述用户历史记录信息,具体过程与与前面参照图3描述的网络装置2 中的更新装置相同,为简明起见,将该步骤描述以引用方式包含在此,而不做赘述。在另外一个优选实施例中,在用户设备1的提供装置13向用户展示获得的搜索结 果之后,当用户对所显示的包含搜索结果的页面进行页面操作,例如包括但不限于,点击其 中的某一搜索结果项所含链接、或点击下一页按钮以显示随后的搜索结果、或点击刷新页 面按钮、或点击搜索按钮进行重新搜索时,更新装置将根据该新交互信息作为用户历史记 录更新该用户的用户相关信息。优选地,查询装置12还会将所述页面操作作为新的查询请 求并根据所述新的查询请求进行前述匹配搜索,以获得与所述查询请求和用户需求相匹配的一个或多个搜索选项。 以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述 特定实施方式,本领域技术人员可以在所附权利要求的范围内做出各种变形或修改。
权利要求
1.一种用于基于用户的需求进行搜索的方法,该方法包括以下步骤 a获取该用户的查询请求;b根据所述查询请求进行匹配搜索,以获得与所述查询请求和用户需求相匹配的一个 或多个搜索选项;c将所述一个或多个搜索选项提供给所述用户,供其选择。
2.根据权利要求1所述的方法,其中,所述步骤b包括 -根据所述查询请求进行匹配搜索,获得多个搜索选项; -根据所述查询请求来判断用户需求;-根据所述用户需求来对所述多个搜索选项进行筛选处理,获得与所述查询请求和所 述用户需求相匹配的一个或多个搜索选项。
3.根据权利要求1所述的方法,其中,所述步骤b还包括 -根据所述查询请求来判断用户需求;-根据所述查询请求及所述用户需求来进行匹配查询,以获得与所述查询请求和所述 用户需求相匹配的一个或多个搜索选项。
4.根据权利要求2或3所述的方法,其中,所述判断用户需求的步骤还包括 -对所述查询请求进行文义分析,以确定所述用户的所述用户需求。
5.根据权利要求2至4中任一项所述的方法,其中,所述判断用户需求的步骤还包括 -根据所述查询请求来查询预先记录的与所述查询请求相关的大量用户选择的热门搜索项,并根据所述大量用户选择的热门搜索项来确定所述用户的用户需求。
6.根据权利要求5所述的方法,其中,还包括-进行在线挖掘,以收集并记录热门关键词以及与其相关联的大量用户选择的热门搜 索项。
7.根据权利要求6所述的方法,其中,所述进行在线挖掘的步骤还包括 -根据用户点击率来确定热门关键词;-根据以下至少一项确定所述热门关键词的热门搜索项 -所述热门关键词的时效性; -所述热门关键词的主题类别; -所述热门关键词的主题需求类别。
8.根据权利要求2至7中任一项所述的方法,其中,所述判断用户需求的步骤还包括 -获取所述用户的用户相关信息;-基于所述用户相关信息来对所述查询请求进行分析,以确定所述用户的所述用户需求。
9.根据权利要求8所述的方法,其中,所述用户相关信息包括以下至少一项 -用户属性;-用户偏好; -用户查询历史记录; -用户IP地址。
10.根据权利要求9所述的方法,其中,该方法还包括d.获取所述用户在为其提供所述一个或多个搜索选项的页面上的页面操作,并根据所述页面操作更新所述用户的所述用户相关信息。
11.根据权利要求10所述的方法,其中,所述步骤d还包括以下步骤 -当所述页面操作包括翻页、刷新页面和重新搜索其中之一时,跳转至步骤b。
12.一种用于基于用户的需求进行搜索的设备,其中,该设备包括 获取装置,用于获取该用户的查询请求;查询装置,用于根据所述查询请求进行匹配搜索,以获得与所述查询请求和用户需求 相匹配的一个或多个搜索选项;提供装置,用于将所述一个或多个搜索选项提供给所述用户,供其选择。
13.根据权利要求12所述的设备,其中,所述查询装置还包括第一查询装置,用于根据所述查询请求进行匹配搜索,获得多个搜索选项; 需求判断装置,用于根据所述查询请求来判断用户需求;筛选装置,用于根据所述用户需求来对所述多个搜索选项进行筛选处理,获得与所述 查询请求和所述用户需求相匹配的一个或多个搜索选项。
14.根据权利要求12所述的设备,其中,所述查询装置还包括 需求判断装置,用于根据所述查询请求来判断用户需求;第二查询装置,用于根据所述查询请求及所述用户需求来进行匹配查询,以获得与所 述查询请求和所述用户需求相匹配的一个或多个搜索选项。
15.根据权利要求13或14所述的设备,其中,所述需求判断装置还用于 -对所述查询请求进行文义分析,以确定所述用户的所述用户需求。
16.根据权利要求13至15中任一项所述的设备,其中,所述需求判断装置还用于-根据所述查询请求来查询预先记录的与所述查询请求相关的大量用户选择的热门搜 索项,并根据所述大量用户选择的热门搜索项来确定所述用户的用户需求。
17.根据权利要求16所述的设备,其中,还包括在线挖掘装置,用于进行在线挖掘,以收集并记录热门关键词以及与其相关联的大量 用户选择的热门搜索项。
18.根据权利要求17所述的设备,其中,所述在线挖掘装置还用于 -根据用户点击率来确定热门关键词;-根据以下至少一项确定所述热门关键词的热门搜索项 -所述热门关键词的时效性; -所述热门关键词的主题类别; -所述热门关键词的主题需求类别。
19.根据权利要求13至18中任一项所述的设备,其中,所述需求判断装置还用于 -获取所述用户的用户相关信息;-基于所述用户相关信息来对所述查询请求进行分析,以确定所述用户的所述用户需求。
20.根据权利要求19所述的设备,其中,所述用户相关信息包括以下至少一项 -用户属性;-用户偏好; -用户查询历史记录;-用户IP地址。
21.根据权利要求20所述的设备,其中,该设备还包括更新装置,用于获取所述用户在为其提供所述一个或多个搜索选项的页面上的页面操 作,并根据所述页面操作更新所述用户的所述用户相关信息。
22.根据权利要求21所述的设备,其中,所述查询装置还用于-当所述页面操作包括翻页、刷新页面和重新搜索其中之一时,用于将所述页面操作作 为新的查询请求并根据所述新的查询请求进行匹配搜索,以获得与所述查询请求和用户需 求相匹配的一个或多个搜索选项。
全文摘要
本发明提供了一种用于基于用户的需求进行搜索的方法和设备。根据本发明,首先获取该用户的查询请求;随后根据所述查询请求进行匹配搜索,以获得与所述查询请求和用户需求相匹配的一个或多个搜索选项;将所述一个或多个搜索选项提供给所述用户,供其选择。具体地,本发明通过对查询请求进行文义分析获得其中内含的用户实际需求,或进一步结合大样本统计信息、热点信息和/或用户的相关信息来更准确判断用户的实际需求。从而,与现有的搜索技术相比,可以准确地获得与查询请求信息以及用户实际需求相匹配的搜索结构。
文档编号G06F17/30GK102063453SQ20101018709
公开日2011年5月18日 申请日期2010年5月31日 优先权日2010年5月31日
发明者孙云丰, 张玉睿, 徐波, 李明, 金海燕 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1