一种基于拆词处理进行图片搜索的方法与设备的制作方法

文档序号:6331411阅读:124来源:国知局
专利名称:一种基于拆词处理进行图片搜索的方法与设备的制作方法
技术领域
本发明涉及图片搜索技术领域,尤其涉及一种基于拆词处理进行图片搜索的技 术。
背景技术
随着互联网应用和图像处理技术的发展,越来越多的人们开始通过网络获取和分 享自己所喜欢的图片,如钟爱的明星的剧照、写真、生活照,以及拍摄的各地风景照等。然而,由于图片相对文字等其他形式的媒体资源,具有数量多、分类杂、带宽消耗 大、显示要求高等特点,这使得用户发现搜索引擎所返回的图片并不是自己所期望的,或者 需要经过多次调整图片搜索关键词,才能获取一些符合期望要求的图片,从而严重影响了 用户的使用体验。特别地,对于数量日见增长的移动终端用户,由于移动终端的上下行带宽 有限、屏幕偏小或显示功能相对较弱,使得这尤为突出。因此,如何提高图片搜索的效率,以支持用户通过图片搜索快捷、准确地获取其所 希望的图片,从而提升用户的满意度与体验度,成为现今亟需解决的一个问题。

发明内容
本发明的目的是提供一种基于拆词处理进行图片搜索的方法与设备。根据本发明的一个方面,提供了一种基于拆词处理进行图片搜索的方法,该方法 包括以下步骤a.获取用户在用户设备中进行图片搜索时输入的第一查询序列;b.对所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列;c.根据所述第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹配的一 个或多个图片;d.将所述一个或多个图片提供给所述用户设备。根据本发明的另一方面,还提供了一种基于拆词处理进行图片搜索的设备,该设 备包括获取装置,用于获取用户在用户设备中进行图片搜索时输入的第一查询序列;拆词装置,用于对所述第一查询序列进行拆词处理,以获得一个或多个第二查询 序列;搜索装置,用于根据所述第二查询序列进行匹配搜索,以获得与所述第二查询序 列相匹配的一个或多个图片;提供装置,用于将所述一个或多个图片提供给所述用户设备。与现有技术相比,本发明通过对第一查询序列进行拆词处理获得第二查询序列, 根据第二次查询序列进行图片搜索,并将搜得的图片提供给用户,提高了图片搜索的效率, 使得用户可以通过图片搜索快捷、准确地获取其所希望的图片,从而提升了用户的满意度 与体验度。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显图1示出根据本发明一个方面的基于拆词处理进行图片搜索的系统拓扑图;图2示出根据本发明一个方面的基于拆词处理进行图片搜索的设备示意图;图3示出根据本发明另一个方面的基于拆词处理进行图片搜索的方法流程图;图4示出根据本发明一个优选实施例的基于拆词处理进行图片搜索的方法流程 图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1示出根据本发明一个方面的用于基于拆词处理进行图片搜索的系统拓扑图, 其中包括网络设备1以及多个与之经由网络相连接的用户设备2。其中,网络设备1可与多 个用户设备2经由网络相连接,并获取用户通过用户设备2进行图片搜索时输入的第一查 询序列;对所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列;根据所述 第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹配的一个或多个图片;将所 述一个或多个图片提供给所述用户设备。在此,网络包括但不限于互联网、广域网、城域网、 局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。另外,网络设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或 基于云计算的计算机集合。而用户设备2可以是任何一种可与用户通过键盘、鼠标、遥控 器、触摸板、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑 PPC或IPTV等。网络设备1与多个用户设备2之间的通信相互独立,可以是基于诸如TCP/ IP协议、UDP协议等的分组数据传输。本领域技术人员应能理解上述网络设备1、用户设备2以及连接其间的网络和通 信方式仅为举例,其他现有的或今后可能出现的网络设备、用户设备、网络或通信方式如可 适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解,图1中仅为简明起见而示出的各类网络元素的数量 可能小于一个实际网络中的数量,但这种省略无疑地是以不会影响对本发明进行清楚、充 分的公开为前提的。为简明起见,下面以一个用户设备2为例进行描述。本领域技术人员应能理解,网 络设备1可以同时与多个用户设备2交互,并根据从不同用户设备2获取的用户进行图片 搜索时输入的第一查询序列;对所述第一查询序列进行拆词处理,以获得一个或多个第二 查询序列;根据所述第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹配的一 个或多个图片;将所述一个或多个图片分别提供给不同的用户设备2。图2示出根据本发明一个方面的基于拆词处理进行图片搜索的设备示意图,该网 络设备1包括获取装置11、拆词装置12、搜索装置13和提供装置14。其中,获取装置11用于获取用户在用户设备中进行图片搜索时输入的第一查询序列。具体地,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸 板、或手写设备,在浏览器或客户端软件中输入第一查询序列以进行图片搜索;以键盘为 例,当用户在浏览器的输入框中敲击键盘按键进行输入时,获取装置11通过页面技术,如 JSP、ASP、PHP技术,实时地获取用户敲击的按键序列,并记录为用户进行图片搜索时输入的 第一查询序列。本领域技术人员应能理解上述几种页面技术仅为举例,其他现有的或今后 可能出现的页面技术如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用 方式包含于此。拆词装置12用于对所述第一查询序列进行拆词处理,以获得一个或多个第二查 询序列。具体地,拆词装置12接收到由获取装置11提供的第一查询序列后,通过匹配查询, 例如通过在主题词拆分表或拆词库中进行查询匹配等方式,对所述第一查询序列进行拆词 处理,以获得一个或多个第二查询序列。例如,当用户输入“范冰冰”进行图片搜索时,获取 装置11获取到第一查询序列“范冰冰”并将此传递给拆词装置12,拆词装置12根据“范冰 冰”,在主题词拆分表中查询匹配,查询到“范冰冰”对应的第二查询序列是“范冰冰剧照”、 “范冰冰写真”、“范冰冰生活照”等。又如,用户输入“范冰冰”进行图片搜索,获取装置11 获取到第一查询序列“范冰冰”并将此传递给拆词装置12,拆词装置12根据“范冰冰”所属 的范畴“明星”,在拆词库中进行查询匹配,查询到“明星”所对应的拆词有“剧照”、“写真”、 “生活照”等,将上述拆词与第一查询序列“范冰冰”结合得到第二查询序列“范冰冰剧照”、 “范冰冰写真”、“范冰冰生活照”等。本领域技术人员应能理解上述拆词处理的方式仅为举 例,其他现有的或今后可能出现的拆词处理的方式如可适用于本发明,也应包含在本发明 保护范围以内,并在此以引用方式包含于此。搜索装置13用于根据所述第二查询序列进行匹配搜索,以获得与所述第二查询 序列相匹配的一个或多个图片。具体地,搜索装置13根据拆词装置12所提供的第二查询 序列,进行匹配搜索,例如根据第二查询序列进行在线图片搜索、根据第二查询序列在本地 的图片索引库进行图片搜索或两者相结合,获得与所述第二查询序列相匹配的一个或多个 图片。例如,在拆词装置12根据用户输入的第一查询序列“范冰冰”进行拆词处理得到第 二查询序列“范冰冰剧照”后,搜索装置13进行匹配搜索,搜索得到在图片标签、图片文本 信息或图片关键词中含有“范冰冰剧照”的图片。对本领域技术人员应能理解上述匹配搜索 的方式仅为举例,其他现有的或今后可能出现的匹配搜索的方式如可适用于本发明,也应 包含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述匹配搜索可以有多种 方式,例如根据第二查询序列对图片的相关文字信息,如图片文件名、图片标签、图片文本 信息或图片关键词等,进行匹配搜索;或者,根据第二查询序列确定一个对应的范例图片, 将此范例图片与其他图片进行基于内容的匹配搜索,如基于图像的颜色、纹理、平面空间对 应关系、外形,或者其他统计特征进行匹配搜索。对本领域技术人员应能理解上述图片搜索 的方式仅为举例,其他现有的或今后可能出现的图片搜索的方式如可适用于本发明,也应 包含在本发明保护范围以内,并在此以引用方式包含于此。在此,搜索装置13至少对拆词 装置12所提供的第二查询序列中之一进行匹配搜索,以获得一个或多个图片。提供装置14用于将所述一个或多个图片提供给所述用户设备。具体地,提供装 置14通过页面技术,如JSP、ASP、PHP技术,将搜索装置13搜索得到的图片和/或其链接 写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2。优选地,所述图片可
7以按照一定的规则进行排序,将所述排序后的图片写入一个或多个网页,并将所述网页和/ 或链接提供给用户设备2。接上例,在搜索装置13搜索得到在图片标签、图片文本信息或 图片关键词中含有“范冰冰剧照”的图片后,提供装置14通过页面技术,如JSP、ASP、PHP技 术,将所述图片和/或其链接写入一个或多个网页,并将这些网页和/或其链接提供给用户 设备2,以供用户选择浏览。本领域技术人员应能理解上述页面技术仅为举例,其他现有的 或今后可能出现的页面技术如可适用于本发明,也应包含在本发明保护范围以内,并在此 以引用方式包含于此。本领域技术人员还应能理解上述提供图片的方式仅为举例,其他现 有的或今后可能出现的提供图片的方式如可适用于本发明,也应包含在本发明保护范围以 内,并在此以引用方式包含于此。优选地,网络设备1中的各个装置之间是持续不断工作的。具体地,获取装置11实 时地获取用户在用户设备中进行图片搜索时输入的第一查询序列;拆词装置12对所述第 一查询序列进行拆词处理,以获得一个或多个第二查询序列;搜索装置13再根据所述第二 查询序列进行匹配搜索,以获得与所述第二查询序列相匹配的一个或多个图片;提供装置 14进一步将所述一个或多个图片提供给所述用户设备。在此,本领域技术人员应理解“持 续”是指各装置分别按照设定的或实时调整的工作模式要求进行第一查询序列的获取、拆 词处理、图片搜索和提供对应图片,直至该用户在较长时间内停止通过用户设备2执行图 片搜索等网络操作。优选地,搜索装置13还可以包括交互装置(未示出)。所述交互装置用于将所述 一个或多个第二查询序列提供给所述用户设备2,并获取该用户从所述一个或多个第二查 询序列中选择的第二查询序列;搜索装置13再根据该用户所选择的第二查询序列进行匹 配搜索,以获得与该第二查询序列相匹配的一个或多个图片。具体地,当拆词装置12对用 户输入的第一查询序列进行拆词处理,得到一个或多个第二查询序列,交互装置通过页面 技术,如JSP、ASP、PHP技术,将所述一个或多个第二查询序列提供给所述用户设备2。优选 地,交互装置可以将所述一个或多个第二查询序列通过第一查询序列的输入框的下拉备选 项的形式显示给用户,也可以通过悬浮框的形式显示给用户。本领域技术人员应能理解上 述将一个或多个第二查询序列提供给用户设备2的显示形式仅为举例,其他现有的或今后 可能出现的显示形式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用 方式包含于此。之后,用户通过用户设备2中的浏览器软件或客户端软件进行浏览,并通过 与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、或手写设备,对所述 含有拆词的一个或多个第二查询序列进行选择。以鼠标为例,当用户在输入框的下拉菜单 中用鼠标选中或点击某个第二查询序列时,交互装置通过以检测光标焦点、接收表单提交、 接收访问请求等形式,获取该用户对第二查询序列进行的用户选择,以供后续处理。此后, 所述搜索装置13还用于根据用户所选择的第二查询序列进行匹配搜索,以获得与所述第 二查询序列相匹配的一个或多个图片。例如,当用户在图片搜索的输入框内输入第一查询 序列“范冰冰”时,获取装置11通过页面技术,如JSP、ASP、PHP技术,获取到所述第一查询序 列“范冰冰”;拆词装置12再根据查表匹配通过拆词处理得到该第一查询序列“范冰冰”对 应第二查询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”;交互装置在该输入框的下 拉备选项中将上述第二查询序列提供给用户设备,供用户选择;若用户选中或点击选择“范 冰冰剧照”,交互装置再通过检测光标焦点、接收表单提交、接收访问请求等形式,获取该用
8户的选择为第二查询序列“范冰冰剧照”;搜索装置13根据用户所选择的第二查询序列“范 冰冰剧照”进行匹配搜索,获得与所述第二查询序列“范冰冰剧照”相匹配的一个或多个图 片;提供装置14再通过页面技术,如JSP、ASP、PHP技术,将上述与“范冰冰剧照”相匹配的 一个或多个图片和/或其链接写入一个或多个网页,并将这些网页和/或其链接提供给用 户设备2。 优选地,所述拆词装置12还用于根据拆词库,对所述第一查询序列进行拆词处 理,以获得一个或多个第二查询序列。具体地,拆词装置12接收到由获取装置11提供的第 一查询序列后,在拆词库中对第一查询序列进行匹配查询,对所述第一查询序列进行拆词 处理,以获得一个或多个第二查询序列。例如,用户输入“范冰冰”进行图片搜索,获取装置 11获取到第一查询序列“范冰冰”并将此传递给拆词装置12。拆词装置12根据“范冰冰” 在拆词库中进行匹配查询,查询到“范冰冰”对应的第二查询序列是“范冰冰剧照”、“范冰冰 写真”、“范冰冰生活照”等。搜索装置13根据所述第二查询序列进行匹配搜索,获得与所述 第二查询序列相匹配的一个或多个图片。提供装置14再通过页面技术,如JSP、ASP、PHP技 术,将与所述第二查询序列相匹配的一个或多个图片和/或其链接写入一个或多个网页, 并将这些网页和/或其链接提供给用户设备2。更优选地,在拆词装置12查询得到第二查 询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”等之后,交互装置可以将所述第二查 询序列通过第一查询序列的输入框的下拉备选项、悬浮框等形式提供给用户设备2,供用户 选择。然后,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、 或手写设备,对所述含有拆词的一个或多个第二查询序列进行选择。交互装置通过以检测 光标焦点、接收表单提交、接收访问请求等形式,获取该用户对第二查询序列进行的用户选 择。搜索装置13再根据用户所选择的第二查询序列进行匹配搜索,获得与所述第二查询序 列相匹配的一个或多个图片。提供装置14通过页面技术,如JSP、ASP、PHP技术,将与用户所 选择的第二查询序列相匹配的一个或多个图片和/或其链接写入一个或多个网页,并将这 些网页和/或其链接提供给用户设备2。又如,用户输入“范冰冰”进行图片搜索,获取装置 11获取到第一查询序列“范冰冰”并将此传递给拆词装置12。拆词装置12根据“范冰冰” 所属的范畴“明星”在拆词库中进行匹配查询,查询到“明星”所对应的拆词有“剧照”、“写 真”、“生活照”等;然后,拆词装置12再将上述拆词与第一查询序列“范冰冰”结合,得到第 二查询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”等。搜索装置13根据所述第二 查询序列进行匹配搜索,获得与所述第二查询序列相匹配的一个或多个图片。提供装置14 再通过页面技术,如JSP、ASP、PHP技术,将与所述第二查询序列相匹配的一个或多个图片 和/或其链接写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2。更优选 地,在拆词装置12将拆词“剧照”、“写真”、“生活照”与第一查询序列“范冰冰”结合,得到第 二查询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”等之后,交互装置可以将所述第 二查询序列通过第一查询序列的输入框的下拉备选项、悬浮框等形式提供给用户设备2,供 用户选择。然后,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触 摸板、或手写设备,对所述含有拆词的一个或多个第二查询序列进行选择。交互装置通过以 检测光标焦点、接收表单提交、接收访问请求等形式,获取该用户对第二查询序列进行的用 户选择。搜索装置13再根据用户所选择的第二查询序列进行匹配搜索,获得与所述第二查 询序列相匹配的一个或多个图片。提供装置14通过页面技术,如JSP、ASP、PHP技术,将与用户所选择的第二查询序列相匹配的一个或多个图片和/或其链接写入一个或多个网页, 并将这些网页和/或其链接提供给用户设备2。本领域技术人员应能理解上述根据拆词库 进行拆词处理的方式仅为举例,其他现有的或今后可能出现的根据拆词库进行拆词处理的 方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,网络设备1还可以包括第一更新装置(未示出),用于根据对大量用户所 使用的图片搜索关键词的统计分析,建立或更新所述拆词库。具体地,第一更新装置根据 一段时间内用户所使用的图片搜索关键词的统计分析,如经统计分析得到“范冰冰”的图片 搜索关键词有“范冰冰写真”(占33% )、“范冰冰剧照”(占31% )、“范冰冰生活照”(占 28% )、“范冰冰其他”(占8% ),进而确定涉及“范冰冰”的第一查询序列可以对应第二查 询序列“范冰冰写真”、“范冰冰剧照”、“范冰冰生活照”等,建立或更新该拆词库,如在该拆 词库中相应地添加或修改“范冰冰”所对应的拆词处理记录。在此,第一更新装置既可以 独立完成对大量用户所使用的图片搜索关键词的统计分析,也可以接受来自其他产品或第 三方设备对大量用户所使用的图片搜索关键词的统计分析结果。例如,当第一更新装置独 立完成对大量用户所使用的图片搜索关键词的统计分析时,第一更新装置记录存储一段时 间内用户所使用的图片搜索关键词,然后对这些图片搜索关键词进行统计分析,例如得出 对应同一个主题词的各种图片搜索关键词所占百分比,取其中所占百分比较大的图片检索 关键词作为该主题词对应的一个或多个第二查询序列,再如取使用频次超过一定阈值的图 片搜索关键词为对应主题词的第二查询序列之一。例如,当第一个用户使用图片搜索关键 词“范冰冰剧照”时,第一更新装置可以将其记录下来,并对所述图片搜索关键词“范冰冰剧 照”的使用频次进行统计,当其被使用的频次超过设定的阈值(例如1000次)时,将此图片 搜索关键词作为拆词存入拆词库。其后,当任一用户输入“范冰冰”进行图片搜索时,网络 设备1可以将此图片搜索关键词“范冰冰剧照”作为第二查询序列进行匹配搜索,或者提供 给用户供其进行选择。再如,当大量用户使用“某某明星剧照”的格式作为第一查询序列进 行图片搜索时,第一更新装置可以将其中的图片搜索关键词“剧照”作为拆词,存入拆词库, 当任一用户再次输入包含“某某明星”字样的第一查询序列进行图片搜索时,网络设备1可 以将该拆词“剧照”与“某某明星”结合作为第二查询序列进行匹配搜索,或者提供给用户 供其进行选择。优选地,用户在搜索图片的时候会输入第一查询序列,通过对其进行预处理 或拆词处理可以得到搜索图片所用到的图片搜索关键词。例如,当用户在图片搜索的输入 框内输入第一查询序列“范冰冰图片”,由于搜索引擎的搜索范围本身就是图片,因此,去除 “图片”这一次要信息,得到所述第一查询序列的图片搜索关键词是“范冰冰”。又如,当用 户输入第一查询序列“范冰冰剧照”时,“范冰冰剧照”即成为图片搜索关键词。对本领域技 术人员应能理解上述更新拆词库的方式仅为举例,其他现有的或今后可能出现的更新拆词 库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于 此。更优选地,所述第一更新装置(未示出)还用于根据对大量用户所使用的图片搜 索关键词及其所对应的图片选择的统计分析,建立或更新所述拆词库。具体地,第一更新装 置还可以根据对于大量用户在搜索图片时所使用的图片搜索关键词及其最终选择浏览的 图片的统计分析,例如根据所选择浏览的图片纠正对应的图片搜索关键词或者根据所选择 浏览的图片导出相应的图片搜索关键词,建立或更新该拆词库,例如在该拆词库中相应地添加或修改一个或多个主题词所对应的拆词处理记录。例如,当有用户利用“范冰冰”进行 图片搜索时,根据该用户所选择的图片中的标签、文本信息或关键词等描述信息,该用户选 择浏览的图片为“范冰冰”的“剧照”,则修正该用户的图片检索关键词为“范冰冰剧照”;并 按照前一实施例(因实施例基本相同,不再赘述,并在此以引用的方式包含于此),根据对 大量用户所使用的图片搜索关键词的统计分析,更新该拆词库。又如,在提供给用户的有关 “范冰冰”的图片中,通过对图片标签、文本信息或关键词的提取,确定大量用户选择的是有 关“范冰冰”的“剧照”的图片,第一更新装置可以将“范冰冰剧照”作为对应“范冰冰”的第 二查询序列存入拆词库,以更新所述拆词库。对本领域技术人员应能理解上述更新拆词库 的方式仅为举例,其他现有的或今后可能出现的更新拆词库的方式如可适用于本发明,也 应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,第一更新装置既可以独 立完成对大量用户所使用的图片搜索关键词及其所对应的图片选择的统计分析,也可以接 受来自其他产品或第三方设备对大量用户所使用的图片搜索关键词及其所对应的图片选 择的统计分析结果。例如,当第一更新装置独立完成对大量用户所使用的图片搜索关键词 及其所对应的图片选择的统计分析时,第一更新装置记录存储一段时间内用户所使用的图 片搜索关键词及其所对应的图片选择,然后对这些图片搜索关键词及其所对应的图片选择 进行统计分析,例如得出对应同一个主题词的各种图片搜索关键词(包括经根据选择浏 览的图片纠正后的图片搜索关键词、根据选择浏览的图片导出的图片搜索关键词)所占百 分比,取其中所占百分比较大的图片检索关键词作为该主题词对应的一个或多个第二查询 序列,再如取使用频次超过一定阈值的图片搜索关键词(包括经根据选择浏览的图片纠正 后的图片搜索关键词、根据选择浏览的图片导出的图片搜索关键词)为对应主题词的第二 查询序列之一。优选地,所述搜索装置13还用于根据所述第二查询序列,并结合该用户的用户相 关信息,进行匹配搜索,以获得与所述第二查询序列和所述用户相关信息相匹配的一个或 多个图片。具体地,搜索装置13在接收到拆词装置12提供的第二查询序列,或由交互装置 传递过来的用户所选择的第二查询序列时,结合网络设备1记录的或者该用户设定的用户 相关信息,进行匹配搜索,以获得与所述第二查询序列和所述用户相关信息相匹配的一个 或多个图片。例如,若用户设定的偏好选项是汽车,则当第二查询序列为“美洲豹”时,搜索 装置13根据第二查询序列“美洲豹”,并结合该用户的偏好选项“汽车”,进行匹配搜索,得 到有关“美洲豹汽车”的图片,提供装置14再将所述有关“美洲豹汽车”的图片提供给用户 设备,供用户进行选择浏览。又如,若用户设定的偏好选项是动物,则当第二查询序列为“美 洲豹”时,搜索装置13根据第二查询序列“美洲豹”,并结合该用户的偏好选项“动物”,进行 匹配搜索,得到有关“美洲豹动物”的图片,提供装置14再将所述有关“美洲豹汽车”的图 片提供给用户设备,供用户进行选择浏览。优选地,网络设备1还可以包括排序装置(未示出),用于根据该用户的用户相关 信息,对所述一个或多个图片进行排序;其中,所述提供装置14还用于将排序后的所述一 个或多个图片提供给所述用户设备。具体地,在搜索装置13根据第二查询序列进行匹配搜 索得到一个或多个图片之后,排序装置根据用户相关信息,例如,根据提取的图片的标签、 文本信息或关键词与用户相关信息的匹配度,对所述一个或多个图片进行排序;提供装置 14再通过页面技术,如JSP、ASP、PHP技术,将排序后的所述一个或多个图片和/或其链接
11写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2。接上例,若用户设定 的偏好选项是汽车,则当第二查询序列为“美洲豹”时,搜索装置13根据第二查询序列“美 洲豹”进行匹配搜索,得到有关“美洲豹”的图片;排序装置根据用户设定的偏好选项,即“汽 车”,优先排列有关“美洲豹汽车”的图片;提供装置14再按照此优先排列顺序将所述有关 “美洲豹汽车”的图片提供给用户设备,供用户进行选择浏览。又如,若用户设定的偏好选 项是动物,则当第二查询序列为“美洲豹”时,搜索装置13根据第二查询序列“美洲豹”进 行匹配搜索,得到有关“美洲豹”的图片;排序装置根据用户设定的偏好选项,即“动物”,优 先排列有关“美洲豹动物”的图片;提供装置14再按照此优先排列顺序将所述有关“美洲 豹动物”的图片提供给用户设备,供用户进行选择浏览。对本领域技术人员应能理解上述 图片排序的方式仅为举例,其他现有的或今后可能出现的图片排序的方式如可适用于本发 明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。更优选地,所述排序装置(未示出)还用于根据该用户的用户相关信息,对所述一 个或多个第二查询序列进行排序;随后,搜索装置13将排序后的所述一个或多个第二查询 序列提供给所述用户设备,并获取该用户从所述一个或多个第二查询序列中选择的第二查 询序列,根据所述用户选择的第二查询序列进行匹配搜索,以获得与所述第二查询序列相 匹配的一个或多个图片。具体地,对于拆词装置12拆词处理得到的一个或多个第二查询序 列,排序装置可以根据该用户的相关信息,对所述一个或多个第二查询序列进行排序;搜索 装置13再将排序后的所述一个或多个查询序列通过例如第一查询序列的输入框的下拉备 选项或悬浮框等形式提供给所述用户设备;然后,搜索装置13再通过以检测光标焦点、接 收表单提交、接收访问请求等形式,获取该用户从所述一个或多个第二查询序列中选择的 第二查询序列。优选地,该输入框的下拉备选项或者悬浮框还可以根据页面大小自适应的 调整,例如,对于屏幕受限的移动终端,下拉菜单或者悬浮框可以自适应地变小,只显示位 于排序后的所述第二查询序列的前列的部分第二查询序列。对本领域技术人员应能理解上 述第二查询序列排序的方式仅为举例,其他现有的或今后可能出现的排序的方式如可适用 于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述用户相关信息包括但不限于以下至少一项a)所述用户的个人属 性;b)所述用户的输入历史记录;C)所述用户设定的偏好选项;d)所述用户设备的地址信 息。网络设备1可以根据用户的个人属性(例如用户的年龄、性别、职业、教育背景等),匹 配搜索用户可能感兴趣的图片,或推知用户可能感兴趣的第二查询序列或图片,将所述第 二查询序列或图片排在前列,供用户选择或浏览。例如,若网络设备1记录该用户为男性, 则当其输入“美洲豹”进行图片检索时,将有关“美洲豹汽车”的图片排在前列,显示给用户。 网络设备1还可以根据用户输入的历史记录,匹配搜索用户可能感兴趣的图片,或推知用 户可能感兴趣的第二查询序列或图片,将所述第二查询序列或图片排在前列,供用户选择 或浏览。例如,用户曾经输入“阿凡达”进行图片搜索,那么,当该用户再输入“电影”进行图 片搜索时,与“阿凡达”相关的图片会排在前列,显示给该用户。网络设备1还可以根据用 户设定的偏好选项(例如“电影”、“电视”、“剧照”、“写真”、“生活照”等),匹配搜索用户可 能感兴趣的图片,或推知用户可能感兴趣的第二查询序列或图片,以将所述第二查询序列 或图片排在前列,供用户选择或浏览。例如,若用户设定的偏好为电影剧照,则当用户输入 “范冰冰”时,第二查询序列中,“范冰冰剧照苹果”、“范冰冰剧照十月围城”等排在前列,供用户选择,在返回的图片中,有关“范冰冰剧照苹果”、“范冰冰剧照十月围城”等图片排在前 列,供用户选择浏览;若用户的偏好为电视剧剧照,则当用户输入“范冰冰”时,第二查询序 列中,“范冰冰剧照还珠格格”、“范冰冰剧照胭脂雪”等排在前列,供用户选择,在返回的图 片中,有关“范冰冰剧照还珠格格”、“范冰冰剧照胭脂雪,,等图片排在前列,供用户选择浏 览。网络设备1还可以根据用户设备的地址信息(例如用户设备的IP地址、GPS信息等), 匹配搜索用户可能感兴趣的图片,或推知用户可能感兴趣的第二查询序列或图片,以将所 述第二查询序列或图片排在前列,供用户选择或浏览。例如,网络设备1检测到用户设备2 的当前IP地址在上海,则对于获取装置11获取的第一查询序列“南京路”,拆词装置12可 以进行拆词处理,得到例如“南京路折扣店”、“南京路明星活动”等第二查询序列,搜索装置 13可以根据上述第二查询序列进行搜索,或者交互装置将上述第二查询序列排在前列,供 用户选择,排序装置可以将上述相关的图片排在前列,由提供装置14提供给用户设备,供 用户浏览选择。又如,当网络设备1检测到用户设备2的当前IP地址不在上海时,可以推 知其想了解上海南京路的旅游信息,拆词装置12可以进行拆词处理,得到例如“南京路地 图”、“南京路特色小吃”等第二查询序列,搜索装置13可以根据上述第二查询序列进行搜 索,或者交互装置将上述第二查询序列排在前列,供用户选择,排序装置可以将上述相关的 图片排在前列,由提供装置14提供给用户设备,供用户浏览选择。对本领域技术人员应能 理解上述用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于 本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,该设备还包括第二更新装置(未示出),用于根据所述第二查询序列和/ 或该用户对所述一个或多个图片所做的选择,更新所述用户相关信息。例如,第二更新装置 可以根据交互装置所提供的用户所选择第二查询序列,更新该用户的输入历史记录等用户 相关信息。例如,当用户在“范冰冰”对应的第二查询序列或图片中,选择了 “范冰冰写真” 或属于“范冰冰写真”的图片,那么,第二更新装置则相应地更新用相关信息,如增加“范冰 冰写真”等输入历史记录。本领域技术人员应能理解,上述第一更新装置和第二更新装置仅为示例,在实践 中,它们可以是两个独立的模块,也可集成在一个模块中。优选地,所述拆词装置12还用于对所述第一查询序列进行预处理;将预处理后的 所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列。具体地,在用户输入的 第一查询序列中可能会包含一些次要信息,如“的”、“图片”等,或者所述第一查询序列是一 个长句,因此,拆词装置12需要对这些第一查询序列进行预处理,以方便对此进行拆词处 理。然后,拆词装置12根据预处理后的第一查询序列,通过匹配查询,例如通过在主题词拆 分表或拆词库中进行查询匹配等方式,对所述第一查询序列进行拆词处理,以获得一个或 多个第二查询序列。更优选地,所述预处理包括以下至少一项a)同义词替换;b)分类处理;C)分词 处理。例如,当用户输入第一查询序列“小S”时,拆词装置12可以对此进行预处理,将“小 S”同义词替换为“徐熙娣”,以进一步对此进行拆词处理。又如,用户输入的第一查询序列 “范冰冰”属于“演员”,而“演员图片”可以拆分为“演员剧照”、“演员写真”、“演员生活照” 等,先对此进行分类处理再进一步拆词处理,即根据第一查询序列“范冰冰”得到其对应的 第二查询序列“范冰冰写真”、“范冰冰剧照”和“范冰冰生活照”等。再如,在用户输入的第
13一查询序列中可能会包含一些次要信息(例如“的”),可以对该第一查询序列进行分词处 理,例如先将这些次要信息去除,或者将长句进行断句,去除重复词汇,再从中提取主题词, 进行分词处理,以进一步对此进行拆词处理。对本领域技术人员应能理解上述对第一查询 序列进行预处理的方式仅为举例,其他现有的或今后可能出现的预处理的方式如可适用于 本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。图3示出根据本发明另一个方面的基于拆词处理进行图片搜索的方法流程图。其中,网络设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或 基于云计算的计算机集合。而用户设备2可以是任何一种可与用户通过键盘、鼠标、遥控 器、触摸板、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑 PPC或IPTV等。网络设备1与多个用户设备2之间的通信相互独立,可以是基于诸如TCP/ IP协议、UDP协议等的分组数据传输。本领域技术人员应能理解上述网络设备1、用户设备2以及其间的通信方式仅为 举例,其他现有的或今后可能出现的网络设备、用户设备或通信方式如可适用于本发明,也 应包含在本发明保护范围以内,并在此以引用方式包含于此。具体地,在步骤Sl中,网络设备1获取用户在用户设备中进行图片搜索时输入的 第一查询序列。具体地,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控 器、触摸板、或手写设备,在浏览器或客户端软件中输入第一查询序列以进行图片搜索;以 键盘为例,当用户在浏览器的输入框中敲击键盘按键进行输入时,网络设备1通过页面技 术,如JSP、ASP、PHP技术,实时地获取用户敲击的按键序列,并记录为用户进行图片搜索时 输入的第一查询序列。本领域技术人员应能理解上述几种页面技术仅为举例,其他现有的 或今后可能出现的页面技术如可适用于本发明,也应包含在本发明保护范围以内,并在此 以引用方式包含于此。在步骤S2中,网络设备1对所述第一查询序列进行拆词处理,以获得一个或多个 第二查询序列。具体地,网络设备1获取用户输入的第一查询序列后,通过匹配查询,例如 通过在主题词拆分表或拆词库中进行查询匹配等方式,对所述第一查询序列进行拆词处 理,以获得一个或多个第二查询序列。例如,当用户输入“范冰冰”进行图片搜索时,网络设 备1获取到第一查询序列“范冰冰”,并根据所述第一查询序列“范冰冰”,在主题词拆分表 中查询匹配,查询到“范冰冰”对应的第二查询序列是“范冰冰剧照”、“范冰冰写真”、“范冰 冰生活照”等。又如,用户输入“范冰冰”进行图片搜索,网络设备1获取到第一查询序列 “范冰冰”,并根据所述第一查询序列“范冰冰”所属的范畴“明星”,在拆词库中进行查询匹 配,查询到“明星”所对应的拆词有“剧照”、“写真”、“生活照”等,将上述拆词与第一查询序 列“范冰冰”结合得到第二查询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”等。本 领域技术人员应能理解上述拆词处理的方式仅为举例,其他现有的或今后可能出现的拆 词处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包 含于此。在步骤S3中,网络设备1根据所述第二查询序列进行匹配搜索,以获得与所述第 二查询序列相匹配的一个或多个图片。具体地,网络设备1根据拆词处理得到的第二查询 序列,进行匹配搜索,例如根据第二查询序列进行在线图片搜索、根据第二查询序列在本地 的图片索引库进行图片搜索或两者相结合,获得与所述第二查询序列相匹配的一个或多个图片。例如,在网络设备1根据用户输入的第一查询序列“范冰冰”进行拆词处理得到第二 查询序列“范冰冰剧照”后,网络设备1进行匹配搜索,搜索得到在图片标签、图片文本信息 或图片关键词中含有“范冰冰剧照”的图片。对本领域技术人员应能理解上述匹配搜索的 方式仅为举例,其他现有的或今后可能出现的匹配搜索的方式如可适用于本发明,也应包 含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述匹配搜索可以有多种方 式,例如根据第二查询序列对图片的相关文字信息,如图片文件名、图片标签、图片文本信 息或图片关键词等,进行匹配搜索;或者,根据第二查询序列确定一个对应的范例图片,将 此范例图片与其他图片进行基于内容的匹配搜索,如基于图像的颜色、纹理、平面空间对应 关系、外形,或者其他统计特征进行匹配搜索。对本领域技术人员应能理解上述图片搜索的 方式仅为举例,其他现有的或今后可能出现的图片搜索的方式如可适用于本发明,也应包 含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备1至少对拆词处理 得到的第二查询序列中之一进行匹配搜索,以获得一个或多个图片。在步骤S4中,网络设备1将所述一个或多个图片提供给所述用户设备。具体地, 网络设备1通过页面技术,如JSP、ASP、PHP技术,将搜索得到的图片和/或其链接写入一个 或多个网页,并将这些网页和/或其链接提供给用户设备2。优选地,所述图片可以按照一 定的规则进行排序,将所述排序后的图片写入一个或多个网页,并将所述网页和/或链接 提供给用户设备2。接上例,在网络设备1搜索得到在图片标签、图片文本信息或图片关键 词中含有“范冰冰剧照”的图片后,网络设备1通过页面技术,如JSP、ASP、PHP技术,将所述 图片和/或其链接写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2,以 供用户选择浏览。本领域技术人员应能理解上述页面技术仅为举例,其他现有的或今后可 能出现的页面技术如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方 式包含于此。本领域技术人员还应能理解上述提供图片的方式仅为举例,其他现有的或今 后可能出现的提供图片的方式如可适用于本发明,也应包含在本发明保护范围以内,并在 此以引用方式包含于此。优选地,步骤S1-S4之间是持续不断工作的。具体地,网络设备在步骤Sl中实时地 获取用户在用户设备中进行图片搜索时输入的第一查询序列;在步骤S2中对所述第一查 询序列进行拆词处理,以获得一个或多个第二查询序列;在步骤S3中再根据所述第二查询 序列进行匹配搜索,以获得与所述第二查询序列相匹配的一个或多个图片;在步骤S4中, 网络设备1进一步将所述一个或多个图片提供给所述用户设备。在此,本领域技术人员应 理解“持续”是指各步骤分别按照设定的或实时调整的工作模式要求进行第一查询序列的 获取、拆词处理、图片搜索和提供对应图片,直至该用户在较长时间内停止通过用户设备2 执行图片搜索等网络操作。图4示出根据本发明一个优选实施例的基于拆词处理进行图片搜索的方法流程 图,其中,步骤S1,、S2,、S303,和S4,与图3所示对应步骤Si、S2、S3和S4相同,故此处不 再赘述,并通过引用的方式包含于此。网络设备1在步骤S301’中将所述一个或多个第二查询序列提供给所述用户设备 2,并在步骤S302’中获取该用户从所述一个或多个第二查询序列中选择的第二查询序列; 然后,在步骤S303’中,网络设备1再根据该用户所选择的第二查询序列进行匹配搜索,以 获得与该第二查询序列相匹配的一个或多个图片。具体地,当网络设备1对用户输入的第
15一查询序列进行拆词处理,得到一个或多个第二查询序列,网络设备1通过页面技术,如 JSP, ASP, PHP技术,将所述一个或多个第二查询序列提供给所述用户设备2。优选地,网络 设备1可以将所述一个或多个第二查询序列通过第一查询序列的输入框的下拉备选项的 形式显示给用户,也可以通过悬浮框的形式显示给用户。本领域技术人员应能理解上述将 一个或多个第二查询序列提供给用户设备2的显示形式仅为举例,其他现有的或今后可能 出现的显示形式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式 包含于此。之后,用户通过用户设备2中的浏览器软件或客户端软件进行浏览,并通过与用 户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板、或手写设备,对所述含有 拆词的一个或多个第二查询序列进行选择。以鼠标为例,当用户在输入框的下拉菜单中用 鼠标选中或点击某个第二查询序列时,网络设备1通过以检测光标焦点、接收表单提交、接 收访问请求等形式,获取该用户对第二查询序列进行的用户选择,以供后续处理。此后,网 络设备1还可以根据用户所选择的第二查询序列进行匹配搜索,以获得与所述第二查询序 列相匹配的一个或多个图片。例如,当用户在图片搜索的输入框内输入第一查询序列“范冰 冰”,网络设备1通过页面技术,如JSP、ASP、PHP技术,获取到所述第一查询序列“范冰冰”; 然后,网络设备1根据查表匹配通过拆词处理得到该第一查询序列“范冰冰”对应第二查询 序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”;在该输入框的下拉备选项中将上述第 二查询序列提供给用户设备,供用户选择;若用户选中或点击选择“范冰冰剧照”,网络设备 1再通过检测光标焦点、接收表单提交、接收访问请求等形式,获取该用户的选择为第二查 询序列“范冰冰剧照”;网络设备1根据用户所选择的第二查询序列“范冰冰剧照”进行匹配 搜索,获得与所述第二查询序列“范冰冰剧照”相匹配的一个或多个图片;再通过页面技术, 如JSP、ASP、PHP技术,将上述与“范冰冰剧照”相匹配的一个或多个图片和/或其链接写入 一个或多个网页,并将这些网页和/或其链接提供给用户设备2。 优选地,在步骤S2中,网络设备1还可以根据拆词库,对所述第一查询序列进行 拆词处理,以获得一个或多个第二查询序列。具体地,网络设备1获取第一查询序列后,在 拆词库中对第一查询序列进行匹配查询,对所述第一查询序列进行拆词处理,以获得一个 或多个第二查询序列。例如,用户输入“范冰冰”进行图片搜索,网络设备1获取到第一查询 序列“范冰冰”。网络设备1根据“范冰冰”在拆词库中进行匹配查询,查询到“范冰冰”对 应的第二查询序列是“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”等。网络设备1根据 所述第二查询序列进行匹配搜索,获得与所述第二查询序列相匹配的一个或多个图片。网 络设备1再通过页面技术,如JSP、ASP、PHP技术,将与所述第二查询序列相匹配的一个或多 个图片和/或其链接写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2。 更优选地,在网络设备1查询得到第二查询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活 照”等之后,可以将所述第二查询序列通过第一查询序列的输入框的下拉备选项、悬浮框等 形式提供给用户设备2,供用户选择。然后,用户通过与用户设备2的交互方式,包括但不限 于键盘、鼠标、遥控器、触摸板、或手写设备,对所述含有拆词的一个或多个第二查询序列进 行选择。网络设备1通过以检测光标焦点、接收表单提交、接收访问请求等形式,获取该用 户对第二查询序列进行的用户选择。网络设备1再根据用户所选择的第二查询序列进行匹 配搜索,获得与所述第二查询序列相匹配的一个或多个图片。网络设备1通过页面技术,如 JSP、ASP、PHP技术,将与用户所选择的第二查询序列相匹配的一个或多个图片和/或其链接写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2。又如,用户输入“范 冰冰”进行图片搜索,网络设备1获取到第一查询序列“范冰冰”。网络设备1根据“范冰冰” 所属的范畴“明星”在拆词库中进行匹配查询,查询到“明星”所对应的拆词有“剧照”、“写 真”、“生活照”等;然后,网络设备1再将上述拆词与第一查询序列“范冰冰”结合,得到第二 查询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”等。网络设备1根据所述第二查 询序列进行匹配搜索,获得与所述第二查询序列相匹配的一个或多个图片。网络设备1再 通过页面技术,如JSP、ASP、PHP技术,将与所述第二查询序列相匹配的一个或多个图片和/ 或其链接写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2。更优选地, 在网络设备1将拆词“剧照”、“写真”、“生活照”与第一查询序列“范冰冰”结合,得到第二 查询序列“范冰冰剧照”、“范冰冰写真”、“范冰冰生活照”等之后,网络设备1可以将所述第 二查询序列通过第一查询序列的输入框的下拉备选项、悬浮框等形式提供给用户设备2,供 用户选择。然后,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触 摸板、或手写设备,对所述含有拆词的一个或多个第二查询序列进行选择。网络设备1通过 以检测光标焦点、接收表单提交、接收访问请求等形式,获取该用户对第二查询序列进行的 用户选择。网络设备1再根据用户所选择的第二查询序列进行匹配搜索,获得与所述第二 查询序列相匹配的一个或多个图片。网络设备1通过页面技术,如JSP、ASP、PHP技术,将与 用户所选择的第二查询序列相匹配的一个或多个图片和/或其链接写入一个或多个网页, 并将这些网页和/或其链接提供给用户设备2。本领域技术人员应能理解上述根据拆词库 进行拆词处理的方式仅为举例,其他现有的或今后可能出现的根据拆词库进行拆词处理的 方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,在步骤S5(未示出)中,网络设备1还可以根据对大量用户所使用的图片 搜索关键词的统计分析,建立或更新所述拆词库。具体地,网络设备1根据一段时间内用 户所使用的图片搜索关键词的统计分析,如经统计分析得到“范冰冰”的图片搜索关键词有 “范冰冰写真”(占33% )、“范冰冰剧照”(占31% )、“范冰冰生活照”(占28% )、“范冰冰 其他”(占8% ),进而确定涉及“范冰冰”的第一查询序列可以对应第二查询序列“范冰冰 写真”、“范冰冰剧照”、“范冰冰生活照”等,更新该拆词库,如在该拆词库中相应地添加或修 改“范冰冰”所对应的拆词处理记录。在此,网络设备1既可以独立完成对大量用户所使用 的图片搜索关键词的统计分析,也可以接受来自其他产品或第三方设备对大量用户所使 用的图片搜索关键词的统计分析结果。例如,当网络设备1独立完成对大量用户所使用的 图片搜索关键词的统计分析时,网络设备1记录存储一段时间内用户所使用的图片搜索关 键词,然后对这些图片搜索关键词进行统计分析,例如得出对应同一个主题词的各种图片 搜索关键词所占百分比,取其中所占百分比较大的图片检索关键词作为该主题词对应的一 个或多个第二查询序列,再如取使用频次超过一定阈值的图片搜索关键词为对应主题词的 第二查询序列之一。例如,当第一个用户使用图片搜索关键词“范冰冰剧照”时,网络设备 1可以将其记录下来,并对所述图片搜索关键词“范冰冰剧照”的使用次数进行统计,当其 被使用的次数超过设定的阈值(例如1000次)时,将此图片搜索关键词作为拆词存入拆词 库。其后,当任一用户输入“范冰冰”进行图片搜索时,网络设备1可以将此图片搜索关键 词“范冰冰剧照”作为第二查询序列进行匹配搜索,或者提供给用户供其进行选择。再如,当 大量用户使用“某某明星剧照”的格式作为第一查询序列进行图片搜索时,网络设备1可以
17将其中的图片搜索关键词“剧照”作为拆词,存入拆词库,当任一用户再次输入包含“某某明 星”字样的第一查询序列进行图片搜索时,网络设备1可以将该拆词“剧照”与“某某明星” 结合作为第二查询序列进行匹配搜索,或者提供给用户供其进行选择。优选地,用户在搜索 图片的时候会输入第一查询序列,通过对其进行预处理或拆词处理可以得到搜索图片所用 到的图片搜索关键词。例如,当用户在图片搜索的输入框内输入第一查询序列“范冰冰图 片”,由于搜索引擎的搜索范围本身就是图片,因此,去除“图片”这一次要信息,得到所述第 一查询序列的图片搜索关键词是“范冰冰”。又如,当用户输入第一查询序列“范冰冰剧照” 时,“范冰冰剧照”即成为图片搜索关键词。对本领域技术人员应能理解上述更新拆词库的 方式仅为举例,其他现有的或今后可能出现的更新拆词库的方式如可适用于本发明,也应 包含在本发明保护范围以内,并在此以引用方式包含于此。更优选地,在步骤S5(未示出)中,网络设备1还可以根据对大量用户所使用的 图片搜索关键词及其所对应的图片选择的统计分析,建立或更新所述拆词库。具体地,网络 设备1还可以根据对于大量用户最终选择浏览的图片的统计分析,例如根据所选择浏览的 图片纠正对应的图片搜索关键词或者根据所选择浏览的图片导出相应的图片搜索关键词, 更新该拆词库,例如在该拆词库中相应地添加或修改一个或多个主题词所对应的拆词处理 记录。例如,当有用户利用“范冰冰”进行图片搜索时,根据该该用户所选择的图片中的标 签、文本信息或关键词等描述信息,该用户选择浏览的图片为“范冰冰”的“剧照”,则修正 该用户的图片检索关键词为“范冰冰剧照”;并按照前一实施例(因实施例基本相同,不再 赘述,并在此以引用的方式包含于此),根据对大量用户所使用的图片搜索关键词的统计分 析,更新该拆词库。又如,在提供给用户的有关“范冰冰”的图片中,通过对图片标签、文本 信息或关键词的提取,确定大量用户选择的是有关“范冰冰”的“剧照”的图片,网络设备1 可以将“范冰冰剧照”作为对应“范冰冰”的第二查询序列存入拆词库,以更新所述拆词库。 对本领域技术人员应能理解上述更新拆词库的方式仅为举例,其他现有的或今后可能出现 的更新拆词库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用 方式包含于此。在此,网络设备1既可以独立完成对大量用户所使用的图片搜索关键词及 其所对应的图片选择的统计分析,也可以接受来自其他产品或第三方设备对大量用户所使 用的图片搜索关键词及其所对应的图片选择的统计分析结果。例如,当网络设备1独立完 成对大量用户所使用的图片搜索关键词及其所对应的图片选择的统计分析时,网络设备1 记录存储一段时间内用户所使用的图片搜索关键词及其所对应的图片选择,然后对这些图 片搜索关键词及其所对应的图片选择进行统计分析,例如得出对应同一个主题词的各种图 片搜索关键词(包括经根据选择浏览的图片纠正后的图片搜索关键词、根据选择浏览的图 片导出的图片搜索关键词)所占百分比,取其中所占百分比较大的图片检索关键词作为该 主题词对应的一个或多个第二查询序列,再如取使用频次超过一定阈值的图片搜索关键 词(包括经根据选择浏览的图片纠正后的图片搜索关键词、根据选择浏览的图片导出的图 片搜索关键词)为对应主题词的第二查询序列之一。优选地,在步骤S3中,网络设备1还可以根据所述第二查询序列,并结合该用户的 用户相关信息,进行匹配搜索,以获得与所述第二查询序列和所述用户相关信息相匹配的 一个或多个图片。具体地,网络设备1根据经拆词处理得到的第二查询序列,或由用户所选 择的经拆词处理得到的第二查询序列时,结合网络设备1记录的或者该用户设定的用户相关信息,进行匹配搜索,以获得与所述第二查询序列和所述用户相关信息相匹配的一个或 多个图片。例如,若用户设定的偏好选项是汽车,则当第二查询序列为“美洲豹”时,网络设 备1根据第二查询序列“美洲豹”,并结合该用户的偏好选项“汽车”,进行匹配搜索,得到有 关“美洲豹汽车”的图片,网络设备1再将所述有关“美洲豹汽车”的图片提供给用户设备, 供用户进行选择浏览。又如,若用户设定的偏好选项是动物,则当第二查询序列为“美洲豹” 时,网络设备1根据第二查询序列“美洲豹”,并结合该用户的偏好选项“动物”,进行匹配搜 索,得到有关“美洲豹动物”的图片,网络设备1再将所述有关“美洲豹汽车”的图片提供给 用户设备,供用户进行选择浏览。优选地,在步骤S6(未示出)中,网络设备1还可以根据该用户的用户相关信息, 对所述一个或多个图片进行排序;此后,在步骤S4中,网络设备1还可以将排序后的所述 一个或多个图片提供给所述用户设备。具体地,在网络设备1根据第二查询序列进行匹配 搜索得到一个或多个图片之后,网络设备1根据用户相关信息,例如,根据提取的图片的标 签、文本信息或关键词与用户相关信息的匹配度,对所述一个或多个图片进行排序;网络设 备1再通过页面技术,如JSP、ASP、PHP技术,将排序后的所述一个或多个图片和/或其链 接写入一个或多个网页,并将这些网页和/或其链接提供给用户设备2。接上例,若用户设 定的偏好选项是汽车,则当第二查询序列为“美洲豹”时,网络设备1根据第二查询序列“美 洲豹”进行匹配搜索,得到有关“美洲豹”的图片;网络设备1根据用户设定的偏好选项, 即“汽车”,优先排列有关“美洲豹汽车”的图片;再将所述有关“美洲豹汽车”的图片提供给 用户设备,供用户进行选择浏览。又如,若用户设定的偏好选项是动物,则当第二查询序列 为“美洲豹”时,网络设备1根据第二查询序列“美洲豹”进行匹配搜索,得到有关“美洲豹” 的图片;网络设备1根据用户设定的偏好选项,即“汽车”,优先排列有关“美洲豹动物”的图 片;再按照此优先排列顺序将所述有关“美洲豹动物”的图片提供给用户设备,供用户进行 选择浏览。对本领域技术人员应能理解上述图片排序的方式仅为举例,其他现有的或今后 可能出现的图片排序的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此 以引用方式包含于此。更优选地,在步骤S6(未示出)中,网络设备1还可以根据该用户的用户相关信 息,对所述一个或多个第二查询序列进行排序;此后,在步骤S3中,网络设备1还可以将 排序后的所述一个或多个第二查询序列提供给所述用户设备,并获取该用户从所述一个或 多个第二查询序列中选择的第二查询序列,根据所述用户选择的第二查询序列进行匹配搜 索,以获得与所述第二查询序列相匹配的一个或多个图片。具体地,对于经拆词处理得到的 一个或多个第二查询序列,网络设备1可以根据该用户的相关信息,对所述一个或多个第 二查询序列进行排序;网络设备1再将排序后的所述一个或多个查询序列通过例如第一查 询序列的输入框的下拉备选项或悬浮框等形式提供给所述用户设备2 ;然后,网络设备1再 通过以检测光标焦点、接收表单提交、接收访问请求等形式,获取该用户从所述一个或多个 第二查询序列中选择的第二查询序列。优选地,该输入框的下拉备选项或者悬浮框还可以 根据页面大小自适应的调整,例如,对于屏幕受限的移动终端,下拉菜单或者悬浮框可以自 适应地变小,只显示位于排序后的所述第二查询序列的前列的部分第二查询序列。对本领 域技术人员应能理解上述第二查询序列排序的方式仅为举例,其他现有的或今后可能出现 的排序的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包
19含于此。优选地,所述用户相关信息包括但不限于以下至少一项a)所述用户的个人属 性;b)所述用户的输入历史记录;C)所述用户设定的偏好选项;d)所述用户设备的地址信 息。网络设备1可以根据用户的个人属性(例如用户的年龄、性别、职业、教育背景等)匹 配搜索用户可能感兴趣的图片,或推知用户可能感兴趣的第二查询序列或图片,将所述第 二查询序列或图片排在前列,供用户选择或浏览。例如,若网络设备1记录该用户为男性, 则当其输入“美洲豹”进行图片检索时,将有关“美洲豹汽车”的图片排在前列,显示给用户。 网络设备1还可以根据用户输入的历史记录,匹配搜索用户可能刚兴趣的图片,或推知用 户可能感兴趣的第二查询序列或图片,以将所述第二查询序列或图片排在前列,供用户选 择或浏览。例如,用户曾经输入“阿凡达”进行图片搜索,那么,当该用户再输入“电影”进行 图片搜索时,与“阿凡达”相关的图片会排在前列,显示给该用户。网络设备1还可以根据 用户设定的偏好选项(例如“电影”、“电视”、“剧照”、“写真”、“生活照”等),匹配搜索用户 可能感兴趣的图片,或推知用户可能感兴趣的第二查询序列或图片,以将所述第二查询序 列或图片排在前列,供用户选择或浏览。例如,若用户设定的偏好为电影剧照,则当用户输 入“范冰冰”时,第二查询序列中,“范冰冰剧照苹果”、“范冰冰剧照十月围城”等排在前列, 供用户选择,在返回的图片中,有关“范冰冰剧照苹果”、“范冰冰剧照十月围城”等图片排在 前列,供用户选择浏览;若用户的偏好为电视剧剧照,则当用户输入“范冰冰”时,第二查询 序列中,“范冰冰剧照还珠格格”、“范冰冰剧照胭脂雪”等排在前列,供用户选择,在返回的 图片中,有关“范冰冰剧照还珠格格”、“范冰冰剧照胭脂雪”等图片排在前列,供用户选择浏 览。网络设备1还可以根据用户设备的地址信息(例如用户设备的IP地址、GPS信息等), 匹配搜索用户可能感兴趣的图片,或推知用户可能感兴趣的第二查询序列或图片,以将所 述第二查询序列或图片排在前列,供用户选择或浏览。例如,网络设备1检测到用户设备 2的当前IP地址在上海,则对于获取的第一查询序列“南京路”,网络设备1可以进行拆词 处理,得到例如“南京路折扣店”、“南京路明星活动”等第二查询序列,网络设备1可以根据 上述第二查询序列进行搜索,或者网络设备1将上述第二查询序列排在前列,供用户选择, 网络设备1可以将上述相关的图片排在前列,提供给用户设备2,供用户浏览选择。又如,当 网络设备1检测到用户设备2的当前IP地址不在上海时,可以推知其想了解上海南京路的 旅游信息,网络设备1可以进行拆词处理,得到例如“南京路地图”、“南京路特色小吃”等第 二查询序列,再根据上述第二查询序列进行搜索,或者网络设备1将上述第二查询序列排 在前列,供用户选择,网络设备1可以将上述相关的图片排在前列,提供给用户设备,供用 户浏览选择。对本领域技术人员应能理解上述用户相关信息仅为举例,其他现有的或今后 可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以 引用方式包含于此。优选地,在步骤S7 (未示出)中,网络设备1还可以根据所述第二查询序列和/或 该用户对所述一个或多个图片所做的选择,更新所述用户相关信息。例如,网络设备1可以 根据用户所选择第二查询序列,更新该用户的输入历史记录等用户相关信息。例如,当用户 在“范冰冰”对应的第二查询序列或图片中,选择了 “范冰冰写真”或属于“范冰冰写真”的 图片,那么,网络设备1则相应地更新用相关信息,如增加“范冰冰写真”等输入历史记录。优选地,在步骤S2中,网络设备1还可以对所述第一查询序列进行预处理;将预处
20理后的所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列。具体地,在用户 输入的第一查询序列中可能会包含一些次要信息,如“的”、“图片”等,或者所述第一查询序 列是一个长句,因此,网络设备1需要对这些第一查询序列进行预处理,以方便对此进行拆 词处理。然后,网络设备1根据预处理后的第一查询序列,通过匹配查询,例如通过在主题 词拆分表或拆词库中进行查询匹配等方式,对所述第一查询序列进行拆词处理,以获得一 个或多个第二查询序列。更优选地,所述预处理包括以下至少一项a)同义词替换;b)分类处理;C)分词 处理。例如,当用户输入第一查询序列“小S”时,网络设备1可以对此进行预处理,将“小 S”同义词替换为“徐熙娣”,以进一步对此进行拆词处理。又如,用户输入的第一查询序列 “范冰冰”属于“演员”,而“演员图片”可以拆分为“演员剧照”、“演员写真”、“演员生活照” 等,先对此进行分类处理再进一步拆词处理,即根据第一查询序列“范冰冰”得到其对应的 第二查询序列“范冰冰写真”、“范冰冰剧照”和“范冰冰生活照”等。再如,在用户输入的第 一查询序列中可能会包含一些次要信息(例如“的”),可以对该第一查询序列进行分词处 理,例如先将这些次要信息去除,或者将长句进行断句,去除重复词汇,再从中提取主题词, 以进一步对此进行拆词处理。对本领域技术人员应能理解上述对第一查询序列进行预处理 的方式仅为举例,其他现有的或今后可能出现的预处理的方式如可适用于本发明,也应包 含在本发明保护范围以内,并在此以引用方式包含于此。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在 不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论 从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此 外,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多 个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来 表示名称,而并不表示任何特定的顺序。
权利要求
一种基于拆词处理进行图片搜索的方法,该方法包括以下步骤a获取用户在用户设备中进行图片搜索时输入的第一查询序列;b对所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列;c根据所述第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹配的一个或多个图片;d将所述一个或多个图片提供给所述用户设备。
2.根据权利要求1所述的方法,其中,所述步骤c还包括 -将所述一个或多个第二查询序列提供给所述用户设备;-获取该用户从所述一个或多个第二查询序列中选择的第二查询序列; -根据所述用户选择的第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹 配的一个或多个图片。
3.根据权利要求1或2所述的方法,其中,所述步骤b还包括-根据拆词库,对所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列。
4.根据权利要求3所述的方法,其中,该方法还包括e根据对大量用户所使用的图片搜索关键词的统计分析,建立或更新所述拆词库。
5.根据权利要求4所述的方法,其中,所述步骤e还包括_根据对大量用户所使用的图片搜索关键词及其所对应的图片选择的统计分析,建立 或更新所述拆词库。
6.根据权利要求1至5中任一项所述的方法,其中,所述步骤c还包括-根据所述第二查询序列,并结合该用户的用户相关信息,进行匹配搜索,以获得与所 述第二查询序列和所述用户相关信息相匹配的一个或多个图片。
7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括 f根据该用户的用户相关信息,对所述一个或多个图片进行排序; 其中,所述步骤d还包括-将排序后的所述一个或多个图片提供给所述用户设备。
8.根据权利要求7所述的方法,其中,所述步骤f还包括-根据该用户的用户相关信息,对所述一个或多个第二查询序列进行排序; 其中,所述步骤c还包括-将排序后的所述一个或多个第二查询序列提供给所述用户设备; -获取该用户从排序后的所述一个或多个第二查询序列中选择的第二查询序列; -根据所述用户选择的第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹 配的一个或多个图片。
9.根据权利要求6至8中任一项所述的方法,其中,所述用户相关信息包括以下至少一项-所述用户的个人属性; _所述用户的输入历史记录; _所述用户设定的偏好选项; _所述用户设备的地址信息。
10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括g根据所述第二查询序列和/或该用户对所述一个或多个图片所做的选择,更新所述 用户相关信息。
11.根据权利要求1至10中任一项所述的方法,其中,所述步骤b还包括 -对所述第一查询序列进行预处理;-将预处理后的所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列。
12.根据权利要求11所述的方法,其中,所述预处理包括以下至少一项 -同义词替换;-分类处理; -分词处理。
13.一种基于拆词处理进行图片搜索的设备,该设备包括获取装置,用于获取用户在用户设备中进行图片搜索时输入的第一查询序列; 拆词装置,用于对所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列;搜索装置,用于根据所述第二查询序列进行匹配搜索,以获得与所述第二查询序列相 匹配的一个或多个图片;提供装置,用于将所述一个或多个图片提供给所述用户设备。
14.根据权利要求13所述的设备,其中,该搜索装置还包括 交互装置,用于-将所述一个或多个第二查询序列提供给所述用户设备; -获取该用户从所述一个或多个第二查询序列中选择的第二查询序列; 其中,所述搜索装置还用于-根据所述用户选择的第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹 配的一个或多个图片。
15.根据权利要求13或14所述的设备,其中,所述拆词装置还用于-根据拆词库,对所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列。
16.根据权利要求15所述的设备,其中,该设备还包括第一更新装置,用于根据对大量用户所使用的图片搜索关键词的统计分析,建立或更 新所述拆词库。
17.根据权利要求16所述的方法,其中,所述第一更新装置还用于_根据对大量用户所使用的图片搜索关键词及其所对应的图片选择的统计分析,建立 或更新所述拆词库。
18.根据权利要求13至17中任一项所述的设备,其中,所述搜索装置还用于-根据所述第二查询序列,并结合该用户的用户相关信息,进行匹配搜索,以获得与所 述第二查询序列和所述用户相关信息相匹配的一个或多个图片。
19.根据权利要求13至18中任一项所述的设备,其中,该设备还包括排序装置,用于根据该用户的用户相关信息,对所述一个或多个图片进行排序; 其中,所述提供装置还用于-将排序后的所述一个或多个图片提供给所述用户设备。
20.根据权利要求19所述的设备,其中,所述排序装置还用于“根据该用户的用户相关信息,对所述一个或多个第二查询序列进行排序; 其中,所述搜索装置还用于“将排序后的所述一个或多个第二查询序列提供给所述用户设备; “获取该用户从排序后的所述一个或多个第二查询序列中选择的第二查询序列; “根据所述用户选择的第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹 配的一个或多个图片。
21.根据权利要求18或20所述的设备,其中,所述用户相关信息包括以下至少一项 -所述用户的个人属性;_所述用户的输入历史记录; _所述用户设定的偏好选项; _所述用户设备的地址信息。
22.根据权利要求13至21中任一项所述的设备,其中,该设备还包括第二更新装置,用于根据所述第二查询序列和/或该用户对所述一个或多个图片所做 的选择,更新所述用户相关信息。
23.根据权利要求13至22中任一项所述的设备,其中,所述拆词装置还用于 -对所述第一查询序列进行预处理;-将预处理后的所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列。
24.根据权利要求23所述的设备,其中,所述预处理包括以下至少一项 -同义词替换;-分类处理; -分词处理。
25.根据权利要求13至24中任一项所述的设备,其中,所述设备包括网络主机、单个网 络服务器、多个网络服务器集或基于云计算的计算机集合。
全文摘要
本发明的目的是提供一种基于拆词处理进行图片搜索的方法与设备,其中,网络设备获取用户在用户设备中进行图片搜索时输入的第一查询序列;对所述第一查询序列进行拆词处理,以获得一个或多个第二查询序列;根据所述第二查询序列进行匹配搜索,以获得与所述第二查询序列相匹配的一个或多个图片;将所述一个或多个图片提供给所述用户设备。与现有技术相比,本发明通过对第一查询序列进行拆词处理获得第二查询序列,根据第二查询序列进行图片搜索,并将搜得的图片提供给用户,提高了图片搜索的效率,使得用户可以通过图片搜索快捷、准确地获取其所希望的图片,从而提升了用户的满意度与体验度。
文档编号G06F17/30GK101984420SQ201010271798
公开日2011年3月9日 申请日期2010年9月3日 优先权日2010年9月3日
发明者吕文先, 常齐, 王梓旋, 聂昆, 郭昶, 高静霞, 魏星 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1