分步搜索法的制作方法

文档序号:6330574阅读:351来源:国知局

专利名称::分步搜索法的制作方法
技术领域
:本技术涉及搜索引擎技术。二
背景技术
:现有搜索技术存在一些缺陷。例如用户在某网上商城输入"手机耳机",在现有技术下,只要商品名称里面包含了"手机"或者"耳机"这两个关键词,就会被列在搜索结果里面(详见http:〃search.360buy.com/Search7keyword=手机耳机)。这个搜索处理方法存在两个问题第一,这其中的很多搜索结果都不是用户需要的,例如手机架、耳机架、手机、普通耳机等等,因为这位用户实际上要找的商品是"手机耳机"。这无疑增加了用户查找商品的难度和时间。第二,搜索结果只是列出9件符合用户需要的"手机耳机",实际上,在这个商城里面共有27件符合条件的商品。也就是说,还有18件商品是用户希望找的,但是没有被搜索出来。(详见http:〃www.360buy.com/products/652-830-862-0-0-0-0-0-0-0-l-l-l.html)另外搜索"笔记本电池""摩托罗拉手机"等等时也会遇到同样的问题。在国内几乎所有b2c网站上面,都和京东商城相似,除了淘宝网。与京东商城比较,在淘宝网的搜索结果要好一些,因为淘宝网上面的商品数量庞大,并且卖家针对搜索关键词做了搜索优化的原因,使得这两个问题不是很明显。但是,在淘宝网上搜索"ibm笔记本""摩托罗拉手机"等部分关键词的时候也会遇到同样的问题。分步搜索法可以解决以上问题,并且使得"一句话搜索"成为可能。三
发明内容分步搜索法,分为3步抽取关键词、判断类别、在结果类别中搜索。第一步是根据词库抽取关键词。关键词主要被分为两类类别关键词和筛选关键词。第二步是判断类别,它主要是根据抽取到的关键词,给关键词所对应的类别赋值,并找出得分最高的类别。第三步是根据筛选关键词在第二步中找到的类别中搜索符合需要的信息。四具体实施例方式下面以搜索关键词"诺基亚立体声手机耳机"为例,来说明分步搜索法的原理及功能。首先第一步,是在"诺基亚立体声手机耳机"中,根据关键词词库抽取关键词诺基亚、立体声、手机、耳机、手机耳机。3相关的关键词词库如下表<table>tableseeoriginaldocumentpage4</column></row><table>第二步,分析判断用户所要找的类别,分析过程如下对抽取到的5个关键词,逐个地进行分析诺基亚给"手机"类别加2分;给"手机耳机"类别加2分;立体声给"手机"类别加0分;给"手机耳机"类别加2分;手机给"手机"类别加5分;给"手机耳机"类别加2分;耳机给"手机"类别加0分;给"手机耳机"类别加2分;手机耳机给"手机"类别加0分;给"手机耳机"类别加5分;求和后,"手机"类别总得分为2+5=7分;"手机耳机"类别得分为2+2+2+5=13分"手机耳机"的得分远比"手机"高,所以系统判断出这位用户要找的商品类别是"手机耳机"。(在其他例子中,得分最高的类别如果比得分第二多的类别高出2分以上,那么就可以判断这个得分最高的是用户所要找的类别;如果最高分类别只比第二名高出1分,则同时显示最高分类别和第二高分类别,让用户选择。)第三步,在手机耳机类别下的所有商品的商品属性描述中,搜索筛选关键词"诺基亚"和"立体声"。商品属性中同时包含"诺基亚"和"立体声"的商品排在最前面;只包含其中一个关键词的排序次之。这样,所有符合条件的商品就都可以被快速地找到,并且用户不想要的东西也不会出现在搜索结果里了。同时,用户用一句话来搜索他要找的东西的时候,就可以方便地找到,例如"老人用的诺基亚手机"。另外,除了商品检索之外,分步搜索法也可以应用到其他领域,例如用来识别用户是搜索"商品"、"图片"、"网页"、"音乐"、"招聘"、"机票"还是"新闻"等等。权利要求一种识别用户意图的分步搜索法,其特征是包含以下步骤(a)建立关键词词库。(b)对用户提交的关键词或者短语进行分析,并且根据步骤(a)中所述关键词词库,提取其中和步骤(a)中所述关键词词库中的关键词完全匹配的关键词。(c)对步骤(b)提取的关键词进行分析,根据关键词对应的信息类别和相应的赋值的累计值的高低,来判断用户要找的信息类别。(d)在步骤(c)中识别出的信息类别中进一步搜索。2.如权利要求书1所述的一种识别用户意图的分步搜索法,其特征在于所述关键词词库中的每一个关键词都对应一个或者多个信息类别,同时每一个对应都存在一个赋值。3.如权利要求书1所述的一种识别用户意图的分步搜索法,其特征在于所述关键词词库中的所有关键词分为类别关键词和筛选关键词;类别关键词只被用来识别判断信息类别,筛选关键词不仅被用来判断信息类别,同时也被用来在识别出的信息类别中进一步检索。4.如权利要求书1所述的一种识别用户意图的分步搜索法,其特征在于所述关键词对应的信息类别和相应的赋值的累计值是指,如果在步骤(b)中提取的某一个关键词A对应某一信息类别B,那么就给予信息类别B相应的赋值;如果多个关键词对应信息类别B,那么信息类别B的累计值就是这多个关键词对应信息类别B的赋值的总和。5.如权利要求书1所述的一种识别用户意图的分步搜索法,其特征在于累计值最高的信息类别是用户最可能要找的信息类别。全文摘要本发明涉及一种智能分类的搜索方法,主要可以应用于电子商务网站的商品自动智能分类,或者应用于电子商务网站的广告智能匹配。本发明首先建立一个词库,词库中的每一个关键词对应一个类别,并且每个对应都有一个相应的赋值。然后,对于用户输入的关键词,用词库中的关键词去匹配用户的输入关键词,如果用户的输入中包含某一个已经存在于词库中的关键词,那么就给这个关键词对应的类别赋值,最后,赋值得分最高的类别即为用户最有可能要找的类别。文档编号G06F17/30GK101770498SQ20091000343公开日2010年7月7日申请日期2009年1月5日优先权日2009年1月5日发明者李铭申请人:李铭
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1