一种针对工业产品搜索的筛选式搜索方法

文档序号:9217233阅读:657来源:国知局
一种针对工业产品搜索的筛选式搜索方法
【技术领域】
[0001]本发明属于搜索领域,尤其是工业产品的搜索,具体涉及一种针对工业产品搜索的筛选式搜索方法。
【背景技术】
[0002]B2B是指企业对企业之间的营销关系,将企业内部网通过B2B网站与客户紧密结合起来,通过网络的快速反应,为客户提供更好的服务,从而促进企业的业务发展。
[0003]在B2B领域中,一项核心技术为“基于互联网的工业产品搜索功能”,该功能为企业之间的产品贸易提供枢纽和入口。产品需求方为购买所需的工业产品,首先该企业需要在B2B互联网平台上,通过工业产品的搜索功能在互联网上搜索到其所需的工业产品,以获得其所需要的产品信息(供给方、价格、物流等等)。然后,在线下单订购,并开展后期的线下贸易行为。
[0004]然而,工业产品的搜索技术现在面临一个问题,即:有时搜索引擎的搜索结果无法搜索到准确的结果,也称搜索准确性问题。具体的说,在现有技术中,搜索结果一般大致反映了搜索者的搜索意图,但往往出现“相关但不够准”的现象,搜索结果无法真正反映用户搜索意图。
[0005]例如,若用户希望购买“SKF”品牌的汽车轴承,其在搜索引擎内搜索“SKF汽车轴承”,搜索引擎可能返回的结果有“SKF汽车轴承”、“SKF轴承”、“SKF汽车”、“哈尔滨牌汽车轴承”等。而在这些返回结果中,“SKF汽车”与用户的搜索意图完全不相关,“哈尔滨牌汽车轴承”与用户的搜索意图也无法完全吻合,因为工业产品贸易中,在指定了搜索SKF品牌的前提下,返回其他品牌的汽车轴承对用户并没有直接意义。工业产品搜索引擎的准确性问题,降低了工业产品搜索技术的实用性,为B2B业务的开展带来了不便。
[0006]现有的相关搜索技术一般为基于文本匹配的搜索技术,比如基于SQL数据查找的搜索技术、基于倒排表查找的搜索技术等。业务流程一般为:1.用户输入其所搜索的词条;2.工业产品搜索引擎将词条进行分词,将其切分为多个独立的词语;3.通过倒排表分别查找包含各个独立词语的工业产品;4.将所有结果进行整合、排序,并返回给用户。其中,第4步往往通过机器学习技术对搜索结果进行相关度分析,并根据搜索结果与搜索词条的相关程度对搜索结果进行排序,进而将相关结果在排序靠前的位置返回给用户。
[0007]例如,对于用户搜索“SKF汽车轴承”的例子,搜索引擎将进行如下操作:分词:将“SKF汽车轴承”进行分词,得到3个独立的词语,即SKF、汽车、轴承;查找:搜索引擎在数据库中,分别查找包含SKF、汽车、轴承三个词语的结果(至少包含三个词语之一的结果);呈现:搜索引擎对所有查找得到的结果进行排序,并将排序结果呈现给用户。
[0008]现有方法的不足在于:搜索结果中包含用户意图不相关的结果,增加了用户查找目标结果的工作量。其原因在于,简单的文本匹配和搜索无法将搜索到文本相关度高的搜索结果,即包含了搜索词条或包含了搜索词条某部分的搜索结果。而在工业产品搜索领域,包含了搜索词条文本的搜索结果未必是相关结果。
[0009]虽然,传统技术通过机器学习方法对搜索结果进行了基于相关度的排序,然而机器学习方法基于统计方法,存在一定的不稳定性,排序结果不可控,往往造成相关结果和不相关结果混合在一起的情况。

【发明内容】

[0010]为解决上述技术问题,本发明提供了一种稳定的、排序结果可控的、先惯性高的针对工业产品搜索的筛选式搜索方法。
[0011]为达到上述目的,本发明的技术方案如下:
[0012]一种针对工业产品搜索的筛选式搜索方法,其特征在于,包括以下几步:
[0013]第一步:在线下构建品牌名称列表和产品名称列表;
[0014]第二步:在线上利用品牌名称列表和产品名称列表进行筛选式搜索,包括第一层的产品名称筛选和第二层的品牌名称筛选,
[0015]其中,第一层筛选通过产品名称列表对搜索词条进行最长匹配,获取搜索词条中所包含的产品名称列表中的最长词语;
[0016]第二层筛选通过品牌名称筛选对搜索词条进行最长匹配,获取搜索词条中所包含的品牌名称筛选的最长词语;
[0017]第三步:对于搜索结果按照匹配率进行降序排序,然后呈现给搜索用户。
[0018]在本发明的一个较佳实施例中,进一步包括,所述品牌名称列表包含商品的商标名称和商品的供应厂家名称,所述产品名称列表包含工业产品的产品名词。
[0019]在本发明的一个较佳实施例中,进一步包括,构建所述品牌名称列表的方法包括以下几种:
[0020]在工业产品搜索平台中,数据库中保存了搜索工业产品供应商的信息,通过数据库中的企业名称字段和品牌名称字段,获得大量供应厂家名称和品牌名称;
[0021]对现有的互联网平台页面进行爬取,爬取的HTML内容中包含了品牌名称和供应厂家名称,通过解析HTML获得品牌名称和供应厂家名称;
[0022]通过业务人员的工作经验来总结品牌名称和供应厂家名称;
[0023]对获得的品牌名称和供应厂家名称总结列表,为品牌名称列表。
[0024]在本发明的一个较佳实施例中,进一步包括,构建产品名称列表的方法包括以下:
[0025]在工业产品搜索平台的数据库中设置产品名称字段,工业产品信息的发布者填写所述字段,通过数据库中的产品名称字段获得产品名称;
[0026]人工录入广品名称进入广品名称列表。
[0027]在本发明的一个较佳实施例中,进一步包括,第二步中在第一次筛选时,获取搜索词条中包含的产品名称列表中的最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
[0028]在本发明的一个较佳实施例中,进一步包括,第二步中在第二次筛选时,获取搜索词条中所包含的品牌名称列表中最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
[0029]本发明的有益效果是:
[0030]本发明涉及的搜索方法,首先通过线下挖掘数据,锁定了搜索词中的关键词,并且通过线上两层过滤的方法,过滤掉与用户工业产品搜索意图不相符的内容,筛选出相关的内容,提高了工业产品搜索的相关性,得到相关度高的搜索结果。
【具体实施方式】
[0031]下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0032]本实施例中公开了一种针对工业产品搜索的筛选式搜索方法,其采用线下挖掘数据,线上搜索过滤的方式进行搜索,包括以下几步:
[0033]第一步:在线下构建品牌名称列表和产品名称列表,所述品牌名称列表包含商品的商标名称和商品的供应厂家名称。
[0034]第二步:在线上利用品牌名称列表和产品名称列表进行筛选式搜索,包括第一层的产品名称筛选和第二层的品牌名称筛选,所述产品名称列表包含工业产品的产品名词。
[0035]其中,第一层筛选通过产品名称列表对搜索词条进行最长匹配,获取搜索词条中所包含的产品名称列表中的最长词语;获取搜索词条中包含的产品名称列表中的最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
[0036]第二层筛选通过品牌名称筛选对搜索词条进行最长匹配,获取搜索词条中所包含的品牌名称筛选的最长词语;获取搜索词条中所包含的品牌名称列表中最长词语,
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1