查询条件相似度确定方法、对象查询方法及相关装置制造方法

文档序号:6490313阅读:194来源:国知局
查询条件相似度确定方法、对象查询方法及相关装置制造方法
【专利摘要】本申请公开了一种查询条件相似度确定方法、对象查询方法及相关装置,包括:获取查询点击日志,查询点击日志中包括各查询条件及对应点击的对象;并针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;并根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;以及针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定第一查询条件与第二查询条件之间的相似度。采用本申请实施例提供的方案,提高了确定不同查询条件之间的相似度的准确性。
【专利说明】查询条件相似度确定方法、对象查询方法及相关装置
【技术领域】
[0001]本申请涉及互联网【技术领域】和计算机【技术领域】,尤其涉及一种查询条件相似度确定方法、对象查询方法及相关装置。
【背景技术】
[0002]在现有的互联网技术中,网站上一般会发布一些对象的信息,供登录该网站的用户浏览,以及进一步的针对特定对象的后续处理操作。例如,以电子商务网站为例,对象具体可以是卖家用户发布的产品,对象的信息具体可以是产品的描述信息,产品的属性信息,以及产品的购买信息等,登录电子商务网站的用户可以通过浏览发布产品的各种信息,了解该产品的详细情况,并可以进一步的执行收藏、购买或推荐给其他用户等处理操作;以社区网站为例,对象具体可以是社区用户发布的帖子,对象的信息具体可以是帖子的描述信息,帖子的内容信息等,登录社区网站的浏览用户可以通过浏览发布的帖子的各种信息,了解该帖子的详细情况,并可以进一步的执行收藏、回帖或推荐给其他用户等处理操作。
[0003]目前,网站可以按照其设定方式在页面上向用户展现对象,如按照不同类目进行展现等,并且可以向用户提供对象查询的功能,即当接收到用户输入的查询条件后,从提供的对象全集中查询出满足该查询条件的对象,并将查询结果展现给用户,以供用户进一步的对查询结果包括的对象进行点击、浏览等操作,其中,查询条件可以是查询关键词。
[0004]然而,在上述对象查询的过程中,经常由于不同用户的语言习惯,可能出现用户输入的查询条件所表达的查询意图不明确,从而导致所查询出的满足该查询条件的对象不准确、不全面。
[0005]为了解决上述问题,现有技术提出了基于各查询条件之间的相似度,确定查询条件的相似查询条件,并根据确定的相似查询条件进行对象查询的方案,即确定出与输入的查询条件相似的查询条件,并按照该相似的查询条件进行对象查询,将查询得到的对象作为本次查询结果的一部分,从而相比仅按照输入的查询条件进行对象查询,提高了查询结果的准确性和全面性。
[0006]目前,在确定查询条件之间的相似度时,是根据各查询条件的文本内容是否相似进行确定,例如,从各查询条件的文本内容中提取中心词,并根据各查询条件的中心词之间的是否相同和近义,确定不同查询条件之间的相似度,将相似度满足预设条件的查询条件,作为相似查询条件。
[0007]然而,基于查询条件的文本内容确定查询条件相似度的方案,仅能确定出有限的相似查询条件,而无法保证基于确定出的相似查询条件查询出的对象是用户希望得到的,并且,可能由于中心词提取的误差,以及对于词义理解的误差,导致确定的相似查询条件与输入的查询条件之间的相似度实质并不高,从而导致最终查询得到的对象仍然不准确和不全面。

【发明内容】
[0008]有鉴于此,本申请实施例提供一种查询条件相似度确定方法、对象查询方法及相关装置,用于解决现有技术中对于不同查询条件之间的相似度确定不准确的问题。
[0009]本申请实施例通过如下技术方案实现:
[0010]本申请实施例提供了一种查询条件相似度确定方法,包括:
[0011]获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对象;
[0012]针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;
[0013]根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;
[0014]针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度。
[0015]本申请实施例还提供了一种对象查询方法,包括:
[0016]获得输入的当前查询条件;
[0017]获取预先确定的与所述当前查询条件的相似度达到相似度阈值的相似查询条件;
[0018]在对象全集中查询满足所述当前查询条件的对象,以及满足获取的所述相似查询条件的对象;
[0019]其中,采用如下方式确定与所述当前查询条件的相似度达到相似度阈值的相似查询条件:
[0020]获取查询点击日志,所述查询点击日志中包括所述当前查询条件和其它各查询条件及对应点击的对象;
[0021]针对所述当前查询条件和其它各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;
[0022]根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;
[0023]针对其它各查询条件中与所述当前查询条件满足预设条件的每个待确定查询条件,根据所述当前查询条件的点击向量和该待确定查询条件的点击向量,确定所述当前查询条件与该待确定查询条件之间的相似度;
[0024]从各待确定查询条件中,确定与所述当前查询条件的相似度达到相似度阈值的查询条件,作为所述当前查询条件的相似查询条件。
[0025]本申请实施例还提供了一种查询条件相似度确定装置,包括:
[0026]日志获取单元,用于获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对象;
[0027]次数确定单元,用于针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;
[0028]向量确定单元,用于根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;
[0029]相似度确定单元,用于针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度。
[0030]本申请实施例还提供了一种对象查询装置,包括:
[0031]输入单元,用于获得输入的当前查询条件;
[0032]条件获取单元,用于获取预先确定的与所述当前查询条件的相似度达到相似度阈值的相似查询条件;
[0033]查询单元,用于在对象全集中查询满足所述当前查询条件的对象,以及满足获取的所述相似查询条件的对象;
[0034]相似度确定单元,用于采用如下方式确定与所述当前查询条件的相似度达到相似度阈值的相似查询条件:
[0035]获取查询点击日志,所述查询点击日志中包括所述当前查询条件和其它各查询条件及对应点击的对象;并针对所述当前查询条件和其它各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;并根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;并针对其它各查询条件中与所述当前查询条件满足预设条件的每个待确定查询条件,根据所述当前查询条件的点击向量和该待确定查询条件的点击向量,确定所述当前查询条件与该待确定查询条件之间的相似度;以及从各待确定查询条件中,确定与所述当前查询条件的相似度达到相似度阈值的查询条件,作为所述当前查询条件的相似查询条件。
[0036]本申请实施例提供的上述至少一个技术方案中,在确定查询条件之间的相似度时,首先获取包括各查询条件及对应点击的对象的查询点击日志,并针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数,然后根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征了对象在该查询条件下被点击的情况,然后针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定第一查询条件与第二查询条件之间的相似度。由于在上述方案中参考了基于每个查询条件进行查询时对查询得到的对象进行点击的次数信息,且该次数信息能够表征使用查询条件进行查询时所希望得到的对象,所以基于该次数信息确定两个查询条件之间的相似度,能够更准确的反应两个查询条件之间在针对用户希望得到的对象这一方面的实际相似程度,即提高了确定不同查询条件之间的相似度的准确性。
[0037]本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
【专利附图】

【附图说明】
[0038]附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中:
[0039]图1为本申请实施例提供的查询条件相似度确定方法的流程图;
[0040]图2为本申请实施例中各查询条件和各对象以及点击次数的示意图;[0041]图3为本申请实施例中根据点击向量确定第一查询条件与第二查询条件的相似度的处理流程图;
[0042]图4为本申请实施例提供的对象查询方法的流程图;
[0043]图5为本申请实施例提供的查询条件相似度确定装置的结构示意图;
[0044]图6为本申请实施例提供的对象查询装置的结构示意图。
【具体实施方式】
[0045]为了给出提高不同查询条件之间的相似度确定的准确性的实现方案,本申请实施例提供了一种查询条件相似度确定方法、对象查询方法及相关装置,该技术方案可以应用于使用查询条件进行对象查询的过程,既可以实现为一种方法,也可以实现为一种装置。以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0046]本申请实施例提供一种查询条件相似度确定方法,如图1所示,包括:
[0047]步骤101、获取查询点击日志,查询点击日志中包括各查询条件及对应点击的对象。
[0048]步骤102、针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数。
[0049]步骤103、根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况。
[0050]步骤104、针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定第一查询条件与第二查询条件之间的相似度。
[0051]目前,针对用户对网站页面上发布的对象的点击、浏览和处理操作,会记录相应的访问日志,其中一种访问日志为查询点击日志,查询点击日志中包括用户进行对象查询所使用查询条件,以及与该查询条件对应的针对展现的对象进行点击的记录,即记录使用一个查询条件进行对象查询后点击的对象。
[0052]由于查询点击日志中包括了各查询条件及对应点击的对象,所以上述步骤102中可以针对每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数,具体可以是获取针对设定时间段内的查询点击行为统计的查询点击日志,并基于获取的查询点击日志,确定每个查询条件对应点击的每个对象在该查询条件下被点击的次数。
[0053]在确定次数后,即可以通过上述步骤103,根据确定的次数,确定每个查询条件的点击向量,具体可以采用如下两种方式:
[0054]第一种方式:针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应点击的对象,为描述方便,后续将对应点击的对象称作第一对象;
[0055]确定分量的分量值为该分量对应第一对象在该查询条件下被点击的次数。
[0056]采用该第一种方式,能够快速的确定每个查询条件的点击向量,从而进入后续查询条件相似度的确定步骤。
[0057]然而,采用该第一种方式,可能会由于所获取的查询点击日志中的信息量有限,导致实际中使用一个查询条件对应点击的对象,在获取的查询点击日志中没有记录,从而使得该信息无法用于后续查询条件相似度的确定,为解决这一问题,本申请实施例中还提出如下优选的第二种方式:
[0058]第二种方式:针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应点击的第一对象,以及对应点击第一对象的其它查询条件对应点击的对象中,除第一对象之外的对象,为描述方便,后续将该除第一对象之外的对象,称作第二对象;
[0059]也就是说,当该查询条件对应点击的一个第一对象,也是另一个查询条件对应点击的一个对象,并且另一个查询条件对应点击的对象中,还包括在该查询条件对应点击的第一对象中不存在的对象,则该对象即作为该查询条件对应的第二对象;
[0060]例如,如图2所示的实例,其中,查询条件包括Q1、Q2、Q3和Q4,对象包括AD1、AD2、AD3 和 AD4 ;
[0061]Ql对应点击的对象为AD3 ;
[0062]Q2对应点击的对象为AD2和AD3 ;
[0063]Q3对应点击的对象为AD1、AD2和AD4 ;
[0064]Q4对应点击的对象为ADl和AD2。
[0065]则Ql对应点击的第一对象为AD3,且AD3为Q2对应点击的第一对象,Q2对应点击的第一对象还包括AD2,则AD2为Ql对应的第二对象;相应的,Q2对应点击的第一对象为AD2和AD3,Q2对应的第二对象为ADl和AD4 ;Q3对应点击的第一对象为ADl、AD2和AD4,Q3对应的第二对象为AD3 ;Q4对应点击的第一对象为ADl和AD2,Q4对应的第二对象为AD3和 AD4。
`[0066]在确定出查询条件对应点击的第一对象和对应的第二对象之后,针对每个第一对象,确定该第一对象对应分量的分量值为该第一对象在该查询条件下被点击的次数,针对每个第二对象,采用如下公式确定该第二对象对应分量的分量值:
【权利要求】
1.一种查询条件相似度确定方法,其特征在于,包括: 获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对象; 针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数; 根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况; 针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度。
2.如权利要求1所述的方法,其特征在于,根据确定的次数,确定每个查询条件的点击向量,具体包括: 针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应点击的第一对象; 确定分量的分量值为该分量对应第一对象在该查询条件下被点击的次数。
3.如权利要求1所述的方法,其特征在于,根据确定的次数,确定每个查询条件的点击向量,具体包括: 针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应点击的第一对象,以及对应点击所述第一对象的其它查询条件对应点击的对象中,除所述第一对象之外的第二对象; 确定第一对象对应分量的分量值为该第一对象在该查询条件下被点击的次数; 采用如下公式确定第二对象对应分量的分量值:
4.如权利要求1所述的方法,其特征在于,采用如下方式确定满足预设条件的两个查询条件: 当两个查询条件各自对应点击的对象中存在至少一个相同对象时,确定该两个查询条件满足预设条件。
5.如权利要求1所述的方法,其特征在于,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度,具体包括: 当第一查询条件的点击向量的分量与第二查询条件的点击向量的分量相同时,米用预设相似度算法确定所述第一查询条件的点击向量与所述第二查询条件的点击向量之间的相似度,并将结果作为所述第一查询条件与所述第二查询条件之间的相似度; 当第一查询条件的点击向量的分量与第二查询条件的点击向量的分量存在不同时,确定所述第一查询条件的转换向量的分量和所述第二查询条件的转换向量的分量,其中,所述第一查询条件的转换向量的分量,包括所述第一查询条件的点击向量的分量,以及在所述第二查询条件的点击向量的分量中存在且在所述第一查询条件的点击向量的分量中不存在的分量,所述第一查询条件的转换向量的分量与所述第二查询条件的转换向量的分量相同; 针对所述第一查询条件的转换向量的每个分量,当该分量在所述第一查询条件的点击向量中存在时,所述第一查询条件的转换向量的该分量的分量值为所述第一查询条件的点击向量的该分量的分量值,否则,为O ; 针对所述第二查询条件的转换向量的每个分量,当该分量在所述第二查询条件的点击向量中存在时,所述第二查询条件的转换向量的该分量的分量值为所述第二查询条件的点击向量的该分量的分量值,否则,为O ; 采用预设相似度算法确定所述第一查询条件的转换向量与所述第二查询条件的转换向量之间的相似度,并将结果作为所述第一查询条件与所述第二查询条件之间的相似度。
6.一种对象查询方法,其特征在于,包括: 获得输入的当前查询条件;` 获取预先确定的与所述当前查询条件的相似度达到相似度阈值的相似查询条件; 在对象全集中查询满足所述当前查询条件的对象,以及满足获取的所述相似查询条件的对象; 其中,采用如下方式确定与所述当前查询条件的相似度达到相似度阈值的相似查询条件: 获取查询点击日志,所述查询点击日志中包括所述当前查询条件和其它各查询条件及对应点击的对象; 针对所述当前查询条件和其它各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数; 根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况; 针对其它各查询条件中与所述当前查询条件满足预设条件的每个待确定查询条件,根据所述当前查询条件的点击向量和该待确定查询条件的点击向量,确定所述当前查询条件与该待确定查询条件之间的相似度; 从各待确定查询条件中,确定与所述当前查询条件的相似度达到相似度阈值的查询条件,作为所述当前查询条件的相似查询条件。
7.—种查询条件相似度确定装置,其特征在于,包括: 日志获取单元,用于获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对象; 次数确定单元,用于针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数; 向量确定单元,用于根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况; 相似度确定单元,用于针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度。
8.如权利要求7所述的装置,其特征在于,所述向量确定单元,具体用于针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应点击的第一对象;并确定分量的分量值为该分量对应第一对象在该查询条件下被点击的次数。
9.如权利要求7所述的装置,其特征在于,所述向量确定单元,具体用于针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应点击的第一对象,以及对应点击所述第一对象的其它查询条件对应点击的对象中,除所述第一对象之外的第二对象;以及确定第一对象对应分量的分量值为该第一对象在该查询条件下被点击的次数; 采用如下公式确定第二对象对应分量的分量值:
10.如权利要求7所述的装置,其特征在于,所述相似度确定单元,具体用于采用如下方式确定满足预设条件的两个查询条件: 当两个查询条件各自对应点击的对象中存在至少一个相同对象时,确定该两个查询条件满足预设条件。
11.如权利要求7所述的装置,其特征在于,所述相似度确定单元,具体用于当第一查询条件的点击向量的分量与第二查询条件的点击向量的分量相同时,米用预设相似度算法确定所述第一查询条件的点击向量与所述第二查询条件的点击向量之间的相似度,并将结果作为所述第一查询条件与所述第二查询条件之间的相似度; 当第一查询条件的点击向量的分量与第二查询条件的点击向量的分量存在不同时,确定所述第一查询条件的转换向量的分量和所述第二查询条件的转换向量的分量,其中,所述第一查询条件的转换向量的分量,包括所述第一查询条件的点击向量的分量,以及在所述第二查询条件的点击向量的分量中存在且在所述第一查询条件的点击向量的分量中不存在的分量,所述第一查询条件的转换向量的分量与所述第二查询条件的转换向量的分量相同; 针对所述第一查询条件的转换向量的每个分量,当该分量在所述第一查询条件的点击向量中存在时,所述第一查询条件的转换向量的该分量的分量值为所述第一查询条件的点击向量的该分量的分量值,否则,为O ; 针对所述第二查询条件的转换向量的每个分量,当该分量在所述第二查询条件的点击向量中存在时,所述第二查询条件的转换向量的该分量的分量值为所述第二查询条件的点击向量的该分量的分量值,否则,为O ; 采用预设相似度算法确定所述第一查询条件的转换向量与所述第二查询条件的转换向量之间的相似度,并将结果作为所述第一查询条件与所述第二查询条件之间的相似度。
12.—种对象查询装置,其特征在于,包括: 输入单元,用于获得输入的当前查询条件; 条件获取单元,用于获取预先确定的与所述当前查询条件的相似度达到相似度阈值的相似查询条件; 查询单元,用于在对象全集中查询满足所述当前查询条件的对象,以及满足获取的所述相似查询条件的对象; 条件确定单元,用于采用如下方式确定与所述当前查询条件的相似度达到相似度阈值的相似查询条件:` 获取查询点击日志,所述查询点击日志中包括所述当前查询条件和其它各查询条件及对应点击的对象;并针对所述当前查询条件和其它各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;并根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;并针对其它各查询条件中与所述当前查询条件满足预设条件的每个待确定查询条件,根据所述当前查询条件的点击向量和该待确定查询条件的点击向量,确定所述当前查询条件与该待确定查询条件之间的相似度;以及从各待确定查询条件中,确定与所述当前查询条件的相似度达到相似度阈值的查询条件,作为所述当前查询条件的相似查询条件。
【文档编号】G06F17/30GK103793390SQ201210421325
【公开日】2014年5月14日 申请日期:2012年10月29日 优先权日:2012年10月29日
【发明者】周祥军, 郭瑞, 钟灵, 申月, 杨洁 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1