数据搜索处理方法及系统的制作方法

文档序号:8380985阅读:271来源:国知局
数据搜索处理方法及系统的制作方法
【技术领域】
[0001] 本申请涉及数据搜索领域,更具体地涉及一种数据搜索处理方法及系统。
【背景技术】
[0002] 随着互联网基础设施不断完善和计算机网络技术的不断普及,在线网络搜索各类 特定的数据信息逐渐成为普通网民最常用的一种方式。当数据量非常庞大时,用户可以在 搜索引擎的用户界面上点击选择类目、或输入搜索查询词等,由搜索引擎迅速找到自己想 要的数据对象。
[0003] 在搜索引擎的用户界面上,用户输入关键词或者选择类目,搜索引擎会返回搜索 到的包含一个或多个数据对象(搜索结果)的展示列表。通常,每个数据对象的展示信息中 可以包括数据对象的一个或多个属性及其属性值以及其他参数等信息。当搜索引擎搜索到 数据对象后,可以依据数据对象的各个属性及属性值,对数据对象进行排序和展示。例如: 数据对象可以包括身份标识ID、图片、描述、标号等属性,以及及对应的内容,即属性值,如: ID的具体编号、具体的图片内容、描述的具体内容和字数、标号大小等。由此,搜索引擎可以 根据图片多少、描述字数多少或者标号大小等对数据对象进行排序,并展示数据对象的图 片、描述、标号。通常,在展示出来的数据对象一个或多个属性的属性值中,往往有一个或几 个属性对用户的下一步的操作处理影响较大。比如,在期末考试成绩搜索引擎中,用户会对 搜索到的某个学生的总成绩这一属性更关注。又比如,在商品搜索引擎中,用户往往会对搜 索得到某个商品对象的价格给予较多的关注。当用户通过商品搜索引擎搜索得到商品对象 的价格高低(属性值)超出了真实的价格范围时,用户很可能会对搜索结果产生质疑,从而 放弃对搜索结果的操作。尤其当一个网络搜索平台中出现大量这样的搜索结果或者经常出 现这样的搜索结果,可能引发用户对当前搜索平台的安全性、可信度等产生质疑等。尤其对 于数据对象不是来自单一的、经过可信度和安全性验证的提供方提供给搜索平台的情形, 则很可能给用户造成数据对象的不真实、非法、甚至网络数据的安全隐患(如提供虚假的属 性值,引诱用户选择该数据对象而导致恶意程序的攻击)等问题。
[0004] 另外,现有技术中,为解决数据对象的某些属性值的失真,有的网络搜索平台通过 人工对属性值进行挖掘整理再展示给用户,但很难确定这种整理的合理性;有的网络搜索 平台通过人工审核再展示给用户,但对于海量的数据,这种方式难度高且效率低。

【发明内容】

[0005] 针对上述现有技术的缺陷,本申请提供改进后的一种数据搜索处理方法及系统, 以解决改善数据搜索的展示处理,提高搜索到的数据对象排序展示的合理性以提供更准确 的搜索结果,进而可以降低用户网络搜索访问的风险的问题,以及进一步解决提升搜索平 台的安全性、可信度的问题。
[0006] 根据本申请的一个方面,提供一种数据搜索处理方法,包括:接收当前用户发出的 搜索请求以获取所述搜索请求中包含的查询词;统计所述查询词对应的搜索结果中的数据 对象上发生的历史操作信息;选取所述数据对象的一项属性作为指定属性,生成所述查询 词对应的历史操作信息涉及的数据对象在所述指定属性上的属性值的概率分布模型;利用 所述概率分布模型,计算当前用户发出的搜索请求对应的搜索结果中的每一数据对象在指 定属性上的属性值对应的概率;使用所述概率调整搜索结果中的数据对象的输出排序。
[0007] 根据本申请的另一个方面,提供一种数据搜索处理系统,包括:搜索前端、日志收 集器、数据分析平台、数据存储系统、搜索引擎;其中,搜索前端接收当前用户发出的搜索请 求以获取所述搜索请求中包含的查询词,并转发当前用户发出的搜索请求给查询分析器; 日志收集器,收集用户在查询词对应的搜索结果中的数据对象上的历史操作信息;数据分 析平台,以数据对象的一项属性作为指定属性,利用存储的每一查询词对应的搜索结果中 的数据对象上的历史操作信息,生成与该查询词对应的历史操作信息涉及的数据对象在该 指定属性上的属性值的概率分布模型;搜索引擎,根据该当前用户发出的搜索请求执行对 应获取的查询词的搜索,并利用该概率分布模型,计算该查询词的搜索结果中的每一数据 对象在指定属性上的属性值对应的概率,并使用所述概率调整搜索结果中的数据对象的输 出排序。
[0008] 根据本申请的又一个方面,提供一种数据搜索处理方法,包括:收集用户在各查询 词对应的搜索结果中的数据对象上的历史操作信息;以数据对象的一项属性作为指定属 性,分别利用每一查询词对应的搜索结果中的数据对象上的历史操作信息建立所述数据对 象在指定属性上的属性值的概率分布模型,并记录该查词与概率分布模型对应关系;接收 当前用户发出的搜索请求,获取所述搜索请求中包含的查询词;根据记录的查询词与概率 分布模型的对应关系,确定所述搜索请求中的查询词对应的概率分布模型;使用所确定的 概率分布模型计算所述搜索请求对应的搜索结果中的每一数据对象在指定属性上的属性 值对应的概率;使用至少所述概率调整所述搜索请求对应的搜索结果中的数据对象的排 序。
[0009] 本申请的方法及系统,对于能够搜索来自各种内容提供方的、非全部经过数据验 证的网络搜索平台来说,可以有效降低用户访问到非法数据对象、受到恶意数据攻击的风 险,还能保障搜索平台的安全性、可信度,进而获取用户对平台的信任感。通过分析海量用 户的实际搜索行为,对每个搜索词下大部分合理的属性值进行数学建模,并在数据对象排 序展示的环节把属性值的合理性作为参考,使得不合理(非法、恶意)的数据对象展示排前 的机会大大减少。进一步地,使用户通过网络搜索平台提交搜索请求时,能自动获取当前搜 索意图下的合理属性值作为参考,即搜索结果的展示考虑了数据对象的属性值的合理性, 从而打压不合理的数据对象避免其被提供给用户,改善用户的搜索体验,促进搜索平台的 良性发展。
【附图说明】
[0010] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0011] 图1为依据本申请的数据搜索处理方法的一实施例的流程图;
[0012] 图2为依据本申请的方法中关于生成模型参数以及获得对应查询词的模型参数 的一实施例的流程图;
[0013] 图3为依据本申请的数据搜索处理系统的一实施例的结构图;以及 [0014]图4为依据本申请的方法中关于搜索引擎计算排序分的一个实施例示意图;
[0015] 图5为依据本申请的数据搜索处理装置的一实施例的示意图。
【具体实施方式】
[0016] 本申请的主要思想在于,通过分析在海量用户提交的海量的搜索请求中,每个提 交的搜索请求所涉及的搜索词下的大部分/大多数用户,对依据该搜索词获得的搜索结果 进行的实际操作行为,构建与查询词相对应的参考用的概率分布模型参数(概率分布模型 中包括概率分布函数及模型参数等);将参考用的模型参数应用到当前用户的数据对象的 搜索请求的搜索结果展示处理中,由于该模型参数对合理性做了考虑,使得搜索结果展示 处理时,尽量将搜索到的更准确有效(符合搜索词目标)、更合理、少风险的一个或多个数据 对象的结果,展示在前面、而排挤不合理有风险的数据对象的结果在前面的展示,以便改善 展示处理,提高展示合理性,降低用户操作风险,提升搜索平台的搜索准确性、安全性和可 信度,改善用户搜索体验,促进搜索平台良性发展。
[0017] 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0018] 随着互联网基础设施不断完善和计算机网络技术的不断普及,以在线网络购物的 搜索技术为例,由于商品量非常庞大,用户需要通过用户界面(用户的搜索界面)、借助商品 搜索引擎迅速找到自己想要的商品。在这样的界面上,用户输入关键词或者是选择类目,商 品搜索引擎即会返回一个商品展示列表。通常商品展示列表展示的商品信息包括商品图 片,商品描述,商品价格等条目。某些商品信息(条目)对用户的影响尤其重要,比如商品价 格。一个远高于用户期望的商品价格可能使用户跳过该商品,并不再浏览该商品的详情页 面,从而错过用户下单购买的机会。同样,一个远低于正常市场价的商品价格可能让用户对 商品的真实性产生疑问。如果一个商品搜索平台出现大量的类似现象,可能引发用户对当 前使用
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1