评估搜索行为满意度的方法、装置及服务器与流程

文档序号:11155523阅读:279来源:国知局
评估搜索行为满意度的方法、装置及服务器与制造工艺

本发明涉及互联网技术领域,特别涉及评估搜索行为满意度的方法、装置及服务器。



背景技术:

随着互联网技术的发展,每一秒都有海量的信息产生,因此人们能够获取到的知识和信息更是超越海量的。如此巨量的信息反而给满足人们的真正需求带来困扰,因为人们每一次希望获得的知识和信息都要求尽量精确和有针对性,信息量太大使得这一过程犹如大海捞针,使其十分费时费力,甚至无法实现。解决这一问题的途径就是利用搜索引擎去找寻需要的信息和知识。

人们通过搜索引擎去查询自己需要的知识和信息,针对某一查询需求,用户输入检索词进行检索,搜索引擎从索引数据库中找到匹配该检索词的网页。搜索引擎通过预先收集互联网页面和文件信息并依据一定的规则建立索引,搜索引擎再通过查询装置处理用户查询,接着通过被称为网页爬虫的网页获取装置追踪并反馈结果列表,达到满足用户查询需求的效果。

面对信息量的迅猛增长,也需要不断提高搜索引擎的系统性能,因此就需要记录并分析用户与搜索引擎进行交互的行为日志,以便不断适应用户的搜索需求。这种行为日志一般被称为搜索引擎查询日志,该查询日志通常记录的内容包括:用户使用搜索引擎的时长、用户提交的检索词、用户点击结果以及点击结果在搜索引擎提供的某一结果页面中的排序等。通过在搜索引擎后台的具体实现,还可以记录更加精细的用户交互信息,例如用户鼠标移动的位置、用户鼠标点击结果的位置、滚动条滑动的时间位置等信息。由于搜索引擎查询日志是在不影响用户正常使用的情况下完成记录的,因此具有良好的客观性,真实地保存了用户与搜索引擎交互情况,为改进搜索引擎的性能提供了可靠的原始资料。然而目前的现有技术中并没有充分利用这些原始资料以改进搜索引擎性能的技术方案,因此无法更大程度地利用好这一信息资源以改进搜索引擎性能和提升用户体验。



技术实现要素:

基于此,对于本发明的首要目的旨在解决上述至少一个问题,提供一种评估搜索行为满意度的方法及装置。

本发明的另一目的在于提供一种服务器,以运行前一目标所述的方法。

一种评估搜索行为满意度的方法,包括下列步骤:

基于预定划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session,所述Session为用户在预定时长内针对同一查询需求的搜索过程;

依据预定的评估标准,对与任一Session相应的用户搜索行为日志进行分析,以确定针对所述Session的评估参数;

基于所述评估参数来确定所述Session的评估结果。

在其中一个实施例中,所述预定划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session的步骤,具体包括:

从所述用户搜索行为日志中提取任意两个时间连续的第一搜索结果展示事件和第二搜索结果展示事件;

依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

进一步的,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足预定划分条件中的第一预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第一预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第二预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第二预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

进一步的,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

当所述第一搜索结果展示事件和所述第二搜索结果展示事件不满足所述第二预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第三预设相关条件及第四预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第三预设相关条件及第四预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

进一步的,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第三预设相关条件、不满足所述第四预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第五预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第五预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

进一步的,所述预定划分条件包括第一预设相关条件、第二预设相关条件、第三预设相关条件、第四预设相关条件及第五预设相关条件;

在其中一个实施例中,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件不满足所述第一预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第六预设相关条件及所述第四预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第四预设相关条件及所述第六预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

其中,所述第一预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所对应的发生时间的差值在预定时间差值范围内;

所述第二预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的检索词具有相互包含关系;

所述第三预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所分别对应的检索词中的重合关键词比例为第一比例范围;

所述第四预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所分别对应的搜索结果项具有交集;

所述第五预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所分别对应的检索词中的重合关键词比例为第二比例范围,并且所述检索词长度大于设定字节数。

所述第六预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的检索词中重合关键词比例为第三比例范围。

在其中一个实施例中,所述预定的评估标准包括:用户搜索成本评估标准和/或结果展现/点击质量。

进一步的,所述用户搜索成本评估标准中包括的评估参数包括:

查询次数、有点击的查询次数、有点击的查询占比、最后一次查询是否有点击、最大连续无点击的查询次数、最大连续无点击的查询占比、检索词改写行为、是否有翻页行为、最大翻页的页码或翻页的次数占比中的至少一种;

所述结果展现/点击质量评估标准中包括的评估参数包括:平均点击位置、最高点击位置、最低点击位置、点击引擎来源、平均停留时间、长点击次数、长点击比例、短点击次数、短点击比例或是否有强展现的结果中的至少一种。

在其中一个实施例中,所述预定的评估标准还包括查询意图标准和/或查询相关度标准。

进一步的,所述查询意图标准基于查询词的语义信息及查询词的点击率中的至少一项来确定;

所述查询相关度标准中包括的评估参数包括查询词所属的查询词集合类别信息、查询词满意度概率中的至少一种;

其中,所述查询词满意度概率基于对查询词的点击率、首次点击平均用时、平均点击位置及平均停留时间中的至少一项的统计计算结果来确定。

在其中一个实施例中,所述对任一Session相应的用户搜索行为日志进行分析的步骤,具体包括:

将与所述Session相对应的用户搜索行为日志中的评估参数按照类别进行参数合并、取差值或格式变换,得到评估参数统计数据,以确定针对所述Session的评估参数。

进一步的,所述基于所述评估参数来确定所述Session的评估结果,具体包括:

依据与所述针对所述Session的评估参数对应的预设评级条件,判断与所述Session对应的搜索过程满意度级别,记录并输出所述搜索过程满意度级别。

本发明同时提供一种评估搜索行为满意度的装置,包括:

划分模块,用于基于预定的划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session,所述Session为用户在预定时长内针对同一查询需求的搜索过程;

分析模块,用于依据预定的评估标准,对与任一Session相应的用户搜索行为日志进行分析,以确定针对所述Session的评估参数;

评价模块,用于基于所述评估参数来确定所述Session的评估结果。

本发明还提供了一种评估搜索行为满意度的服务器,包括处理器,所述处理器用于执行如上述任一所述的评估搜索行为满意度的方法。

根据本发明提供的检索过程满意度评估方法及相应的装置和服务器,实现了通过机器自动对用户搜索行为日志进行划分和分析,充分获取和利用用户搜索行为日志中包含的有益信息,为改进搜索引擎性能提供充分参考。该检索过程满意度评估方法通过增加细节化的预设条件,对搜索结果展示事件进行多层次细化筛选,确保了Session划分的精确性,也进一步保证了检索过程满意度评估的准确性,大幅度降低了漏评甚至误评的情况。

附图说明

图1为本发明一实施例检索过程满意度评估方法流程图;

图2为本发明一实施例检索过程满意度评估方法的步骤S100具体流程图;

图3为本发明一实施例中的Session划分的方法示意图;

图4为本发明一实施例检索过程满意度评估装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。

在正常的搜索过程中,用户会基于明确的查询需求主动发起搜索请求,例如去某个网站、搜看电视剧、了解新名词或者查找某些问题的解决方法等等。在用户提交搜索请求之后,搜索引擎将返回搜索结果,即搜索引擎结果页面(serp,search engine results page)。通常情况下,用户会首先查看第一页结果,具体而言,用户多是从上到下,从左到右依次浏览查看搜索结果。越是靠前的搜索结果,用户越可能点击。用户也会依据搜索结果的摘要快速衡量搜索结果的质量,若摘要符合搜索预期,则用户可能点击该搜索结果。若用户在第一页搜索结果中获取到所需信息,则用户在本次Session中获得令人满意的体验。否则,用户在本次Session中可能会更换检索词,或者翻页,或者点击相关搜索(rs,related search)结果或右侧推荐结果。在用户更换检索词开始新的搜索后,启动新一轮的查看搜索结果、衡量摘要、点击的过程。几轮搜索过程之后,用户要么找到满足需求的结果,要么失望而归而放弃搜索,在这种情况下,用户就没有获得最佳的Session体验。这里的Session是指某一用户在预定时长内针对同一查询需求的搜索过程。

由此可见,通过分析Session中用户的搜索行为以及查看搜索结果的质量,可以推断该用户在本次Session中是否满意。而用于分析Session满意度所需的用户搜索行为以及搜索结果质量等数据均可以基于搜索引擎所记录的用户搜索行为日志获取或分析得到。

对检索过程满意度进行评估至少有三个方面的有效应用,例如:监控线上搜索质量,自动发掘较差案例(badcase);监控线上用户行为,包括长Session的比例、Session停留时间的分布、Session满意度的分布、翻页率等;为搜索结果数据排序提供更多参考特征,包括query_url对特征、相似query的结果聚合或上下文相关的term weight等。

本实施例一种检索过程满意度评估方法,如图1所示,由网络设备执行的方法包括下列步骤:步骤S100、步骤S200和步骤S300。

其中,网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。

S100:基于预定划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session,所述Session为用户在一定时间内围绕同一个搜索主题而进行的搜索过程,也即用户在预定时长内针对同一查询需求的搜索过程。

浏览器自动记录用户搜索过程中的行为信息,形成用户搜索行为日志。为了保证对检索过程满意度的评估效率,通常是以一定时间周期中的用户搜索行为日志为分析研究对象,例如一天24小时内的或者两天48小时内的搜索行为日志。而在这样一个预定时间周期(24小时、36小时或48小时等)内,用户可能有多个搜索行为,其主题可能各不一样,也可能在不同的时间点进行了类似甚至相同的主题搜索。以搜索主题为单位进行检索过程满意度的评估使得评估具有针对性,统计更有条理,得出的信息也更加准确。因此,首先要在被选定的时间周期内,比如一天24小时内,将用户搜索行为日志中的Session界定划分出来,可能一天内就围绕一个主题进行检索,那么得到的用户搜索行为日志中就只包括一个Session,而如果是围绕多个主题进行检索,那么就可能在用户搜索行为日志中包括多个Session。

如图2所示,步骤S100中预定划分条件是对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session的关键因素,该预定划分条件具体包括:步骤S110和步骤S120。

S110:从用户搜索行为日志中提取任意两个时间连续的第一搜索结果展示事件和第二搜索结果展示事件。搜索结果展示事件是指基于用户输入检索词进行检索并获得搜索结果页面并展示搜索结果页面的过程。依据搜索行为进行的时间先后顺序对用户搜索行为日志进行搜索检验以区分Session可以使整个划分过程有序化、条理化,从而保证机器划分Session的高效率和全面性,例如全天可能进行了5次搜索(或检索),时间分别是上午10:15、上午10:20、上午11:13、下午1:51和下午3:09,对应在用户搜索行为日志中形成第一搜索结果展示事件、第二搜索结果展示事件、第三搜索结果展示事件、第四次搜索结果展示事件和第五次搜索结果展示事件。对于事件提取的过程可能是这样:首先对第一搜索结果展示事件和第二搜索结果展示事件进行提取,然后在第二轮中对第二搜索结果展示事件和第三搜索结果展示事件进行提取,如此类推,直到最后一轮中对第四搜索结果展示事件和第五搜索结果展示事件进行提取。当然也可以是这样:首先对第三次搜索结果展示事件和第四搜索结果展示事件进行提取,再对第四和第五搜索结果展示事件进行提取,直到两两提取完所有的搜索结果展示事件。

S120:依据预定划分条件,将第一搜索结果展示事件和第二搜索结果展示事件对应的搜索过程划分为一个Session。

经过步骤S110对搜索行为日志的分析提取得到第一搜索结果展示事件和第二搜索结果展示事件之后,再进一步根据预先设定的划分条件,将上述两个搜索结果展示事件有根据地划分到一个Session,本领域技术人员能够知道,当上述两个搜索结果展示事件还存在不满足预先设定的划分条件的情况,也即当不符合预设的划分条件时,则不能将步骤S110在这一轮中提取出的两个搜索结果展示事件划分为同一个Session。优选的,依据预定划分条件,将第一搜索结果展示事件和第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤具体包括:判断第一搜索结果展示事件和第二搜索结果展示事件是否满足预定划分条件中的第一预设相关条件,当确定得出这两个搜索结果展示事件满足该第一预设相关条件时,再判断这两个搜索结果展示事件是否满足第二预设相关条件,当确定得出这两个搜索结果展示事件也满足第二预设相关条件时,就将第一搜索结果展示事件和第二搜索结果展示事件对应的搜索过程划分为一个Session。这一判定划分过程中,第一预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件所对应发生时间的差值在预定时间差值范围内,比如预定时间差值范围可选择为10分钟、30分钟或者1小时等等;而第二预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件对应的检索词具有相互包含关系,比如第一次搜索的检索词为“水”,而第二次搜索的检索词为“矿泉水”或者“饮用水”等等。

优选的,当第一搜索结果展示事件和第二搜索结果展示事件满足了第一预设相关条件但不满足第二预设相关条件时,不能简单地将其判定为不属于同一个Session,例如以上面“水”为例,可能第二次搜索的检索词为“饮料”,因此就有可能和第一次搜索的主题是相同的,那么就需要进一步地对不满足第二预设相关条件的搜索结果展示事件引入第三预设相关条件,甚至第四预设相关条件进行判断,也即当两次搜索结果展示事件满足第三预设相关条件之后,再判断该两次搜索结果展示事件是否满足第四预设相关条件,如果仍然满足,则将该两次搜索结果展示事件对应的搜索过程划分为一个Session。其中,第三预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件所分别对应的检索词中的重合关键词比例为第一比例范围。因为一个检索词中包含有多个关键词,所以重合关键词比例是指在某一检索词中重合关键词在整个检索词中的比例,比如“川菜中土豆丝的做法”这一检索词中关键词有“川菜”、“土豆丝”、“做法”,如果和另一搜索中的检索词相重合的关键词是“土豆丝”,那么第一搜索结果展示事件“川菜中土豆丝的做法”对应的检索词中重合关键词比例就是1/3,可取0.33,当然重合关键词也可以是含义相同的词汇。而该第一比例范围可以是0.3~0.5,或者0.3以上,或者0.5以上,或者0.2以上等等,比如“2015年新上映的电影”和“2016年新上映的免费电影”,其中“2015年新上映的电影”中的关键词有“2016年”、“新上映”和“电影”,而“2016年新上映的免费电影”中的关键词有“2016年”、“新上映”、“免费”和“电影”,这两个检索词中的重合关键词为“新上映”和“电影”,该重合关键词在第一搜索结果展示事件对应的检索词中的比例为0.66,而在第二搜索结果展示事件对应的检索词中的比例为0.5,若第一比例范围为0.3以上或者大于0.3,则表明该两个搜索结果展示事件满足第三预设相关条件。其中,第四预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件所分别对应的搜索结果项具有交集,比如在第一次搜索和第二次搜索得到的结果页面中有相重合的内容,该相重合的内容可以是相同的文章,或者相同的网页链接等等。

进一步优选的,如果还存在这样的一种情况,即第一搜索结果展示事件和第二搜索结果展示事件满足第一预设条件,不满足第二预设条件,满足第三预设条件而不满足第四预设条件时,则引入第五预设相关条件,判断上述两个搜索结果展示事件是否满足第五预设相关条件,如果仍然满足,那么还是将该两个搜索结果展示事件对应的搜索过程划分为一个Session。第五预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件所分别对应的检索词中的重合关键词比例为第二比例范围并且该检索词的数据长度需要大于预先设定的字节数,这里的第二比例范围定义和第三预设相关条件的类似,只是和第三预设相关条件所对应的第一比例范围在具体数值上有所区别,而检索词的长度可能是一定的字节数,比如四个字节、六个字节或者八个字节等等。

作为一个优选的方案,依据预定划分条件,将第一搜索结果展示事件和第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

当确定第一搜索结果展示事件和第二搜索结果展示事件不满足第一预设相关条件时,判断第一搜索结果展示事件和第二搜索结果展示事件是否满足预定划分条件中的第六预设相关条件及第四预设相关条件。当确定第一搜索结果展示事件和第二搜索结果展示事件满足第四预设相关条件及第六预设相关条件时,将第一搜索结果展示事件和第二搜索结果展示事件对应的搜索过程划分为一个Session。其中,第一预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件所对应发生时间的差值在预定时间差值范围内,这与上文判断条件的内容相一致。第四预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件所分别对应的搜索结果项具有交集,这一预设相关条件与上文所述相一致,而第六预设相关条件可以是第一搜索结果展示事件和第二搜索结果展示事件对应的检索词中重合关键词比例为第三比例范围,这里第三比例范围的定义和第三预设相关条件中的第一比例范围的定义类似,只是和第三预设相关条件所对应的第一比例范围在具体数值上可能有所区别(也可以相同)。

在本发明提供的一个实施例中,如图3所示,首先按照一天(24小时)的时间间隔提取出用户的搜索行为日志,并对其进行Session划分,通过该用户一天内的所有搜索和/或点击的行为确定这些搜索过程分属哪些Session。首先判断一前一后搜索时间紧邻的两次serp的提供时间的时间差是否小于30分钟,如果是,则进一步查看该两次serp对应的检索词之间的关系,如果该前后两次提供的serp对应的检索词存在包含关系,则判断同属一个Session。如果该前后两次提供的serp对应的检索词不存在包含关系,则引入其他划分条件,比如看两次提供的serp对应的检索词中的重合关键词在各自检索词中的比例是否都大于0.2,如果是则判断可能同属一个Session,再进一步引入一个划分条件继续判断,比如看两次提供的serp中是否有交集,如果是则确认两次搜索行为属于同一个Session,如果没有交集,则再看其是否满足另一个划分条件,比如看两次提供的serp中重合关键词比例是否大于0.5,并且同时query长度大于4,如果满足这一条件,还是将这两次搜索行为判断为属于同一个Session,否则不属于同一个Session。

或者,仍然参见图3,首先判断一前一后搜索时间紧邻的两次serp的提供时间的时间差是否小于30分钟,如果是,则进一步查看该两次serp对应的检索词中重合关键词占检索词的比例是否大于0.5,如果不大于0.5,则确认不属于同一个Session,而如果大于0.5则判断可能同属一个Session,再进一步引入其他划分条件进行确认,如判断两次提供的serp中是否有交集,如果是,则确定两次搜索行为属于同一Session。

通过如上所述的判断方法和图3所示的流程实现Session的划分。本领域技术人员能够知晓,Session划分的条件例如上述的预定划分条件,但并不限于上述的预定划分条件。

S200:依据预定的评估标准,对与任一Session相应的用户搜索行为日志进行分析,以确定针对所述Session的评估参数。

待通过步骤S100将用户搜索行为日志中的Session区别分类之后,就需要对每一个Session进行评估。每个Session内部仍然包含有若干用户搜索行为,比如点击、页面保持或翻页等等。根据预先设定好的评估标准对这些与Session相对应的用户搜索行为日志进行细节化分析,确定每个Session中的评估参数,该Session的评估参数是对若干用户搜索行为进行评估后得出的总结果。该预定的评估标准包括用户搜索成本评估标准和/或结果展现/点击质量,还可能包括查询意图标准和/或查询相关度标准。其中,用户搜索成本评估标准中包括的评估参数包括有:查询次数、有点击的查询次数、有点击的查询占比、最后一次查询是否有点击、最大连续无点击的查询次数、最大连续无点击的查询占比、检索词改写行为、是否有翻页行为、最大翻页的页码或翻页的次数占比等,这些评估参数可能在用户搜索成本评估标准只有一项,也可能其中若干项同时具备。而结果展现/点击质量评估标准中包括的评估参数包括:平均点击位置、最高点击位置、最低点击位置、点击引擎来源、平均停留时间、长点击次数、长点击比例、短点击次数、短点击比例或是否有强展现的结果等等,这些评估参数可能在结果展现/点击质量评估标准中只有一项,也可能其中若干项同时具备。优选的,查询意图标准基于查询词的语义信息及查询词的点击率中的至少一项来确定,而查询相关度标准中包括的评估参数则包括查询词所属的查询词集合类别信息、查询词满意度概率中的至少一种,在这当中,查询词满意度概率基于对查询词的点击率、首次点击平均用时、平均点击位置及平均停留时间中的至少一项的统计计算结果来确定。

优选的,在确定好所选择的评估标准后,就根据该评估标准对分类出来的Session中的一个(首次评估可选择其中任意一个,后续再对其他Session逐个进行评估)进行分析评估,具体的过程包括:将与Session相对应的用户搜索行为日志中的评估参数按照类别进行参数合并、取差值或者格式变换,得到评估参数统计数据,以确定针对该项Session的评估参数。该过程的关键在于对同一Session中的参数进行特定的数学处理,得出统计数据,如上文所述,每个Session中可能包含若干评估参数,这些评估参数是零散的、无规律的,需要首先区别其类别,然后根据类别进行数学处理,例如参数合并,比如某一Session中包括两次搜索“矿泉水”,第一次搜索“矿泉水”的查询次数和第二次搜索“矿泉水”的查询次数可以进行加和合并处理。或者比如,在某一Session中包括两次搜索“樟树”的行为,第一次搜索的发起时间是“10:03”,第二次搜索的发起时间是“10:17”,可以对这两个时间进行取差值,确定两次搜索的间隔时间是“14分钟”。或者比如,某一Session中包含的最后一次搜索查询有点击则输出评估参数“1”,如果没有点击则输出评估参数“0”,将动作行为转化为数字格式。针对每一类别的评估参数进行处理后,得出Session的评估参数。

S300:基于评估参数来确定Session的评估结果。

根据与Session的评估参数对应的预设评级条件,判断与Session相对应的搜索过程满意度级别,记录并输出搜索过程满意度级别。如果Session的评估参数包括一种类别,则对应的预设评级条件包括一种相同类别的评级条件,如果Session评估参数中包括多种类别的评估参数,则对应的预设评级条件也包括多种分别与之对应的评级条件。每个预设评级条件中包括一定的数据范围,当Session中的评估参数落在评估条件中的某一个数据范围内,则按照与该数据范围相对应的映射给出评估参数的满意度级别,并对该满意度级别记录并输出。

如果评判出用户搜索体验良好甚至完美,则给出满意度级别2,常见的情况如:某一Session中只有一次搜索查询行为,该查询行为对应一次点击,点击后有一定时间的页面停留,可以判断用户在搜索结果的第一页即找到满意结果;或者虽然有更换查询词(query)、翻页或点击推荐页等行为,但也在第一页有点击有收获,最终还是快速满足了用户需求;或者无点击,但是有一定的页面停留时间,并且鼠标停留位置在某一项链接的摘要处,则表明用户看摘要就能满足其搜索需求。

如果从评估参数判断出用户搜索体验一般,则给出满意度级别1,例如:用户搜索需求只有部分满足,或者搜索过程曲折费时但最终仍然找到需要的结果,如某一Session中有5次搜索查询行为,每次都存在检索词改写的行为,并且每次翻页页码都比较大(比如翻到第三页),而最后一次搜索查询的点击后有一定时间的页面停留,判断到用户找到需求的结果。

如果用户没找到满意结果,失望而归则给出满意度级别0,常见的是只搜索而无点击,或者点了较差的结果而无后续行为、多次查询后还是没找到目标信息等。对于某一Session而言,从搜索引擎查询日志中可以了解到:用户分别采用“58同城招聘”、“58同城招聘”、“58同城招聘网”和“58同城招聘”作为检索词进行搜索,搜索引擎分别在10点10分22秒、10点10分30秒、10点10分35秒、10点10分42秒向用户提供的四个搜索结果页面,在此过程中,用户均没有进行点击操作,因此判断该Session中,用户一直没有获得所需的搜索结果,搜索体验差,判定Session满意度为满意度评估等级0。

适应前述的方法,基于计算机模块化思维,本发明的另一实施例提供一种检索过程满意度评估装置,如图4所示,包括:

划分模块10,用于基于预定的划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session,其中Session为用户在预定时长内针对同一查询需求的搜索过程。

在一个预定时间周期(24小时、36小时或48小时等)内,用户可能有多个搜索行为,其主题可能各不一样,也可能在不同的时间点进行了类似甚至相同的主题搜索。以搜索主题为单位进行检索过程满意度的评估使得评估具有针对性,统计更有条理,得出的信息也更加准确。因此,首先要在被选定的时间周期内,比如一天24小时内,通过划分模块10将用户搜索行为日志中的Session界定划分出来,可能一天内就围绕一个主题进行检索,那么得到的用户搜索行为日志中就只包括一个Session,而如果是围绕多个主题进行检索,那么就可能在用户搜索行为日志中包括多个Session。划分模块10划分Session的步骤包括步骤S110和步骤S120。

分析模块20,用于依据预定的评估标准,对与任一Session相应的用户搜索行为日志进行分析,以确定针对所述Session的评估参数。

待通过划分模块10将用户搜索行为日志中的Session区别分类之后,就需要利用分析模块20对每一个Session进行评估。每个Session内部仍然包含有若干用户搜索行为,比如点击、页面保持或翻页等等。根据预先设定好的评估标准对这些与Session相对应的用户搜索行为日志进行细节化分析,确定每个Session中的评估参数,该Session的评估参数是对若干用户搜索行为进行评估后得出的总结果。该预定的评估标准包括用户搜索成本评估标准和/或结果展现/点击质量,还可能包括查询意图标准和/或查询相关度标准。

评价模块30,用于基于所述评估参数来确定所述Session的评估结果。

评价模块30根据与Session的评估参数对应的预设评级条件,判断与Session相对应的搜索过程满意度级别,记录并输出搜索过程满意度级别。如果Session的评估参数包括一种类别,则对应的预设评级条件包括一种相同类别的评级条件,如果Session评估参数中包括多种类别的评估参数,则对应的预设评级条件也包括多种分别与之对应的评级条件。每个预设评级条件中包括一定的数据范围,当Session中的评估参数落在评估条件中的某一个数据范围内,则按照与该数据范围相对应的映射给出评估参数的满意度级别,并对该满意度级别记录并输出。

本发明还提供了一种检索过程满意度评估服务器,包括上述的检索过程满意度评估装置,用于实现上述方法描述的步骤,例如以划分模块10用于基于预定的划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session,其中Session为用户在预定时长内针对同一查询需求的搜索过程,再以分析模块20依据预定的评估标准,对与任一Session相应的用户搜索行为日志进行分析,以确定针对所述Session的评估参数,最后通过评价模块30基于所述评估参数来确定所述Session的评估结果。

为便于本领域技术人员更容易理解本发明的实现方式,以下示例叙述实际场景中如何完成检索过程满意度的评估。

某用户正常使用计算机一个月,期间进行了大量搜索查询操作,相关设备记载了详细的用户搜索行为日志。服务器按照24小时为周期对用户搜索行为日志进行分析评估,得出用户在搜索过程中对搜索体验的满意程度。具体过程如下:

计算机分析到某日(24小时)的用户搜索行为日志包含有5个以搜索主题划分开的Session,分别为“电脑静音”、“电视剧:对不起,爱上你”、“牛背山旅游”、“杭州规划局”和“京东商城”。对于以“电脑静音”为主题的Session,用户曾在时间17:21:41点击确认搜索检索词“电脑怎么静音”,并且用户于17:21:47进行了点击操作,点击内容为检索词“电脑怎么静音”对应的搜索结果页面(serp)上第一条检索结果链接,到17:23:51用户关闭了之前点击开的检索结果链接页面,之后该Session没有其他操作,则判断该Session中,用户的检索过程体验良好,可以看到该Session满意度的评估等级为2。对于以“电视剧:对不起,爱上你”为主题的Session,用户曾在11:59:16在搜索引擎的检索输入页面中输入“对不起,爱上你”,接着12:00:18用户又将检索词变更为“对不起爱上你”,再接着于12:00:35和12:00:58用户都在serp上有点击操作,而在12:01:46,用户又将检索词变更为“对不起爱上你电视剧”,并在接下来的3分钟时间内在serp上有3次点击操作,之后该Session停留在最后一次点击的链接页面中直到关闭该页面,则计算机判断到该Session中,用户的检索过程体验一般,可以看到该Session满意度的评估等级为1。对于以“牛背山旅游”为主题的Session,用户分别输入了“牛背山旅游攻略”、“重庆到牛背山旅游攻略”、“重庆到牛背山旅游攻略”、“2015年牛背山自驾游”和“牧马人牛背山自驾游”,对应记录的时间分别为“10:39:36”、“10:40:05”、“11:35:47”、“11:36:27”和“11:47:16”,在头两次搜索过程中用户没有进行点击操作,第二次检索之后进行了其他主题的检索,第三次检索中用户仍然没有进行点击操作,更改了检索词,在第四次检索中,用户翻页页数为4,在第五次检索中用户没有进行点击操作,11:48:06进行了其他主题的检索,之后没有再针对“牛背山旅游攻略”这一主题进行检索,即该Session没有其他与主题相关的操作,由此计算机判断用户在本次检索过程种检索满意度很差,没有满足用户的检索需求,但耗费了一定的时间成本,可以看到该Session满意度的评估等级为0。

本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。

本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。综上所述,本发明所提供的技术方案如下所述:

A1、一种评估搜索行为满意度的方法,包括下列步骤:

基于预定划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session,所述Session为用户在预定时长内针对同一查询需求的搜索过程;

依据预定的评估标准,对与任一Session相应的用户搜索行为日志进行分析,以确定针对所述Session的评估参数;

基于所述评估参数来确定所述Session的评估结果。

A2、根据A1所述的评估搜索行为满意度的方法,所述预定划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session的步骤,具体包括:

从所述用户搜索行为日志中提取任意两个时间连续的第一搜索结果展示事件和第二搜索结果展示事件;

依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

A3、根据A2所述的评估搜索行为满意度的方法,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足预定划分条件中的第一预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第一预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第二预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第二预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

A4、根据A3所述的评估搜索行为满意度的方法,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

当所述第一搜索结果展示事件和所述第二搜索结果展示事件不满足所述第二预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第三预设相关条件及第四预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第三预设相关条件及第四预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

A5、根据A4所述的评估搜索行为满意度的方法,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第三预设相关条件、不满足所述第四预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第五预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第五预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

A6、根据A3所述的评估搜索行为满意度的方法,所述依据预定划分条件,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session的步骤,具体包括:

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件不满足所述第一预设相关条件时,判断所述第一搜索结果展示事件和所述第二搜索结果展示事件是否满足所述预定划分条件中的第六预设相关条件及所述第四预设相关条件;

当确定所述第一搜索结果展示事件和所述第二搜索结果展示事件满足所述第四预设相关条件及所述第六预设相关条件时,将所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的搜索过程划分为一个Session。

A7、根据A3-A6任一项所述的评估搜索行为满意度的方法,所述预定划分条件包括第一预设相关条件、第二预设相关条件、第三预设相关条件、第四预设相关条件及第五预设相关条件;

其中,所述第一预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所对应的发生时间的差值在预定时间差值范围内;

所述第二预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的检索词具有相互包含关系;

所述第三预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所分别对应的检索词中的重合关键词比例为第一比例范围;

所述第四预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所分别对应的搜索结果项具有交集;

所述第五预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件所分别对应的检索词中的重合关键词比例为第二比例范围,并且所述检索词长度大于设定字节数;

所述第六预设相关条件为所述第一搜索结果展示事件和所述第二搜索结果展示事件对应的检索词中重合关键词比例为第三比例范围。

A8、根据A1所述的评估搜索行为满意度的方法,所述预定的评估标准包括:用户搜索成本评估标准和/或结果展现/点击质量。

A9、根据A8所述的评估搜索行为满意度的方法,所述用户搜索成本评估标准中包括的评估参数包括:

查询次数、有点击的查询次数、有点击的查询占比、最后一次查询是否有点击、最大连续无点击的查询次数、最大连续无点击的查询占比、检索词改写行为、是否有翻页行为、最大翻页的页码或翻页的次数占比中的至少一种;

所述结果展现/点击质量评估标准中包括的评估参数包括:平均点击位置、最高点击位置、最低点击位置、点击引擎来源、平均停留时间、长点击次数、长点击比例、短点击次数、短点击比例或是否有强展现的结果中的至少一种。

A10、根据A1所述的评估搜索行为满意度的方法,所述预定的评估标准还包括查询意图标准和/或查询相关度标准。

A11、根据A10所述的评估搜索行为满意度的方法,所述查询意图标准基于查询词的语义信息及查询词的点击率中的至少一项来确定;

所述查询相关度标准中包括的评估参数包括查询词所属的查询词集合类别信息、查询词满意度概率中的至少一种;

其中,所述查询词满意度概率基于对查询词的点击率、首次点击平均用时、平均点击位置及平均停留时间中的至少一项的统计计算结果来确定。

A12、根据A1所述的评估搜索行为满意度的方法,所述对任一Session相应的用户搜索行为日志进行分析的步骤,具体包括:

将与所述Session相对应的用户搜索行为日志中的评估参数按照类别进行参数合并、取差值或格式变换,得到评估参数统计数据,以确定针对所述Session的评估参数。

A13、根据A12所述的评估搜索行为满意度的方法,所述基于所述评估参数来确定所述Session的评估结果,具体包括:

依据与所述针对所述Session的评估参数对应的预设评级条件,判断与所述Session对应的搜索过程满意度级别,记录并输出所述搜索过程满意度级别。

B14、一种评估搜索行为满意度的装置,包括:

划分模块,用于基于预定的划分条件,对预定时间周期内的用户搜索行为日志进行Session划分以确定多个Session,所述Session为用户在预定时长内针对同一查询需求的搜索过程;

分析模块,用于依据预定的评估标准,对与任一Session相应的用户搜索行为日志进行分析,以确定针对所述Session的评估参数;

评价模块,用于基于所述评估参数来确定所述Session的评估结果。

C15、一种评估搜索行为满意度的服务器,包括处理器,所述处理器用于执行如A1~A13任一所述的评估搜索行为满意度的方法。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1