一种搜索结果页用户行为模式测评方法、装置及系统与流程

文档序号:14389951阅读:172来源:国知局
一种搜索结果页用户行为模式测评方法、装置及系统与流程
本发明属于搜索引擎结果页优化的
技术领域
,涉及一种搜索结果页用户行为模式测评方法、装置及系统,尤其是涉及一种基于多模特征的搜索结果页用户行为模式测评方法、装置及系统。
背景技术
:信息时代,互联网已渗入到各方各面,不仅表现为人们生活方式的改变,也使得企业营销策略等发生了巨大变化。人们获取信息的方式不断增多,企业传播信息的方式也不断增多,而其中最为重要的系统就是搜索引擎(searchengine)。搜索引擎是用户在有某种需求时通过搜索引擎的搜索框发出搜索任务,经由一定的策略和程序从网络上搜集信息,通过处理和组织后,按照一定的规则将相关信息以搜索引擎结果页(serp:searchengineresultspage)的固定模式展示给用户的应用系统。并且在搜索引擎结果页中常伴有搜索内容相关的商业推广,是互联网最为普遍的营销方式之一。由此可见,搜索引擎对人们的生活具有重要影响意义,合理的分析用户在搜索引擎结果页内的行为模式可以了解用户的日常行为习惯,更好的进行信息处理与商业推广的页面布局和排版设计。因此探索用户行为模式,不仅具有重要的研究价值,商业价值,也对系统设计人员具有重要指导意义。现阶段,针对搜索引擎结果页内用户行为的研究已有很多,研究人员大多通过挖掘用户的网络行为日志,或者是通过记录用户的光标信息的方式获取用户行为信息,然后进行相关分析、处理及推荐。但是,目前针对搜索引擎结果页内用户行为的研究主要存在以下缺点:(1)采用的信息源大多为主观性信息,不够准确;(2)虽然部分研究人员意识到上下文的作用,却甚少分析搜索结果页内不同区域间的相互作用关系,甚少分析不同类型用户在不同布局下常用的行为模式。综上所述,现有技术中针对搜索引擎结果页内如何科学、准确地测评用户行为模式,优化页面布局以提高用户体验的问题,尚缺乏行之有效的解决方案。技术实现要素:针对现有技术中存在的不足,解决现有技术针对搜索引擎结果页内如何科学、准确地测评用户行为模式,优化页面布局以提高用户体验的问题,本发明提供了一种搜索结果页用户行为模式测评方法、装置及系统,具体为一种基于多模特征的搜索结果页用户行为模式测评方法、装置及系统,通过多种类型的测试行为数据,分析搜索引擎结果页内在不同类型布局和不同类型用户下常见的用户行为模式,为优化页面布局,改善链接投放效果具有重要贡献。本发明的第一目的是提供一种搜索结果页用户行为模式测评方法。为了实现上述目的,本发明采用如下一种技术方案:一种搜索结果页用户行为模式测评方法,该方法包括:接收用户信息,根据用户信息中认知风格进行用户类型划分;接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;可视化处理测试行为数据并进行初步定性分析;分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。作为进一步的优选方案,所述接收用户信息前,根据视觉情况,剔除不适合眼动采集的用户,在剩余用户中随机选取若干用户进行搜索结果页用户行为模式测评。作为进一步的优选方案,所述用户信息包括用户基本信息和用户认知信息;所述用户基本信息包括用户的姓名、性别、年龄和职业;所述用户认知信息采用镶嵌图形测试法获取,包括认知风格。作为进一步的优选方案,所述测试行为数据为引擎结果页内用户的浏览过程中所产生的信息源数据,包括但不限于光标数据和眼动数据;所述光标数据为用户浏览搜索引擎结果页过程中获取的输入设备触发的光标事件;所述眼动数据为用户浏览搜索引擎结果页过程中获取的眼动追踪信息。作为进一步的优选方案,所述可视化处理测试行为数据并进行初步定性分析的具体步骤包括:将光标数据和眼动数据进行数据可视化;初步定性分析页面布局对所述眼动数据的影响。作为进一步的优选方案,所述分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析的具体步骤包括:采用与测评行为数据类型数量相同的频繁模式挖掘法,挖掘不同用户类型、页面布局下的光标行为模式,根据光标数据,分析搜索结果页内不同链接与用户类型、页面布局间光标行为的关联模式,和不同用户类型、页面布局下各链接内光标行为参数的组合模式;以及挖掘不同用户类型、页面布局下的眼动浏览模式,根据眼动数据得到用户浏览搜索引擎结果页过程中时序型信息,分析用户浏览搜索引擎结果页过程中各链接间的顺序关系。作为进一步的优选方案,采用频繁项集挖掘算法挖掘不同用户类型、页面布局下的光标行为模式;采用定向频繁浏览模式挖掘算法挖掘不同用户类型、页面布局下的眼动浏览模式,所述定向频繁浏览模式挖掘算法用于挖掘不同页面布局下用户定向定长的眼动浏览模式,得到用户行为进程中的时序型信息。作为进一步的优选方案,所述定向频繁浏览模式挖掘法包括:根据所述测试行为数据得到用户在搜索引擎结果页的浏览序列数据;在浏览序列数据中添加采纳长度和其对应的支持度属性,并初始化;处理每个浏览序列的支持度,使其为零,得到新序列;判断新序列是否为频繁序列,输出频繁序列。作为进一步的优选方案,在该方法中,预设链接区域范围,由所述测试行为数据中提取出用户进入每条链接区域范围内的时间。作为进一步的优选方案,所述根据所述测试行为数据得到用户在搜索引擎结果页的浏览序列的具体步骤包括:根据页面布局对所述测试行为数据进行粗分类;根据用户进入每条链接区域范围内的时间的先后顺序进行排列,每个用户查看每个网页都对应一条浏览序列数据。作为进一步的优选方案,所述处理每个浏览序列的支持度使其为零的具体步骤包括:预设支持度阈值;计算浏览序列数据首元素的支持度,将小于支持度阈值的首元素支持度置零并剔除该序列;对浏览序列数据按照首元素值进行排序后分类,创建与之相对应的队列,将序列按类别进入不同队列,并删除每个序列首元素;更新序列的采纳长度和其对应的支持度属性,直至每个序列中的元素都以支持度等于0结束为止。作为进一步的优选方案,判断新序列是否为频繁序列的具体步骤为:计算新序列的得分,所述得分为该序列的采纳长度与对应支持度的乘积;将得分进行排序,确定最大得分;最大得分对应的新序列为频繁浏览模式序列,否则,判定新序列为非频繁浏览模式序列。本发明的第二目的是提供一种计算机可读存储介质。为了实现上述目的,本发明采用如下一种技术方案:一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备设备的处理器加载并执行以下处理:接收用户信息,根据用户信息中认知风格进行用户类型划分;接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;可视化处理测试行为数据并进行初步定性分析;分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。本发明的第三目的是提供一种搜索结果页用户行为模式测评装置。为了实现上述目的,本发明采用如下一种技术方案:一种搜索结果页用户行为模式测评装置,采用互联网终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行以下处理:接收用户信息,根据用户信息中认知风格进行用户类型划分;接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;可视化处理测试行为数据并进行初步定性分析;分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。本发明的第四目的是提供一种搜索结果页用户行为模式测评系统。为了实现上述目的,本发明采用如下一种技术方案:一种搜索结果页用户行为模式测评系统,该系统基于上述一种搜索结果页用户行为模式测评方法,包括:用户信息采集装置、行为数据采集装置和行为模式测评装置;所述用户信息采集装置,用于采集用户信息,并发送至行为模式测评装置;所述行为数据采集装置,用于采集用户在搜索引擎结果页内的至少两种不同类型的测试行为数据,并发送至行为模式测评装置;所述行为模式测评装置,用于接收用户信息,根据用户信息中认知风格进行用户类型划分;接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;可视化处理测试行为数据并进行初步定性分析;分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。本发明的有益效果:(1)本发明所述的一种搜索结果页用户行为模式测评方法、装置及系统,,获取用户在搜索引擎结果页内的至少两种不同类型的测试行为数据,例如,用户的眼动数据和光标数据,通过搜索引擎结果页内用户的浏览过程中所产生的至少两种信息源特征进行频繁行为模式挖掘,分析页面布局、用户类型与搜索引擎结果页以及各项链接间的组合模式,以及时序关系,本发明对改善搜索引擎结果页内链接布局方式,个性化推荐信息,以及广告投放效果具有重要意义。(2)本发明所述的一种搜索结果页用户行为模式测评方法、装置及系统,集搜索引擎结果页内的多种信息源的行为信息,提出一种新颖的、定向定长的频繁浏览模式挖掘算法挖掘用户浏览过程中的频繁时序模式,并利用频繁项集挖掘算法挖掘用户的光标行为模式,为精确分析各种布局与用户类型下链接间的关系,优化页面布局,提升用户体验提供重要依据。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本发明中的方法流程图;图2是本发明行为数据采集实验中搜索引擎结果页示例图;图3是本发明行为数据采集实验中搜索结果页区兴趣域划分图:图4是本发明眼动行为扫视路径图;图5是本发明眼动行为热区图;图6是本发明眼动行为关键绩效指标图;图7是本发明认知因素作用下各链接点击行为关联规则图;图8是本发明页面布局因素作用下各链接点击行为关联规则图;图9是本发明中的系统结构示意图。具体实施方式:下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本申请所属
技术领域
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。针对现有技术中存在的不足,解决现有技术针对搜索引擎结果页内如何科学、准确地测评用户行为模式,优化页面布局以提高用户体验的问题,本发明提供了一种搜索结果页用户行为模式测评方法、装置及系统,通过多种类型的测试行为数据,分析搜索引擎结果页内在不同类型布局和不同类型用户下常见的用户行为模式,为优化页面布局,改善链接投放效果具有重要贡献。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面结合附图与实施例对本发明作进一步说明。实施例1:本实施例1的目的是提供一种搜索结果页用户行为模式测评方法。为了实现上述目的,本发明采用如下一种技术方案:如图1所示,一种搜索结果页用户行为模式测评方法,该方法包括:步骤(1):接收用户信息,根据用户信息中认知风格进行用户类型划分;步骤(2):接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;步骤(3):可视化处理测试行为数据并进行初步定性分析;步骤(4):分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。需要注意的是,在步骤(1)中所述接收用户信息前,根据视觉情况,剔除不适合眼动采集的用户,在剩余用户中随机选取若干用户进行搜索结果页用户行为模式测评。实验的被试用户为进行视觉情况筛选后的随机人群,裸眼或矫正视力为1.0以上,无影响眼动追踪实验进行数据采集工作的视觉疾病或障碍。在本实施例中,共招募了63名被试用户,男女比例1:1.2,用户年龄在18-21岁之间,平均年龄19.7岁。为了使得测试结果贴近实际情况,选取不同专业的学生。除此之外,所有被试人员都要经过视觉情况筛选,剔除裸眼视力或矫正视力小于1.0,以及色盲、色弱等影响实验眼动数据收集的被试。在步骤(1)中,所述用户信息包括用户基本信息和用户认知信息;所述用户基本信息包括用户的姓名、性别、年龄和职业;通过填写表格的方式采集用户基本信息;所述用户认知信息采用镶嵌图形测试法获取,包括认知风格。根据用户信息中认知风格进行用户类型划分。在本实施例中,搜索任务的类别随机选取,尽可能覆盖不同类型,比如:电视机、游乐园等。搜索引擎选取中文百度搜索引擎。考虑到网络不确定因素的影响,因此爬取与搜索任务对应的搜索引擎结果页,然后对搜索结果页进行纯净化,即只保留十条结果链接以及右侧相关推荐。然后通过人工添加的方式在结果链接列表的上方、下方及右侧添加广告链接。本发明搜索结果页示例图2所示。按照链接划分成12个兴趣区域(十条结果链接所在兴趣区域1-10,广告链接所在兴趣区域ad,右侧相关推荐所在兴趣区域r)。本发明搜索结果页兴趣区域划分图如图3所示。其中l1、l2及l3分别表示广告位于结果链接列表上方、下方和右侧的商业推广布局情况。在步骤(2)中,所述测试行为数据为引擎结果页内用户的浏览过程中所产生的信息源数据,包括但不限于光标数据和眼动数据;在本实施例中,采集光标数据和眼动数据这两种信息源的行为信息。所述光标数据为用户浏览搜索引擎结果页过程中获取的输入设备触发的光标事件;在本实施例中,通过在搜索引擎结果页内嵌入javascript代码获取用户浏览搜索引擎结果页过程中所产生的光标数据。需要注意的是,在本实施例中,输入设备可以针对搜索结果页一个元素或多个元素,触发一系列光标事件,包括但不限于,例如,光标左键单击、光标右键单击、光标滚轮滚动或光标移动控制光标移动等的光标事件,或者再例如,回车确认事件、菜单弹出事件或方向键滚动事件等键盘事件,或者再例如,触摸板滑动控制光标移动、触摸板左键单击或触摸板右键单击等触摸板事件,或者再例如,对于触摸式终端装置,触摸屏滑动控制页面移动或触摸屏单击等触摸屏事件。所述眼动数据为用户浏览搜索引擎结果页过程中获取的眼动追踪信息。在本实施例中,运用眼动追踪方式获取用户浏览搜索引擎结果页过程中所产生的眼动数据。在本实施例中,眼动追踪装置为德国普升科技有限公司研发的smired(version2.5)眼动仪,选取的采样频率为120hz。需要注意的是,使用该装置时,被试要求将头部固定在桌子边缘的u型支架内,实验过程中不可随意移动头部。正式实验前,对用户进行两次眼动校准工作,两次均达标才可继续进行实验。在本实施例中,眼动行为的记录和初步定性分析过程使用眼动仪自带的iviewx,experimentcenter和begaze,频繁模式挖掘使用matlabr2014a。在本实施例中,采集的所述测试行为数据具体步骤为:步骤(2-1)实验前准备:需要向用户介绍实验的基本步骤,硬件设备的使用规则,实验期间的具体注意事项以及眼部校准工作;步骤(2-2)采集眼动数据:在用户浏览搜索引擎结果页期间按照眼动追踪装置的使用规则要求被试,获取浏览过程中产生的眼动数据;步骤(2-3)采集光标行为数据:在用户需要浏览的搜索引擎结果页内嵌入相应到的javascript代码,记录用户浏览过程产生的光标行为数据;在本实施例中,采集用户行为数据的场景设计为:为使实验结果更符合实际情况,本发明设计的测评场景是:给定用户一定量的搜索任务,被试通过屏幕显示了解搜索任务简介,理解信息后按动空格键开始搜索结果页浏览,浏览过程与实际生活一样,可以进行光标的滚动、滑动与点击。每个搜索结果页浏览结束后关闭浏览器,下一个搜索任务简介自动弹出。运用眼动追踪方式获取用户在浏览网页过程中无意识的注意信息,通过网页中嵌入的javascript代码获取用户的光标信息。采用6(搜索任务)×3(页面布局)×2(认知风格)的设计,为了防止用户疲劳,这里定义的搜索任务6项为最大值,用户可以根据自身情况随时停止。在本实施例中,共计获得了319条用户浏览搜索结果页的眼动和光标行为信息,数据汇总如表1所示。表1在步骤(3)中,所述可视化处理测试行为数据并进行初步定性分析的具体步骤包括:步骤(3-1):将光标数据和眼动数据进行数据可视化;步骤(3-2):初步定性分析页面布局对所述眼动数据的影响。在本实施例中,眼动数据采用begaze眼动分析软件进行数据可视化,如图4所示的扫视路径图、图5所示的热区图,图6所示的关键绩效指标图。光标数据采用excel表格展示,表2所示为点击行为纪要表,通过这些可视化数据图进行初步定性分析。可以发现用户对于搜索引擎结果页内页面上方注视较多,商业推广对用户的吸引力较强,但右侧广告对用户的吸引力相比上方和下方的商业推广较小。表21l1dependence59102l1dependence123673l1independence25104l1independence2468r5l1dependence1349ad6l1independence25797l1independence1348l1dependence29ad9l1dependence134710l2dependence346711l2dependence7812l2dependence26r13l2independence23ad14l2independence34689ad15l2dependence4ad16l2independence23ad17l2dependence2418l2independence25919l3dependence4567891020l3independence1234781021l3independence14522l3dependence23223l3dependence15924l3dependence1525l3independence1257r26l3independence49在步骤(4)中,所述分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析的具体步骤包括:采用与测评行为数据类型数量相同的频繁模式挖掘法,挖掘不同用户类型、页面布局下的光标行为模式,根据光标数据,分析搜索结果页内不同链接与用户类型、页面布局间光标行为的关联模式,和不同用户类型、页面布局下各链接内光标行为参数的组合模式;以及挖掘不同用户类型、页面布局下的眼动浏览模式,根据眼动数据得到用户浏览搜索引擎结果页过程中时序型信息,分析用户浏览搜索引擎结果页过程中各链接间的顺序关系。在本实施例中,采用频繁项集挖掘算法挖掘不同用户类型、页面布局下的光标行为模式;采用定向频繁浏览模式挖掘算法挖掘不同用户类型、页面布局下的眼动浏览模式,所述定向频繁浏览模式挖掘算法用于挖掘不同页面布局下用户定向定长的眼动浏览模式,得到用户行为进程中的时序型信息。(4-1)光标行为模式分析:使用频繁模式挖掘算法分析搜索结果页内不同链接(包括十条结果链接、广告链接以及相关推荐)与两种因素(用户类型即用户认知方式、页面布局)间光标行为的关联模式,了解与两种因素紧密相关的链接及组合模式,建立认知方式、页面布局与各条链接间的关系;针对用户认知方式和页面布局两种因素分别展开讨论,光标行为参数较多,这里仅以具有代表性的点击特征为例:用户类型影响分析(即用户认知影响分析):根据点击行为数据,按照用户认知方式对数据进行分类,挖掘每类中的点击特征的频繁项集,分析用户认知风格和搜索引擎结果页内各链接之间的关联规则,了解不同认知下各链接内点击行为参数的组合模式。页面布局影响分析:根据点击行为数据,按照页面布局即广告位置对数据进行分类,挖掘每类中的点击特征的频繁项集,分析页面布局和搜索引擎结果页内各链接之间的关联规则,了解不同位置下各链接内点击行为参数的组合模式;在本实施例中,采用多种频繁模式挖掘的经典方法分析搜索引擎结果页内不同兴趣区域的点击行为和认知风格、广告位置间的频繁项集与关联规则。由于不同算法下的结果大同小异,因此只给出最经典的频繁模式挖掘apriori算法下的运行结果。图7和图8分别表示计算出的搜索引擎结果页上各个兴趣区域的点击行为与不同认知风格、广告位置的关联规则(minsup=0.03,minconf=0.4)。为了方便展示,本发明将关联规则中项目之间的连接可视化为一个有向图。首先,需要生成规则前因和后项的邻接矩阵,该矩阵为稀疏矩阵,矩阵里的元素值为前因和后项间的关联度。然后,使关联规则中的前因作为有向图的前驱,关联规则中的后项作为有向图中相应前因的后件。以图8中加粗连接线为例,表示{7}{2}→{independence},{7}→{independence},{7}{2}→{dependence}都是满足阈值的关联规则。分析用户认知因素作用下,场独立型认知风格点击行为的频繁项集中项的维度要明显大于场依赖型认知风格。这说明场独立型用户在浏览网页时,主观能动性较强,不拘泥于一定范围,整体意识性强;场依赖型用户在此过程中有相对固定的浏览区域,模式也相对固定。分析页面布局因素作用下,可以看出广告位于l1和l3位置时频繁项集中项的维度要明显大于广告位于l2。l1处的布局格式影响到的项最多,对广告的影响力也较大。l2处的布局格式影响到的项最少,但对广告的影响力较大。这与步骤(3)初步定性分析的结论相呼应。(4-2)眼动浏览模式分析:本实施例提出了定向频繁浏览模式挖掘算法dfbp(directionalfrequentbrowsingpatterns),用于挖掘不同页面布局下用户定向定长的浏览模式,了解用户行为进程中的时序型信息,结合实际情况分析用户浏览过程中各链接间的顺序关系;在所述步骤(4-2)中,眼动浏览模式分析的dfbp算法具体步骤为:步骤(4-2-1):依照广告位置对采集到的数据进行粗分类,每个类均根据采集到的用户首次进入每个兴趣区域内时间的先后顺序进行排列,每个用户查看每个网页都对应一条浏览模式序列qi;例如:广告位置,包括:网页的顶部、网页的中部或网页的底部;每个用户查看每个网页都对应一条浏览模式序列:例如,打开百度,输入检索词,对应检索词有10条检索链接,编号分别是1-10,对于广告区域,定义为ad,检索词相关区域,定义为r;假设,用户的眼睛浏览顺序分别是ad、1、2、3、12、4、5、6、8、7、9、10;那么该用户的浏览模式序列就是:11→1→2→3→12→4→5→6→8→7→9→10;假设,用户的眼睛浏览顺序分别是1、2、3、ad、4、5、6、7、8、9、10、r;那么该用户的浏览模式序列就是:1→2→3→ad→4→5→6→7→8→9→10→r;假设,用户的眼睛浏览顺序分别是ad、2、3、4、5;那么该用户的浏览模式序列就是:ad→2→3→4→5;步骤(4-2-2):为步骤(4-2-1)得到的所有数据添加三个属性并初始化:被采纳长度l=(l1,l2,…,lp),支持度序列s=(s1,s2,…,sp),l1=0,s1=0,支持度阈值s;元素的支持度,举例:元素的支持度记为元素的频繁度,当一个数据集内有300条数据,首元素为11的有30条,此时首元素的支持度30;首元素一致的前提下,第二个元素为1的有10条,此时第二个元素的支持度为10;前两个元素一致的前提下,第三个元素为2的有7条,此时第三个元素的支持度为7,以此类推。被采纳长度,举例:被采纳长度,了解某序列的具备频繁条件的具体长度信息。序列从首元素开始计算其支持度,若大于支持度阈值则l1=1,l=(1),继续进行,否则l1=1,l=(0),结束;当l1=1时,计算第二个元素的支持度,若大于支持度阈值,则l2=2,l=(1,2),继续进行,否则保持l1=1,l=(1)不变,结束;当l2=2时,计算第三个元素的支持度,若大于支持度阈值则l3=3,l=(1,2,3),重复该步骤,否则保持不变,结束。例如,浏览模式序列11→1→2→3→12→4→5→6→8→7→9→10,支持度阈值s=8。首元素ad的支持度为30>8,则l1=1,l=(1);第二个元素1的支持度为10>8,则l2=2,l=(1,2);第三个元素2的支持度为7<8,则保持l2=2,l=(1,2)不变,结束。支持度序列,举例:支持度序列,了解某序列的具体频繁度信息。从首元素开始计算第一个元素的支持度,当一个数据集内有300条数据,首元素为ad的有30条,此时首元素的支持度s1=30,s=(30);首元素一致的前提下,第二个元素为1的有10条,此时第二个元素的支持度为s2=10,s=(30,10);前两个元素一致的前提下,第三个元素为2的有7条,此时第三个元素的支持度为s3=7,7<s,结束,s=(30,10)保持不变,若第三个元素满足大于支持度阈值则以此类推。频繁度阈值,举例:频繁度阈值,通过经验调试出的,比较适合当前数据集大小的一个数值。当一个元素的支持度大于该数值时,即被认为该元素是频繁的,这里令s=8。步骤(4-2-3):计算序列首元素的支持度sj,若sj<s,则令序列sj=0并剔除该序列;例如,当前数据集内有30条数据的首元素是一样的,如ad,那么该首元素的支持度sj=30计算序列首元素的支持度sj步骤(4-2-4):对剩余序列按照首元素值从大到小进行排序,创建与排序后每个首元素相对应的队列g1,g2,…,gt,将序列按类别进入不同队列,并删除每个序列首元素;步骤(4-2-5):更新序列的l和s属性,为l和s分别添加lj+1=lj+1,sj+1,原始l=(l1,l2,…,lj),s=(s1,s2,…,sj),更新后为l=(l1,l2,…,lj,lj+1),s=(s1,s2,…,sj,sj+1);步骤(4-2-6):重复步骤(4-2-3)和(4-2-4),直至每个序列中的元素都以支持度等于0结束为止;步骤(4-2-7):计算每个序列的得分fi=li*si,从fi中找到最大得分maxfi,最大得分对应的序列为频繁浏览模式序列,输出浏览模式序列qi,否则,判定序列为非频繁浏览模式序列。如表3所示的三种布局下使用dfbp算法得到的用户最常见的五种浏览模式。观察l1布局下的浏览序列,发现用户浏览初期如果检测到广告时,用户将优先检测广告,然后按序浏览;如果用户初期未检测广告,用户将按顺序浏览url。l2布局时广告位于下方,用户自然按顺序浏览。l3布局时广告位于右侧,用户通常按照习惯先观察url,但通常右侧广告图片大、颜色鲜艳,刺激力度大,所以在1、2号url后,用户注意力将被右侧广告吸引。表3观察三种不同布局,可以看出不同布局下,用户浏览模式大致是呈现自上而下型。并且还可以发现,很多时候用户首先注视到的区域为2号位url,之后反溯到1号位。结合实际,这种情况应该是由于用户在使用电脑进行搜索、浏览时,打开新网页会有一定的时间间隔,而这段间隔会使用户视线重置到屏幕中间区域,加之用户通过日常积累了解到结果主要在页面左侧排列,因此用户首先注视2号位的url,了解后用户将重新按序阅读过程。本实施例将运用眼动追踪方式获取用户在浏览网页过程中无意识的注意信息,通过网页中嵌入的javascript代码获取用户的光标信息。本发明将提出一种新颖的、定向定长的定向频繁浏览模式挖掘算法dfbp用于挖掘频繁时序模式,并利用频繁项集挖掘算法挖掘用户的光标行为模式。通过眼动特征和光标特征,分析搜索引擎结果页内在不同类型布局和不同类型用户下常见的用户行为模式,为优化页面布局,改善链接投放效果具有重要贡献。实施例2:本实施例2的目的是提供一种计算机可读存储介质。为了实现上述目的,本发明采用如下一种技术方案:一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备设备的处理器加载并执行以下处理:接收用户信息,根据用户信息中认知风格进行用户类型划分;接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;可视化处理测试行为数据并进行初步定性分析;分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。在本实施例中,计算机可读记录介质的例子包括磁存储介质(例如,rom,ram,usb,软盘,硬盘等)、光学记录介质(例如,cd-rom或dvd)、pc接口(例如,pci、pci-expres、wifi等)等。然而,本公开的各个方面不限于此。实施例3:本实施例3的目的是提供一种搜索结果页用户行为模式测评装置。为了实现上述目的,本发明采用如下一种技术方案:一种搜索结果页用户行为模式测评装置,采用一种互联网终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行以下处理:接收用户信息,根据用户信息中认知风格进行用户类型划分;接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;可视化处理测试行为数据并进行初步定性分析;分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。本领域技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。实施例4:本实施例4的目的是提供一种搜索结果页用户行为模式测评系统。为了实现上述目的,本发明采用如下一种技术方案:如图9所示,一种搜索结果页用户行为模式测评系统,该系统基于上述一种搜索结果页用户行为模式测评方法,包括:用户信息采集装置、行为数据采集装置和行为模式测评装置;所述用户信息采集装置,用于采集用户信息,并发送至行为模式测评装置;所述行为数据采集装置,用于采集用户在搜索引擎结果页内的至少两种不同类型的测试行为数据,并发送至行为模式测评装置;所述行为模式测评装置,用于接收用户信息,根据用户信息中认知风格进行用户类型划分;接收用户在搜索引擎结果页内的至少两种不同类型的测试行为数据;可视化处理测试行为数据并进行初步定性分析;分别挖掘不同用户类型、页面布局下的用户不同类型的行为模式进行分析,评价搜索结果页用户行为模式。所述用户信息采集装置是利用表格统计形式采集用户基本信息,并通过镶嵌图形测试获取用户认知信息。所述行为数据采集装置,具体包括:眼动数据采集模块,被配置为使用眼动追踪装置获取用户浏览搜索引擎结果页过程中所产生的眼动数据;在本实施例中,眼动追踪装置为德国普升科技有限公司研发的smired(version2.5)眼动仪,选取的采样频率为120hz。光标数据采集模块,被配置为在搜索引擎结果页内嵌入javascript代码获取用户浏览搜索引擎结果页过程中所产生的光标数据。所述行为模式测评装置,具体包括:初步定性分析模块:将获取到的数据进行可视化处理,通过得到的可视化数据图进行初步定性分析不同因素、不同信息源下搜索结果页内各条链接间映射关系;光标行为模式分析模块,被配置为通过捕获的光标数据,使用频繁项集挖掘算法,挖掘不同用户类型和不同布局下常见的光标行为模式,并结合实际说明结果;眼动行为模式分析模块,被配置为根据获取的眼动数据,利用频繁浏览模式挖掘算法,挖掘不同用户类型和不同布局下具有时序性的用户常见浏览模式,分析用户认知方式和各项链接间的组合关系,并结合实际说明结果。本发明的有益效果:(1)本发明所述的一种搜索结果页用户行为模式测评方法、装置及系统,,获取用户在搜索引擎结果页内的至少两种不同类型的测试行为数据,例如,用户的眼动数据和光标数据,通过搜索引擎结果页内用户的浏览过程中所产生的至少两种信息源特征进行频繁行为模式挖掘,分析页面布局、用户类型与搜索引擎结果页以及各项链接间的组合模式,以及时序关系,本发明对改善搜索引擎结果页内链接布局方式,个性化推荐信息,以及广告投放效果具有重要意义。(2)本发明所述的一种搜索结果页用户行为模式测评方法、装置及系统,集搜索引擎结果页内的多种信息源的行为信息,提出一种新颖的、定向定长的频繁浏览模式挖掘算法挖掘用户浏览过程中的频繁时序模式,并利用频繁项集挖掘算法挖掘用户的光标行为模式,为精确分析各种布局与用户类型下链接间的关系,优化页面布局,提升用户体验提供重要依据。以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1