动态热点跟踪的方法

文档序号:6472088阅读:254来源:国知局
专利名称:动态热点跟踪的方法
技术领域
本发明涉及一种动态热点跟踪的方法,是一种电数字数据处理的方法,是 一种用于电数字数据信息网络的方法,是一种为网站运营者提供改进网站的方 法。
背景技术
网络已经成为人们生活中必不可少的东西,是现代人获取信息的重要途径 之一。其重要性将要超过最重要的媒体一一电视对人们的影响。网络引起了广 告商的极大兴趣。如何有力的使用网络这一重要的传播媒介,进行广告宣传, 如何帮助网络运营者了解用户心里,藉以改善网站的布局和质量,增加点击率, 最终吸引广告商,使网站运营者获利?目前,已有一些网站尝试对网页浏览者 (用户)的点击习惯进行记录和分析,从中获取该用户的一些喜好,提供个性 化网页和相应的广告。这种方法虽然可以取得一些效果,但远远不够。因为用 户对感兴趣的东西有时并不点击,仅仅统计点击率,往往不能准确的判断浏览 者的喜好。

发明内容
本发明要解决的技术问题是提出 一种动态热点跟踪的方法,所述的方法根 据用户鼠标轨迹识别该用户的兴趣,判断该用户的属性,例如性别、来源等, 跟踪单个用户或者群体用户对网站的所有访问路径,提取点击频度形成热点分 布特征,实时绘制以用户网站截图为背景的多维度抽象点击区域,并跟随用户 的访问轨迹进行动态展现。本发明解决上述技术问题所釆取的技术方案是 一种动态热点跟踪的方法,
所述的方法使用互联网、提供网页服务的网站、浏览网页的用户终端、分析系
统,其特征在于所述方法的运行步骤如下
用户在用户终端《连冲矣网站的网页;
网站向用户传送网页时传送数据收集器;
数据收集器向分析系统传输首次访问数据,建立新用户档案;
分析系统接收数据并建立所述用户的用户模型;
获取用户正在访问的网页页面截用户浏览网页,对页面上的多个链接或图片进行点击;
所述的数据收集器传输点击数据,包括鼠标点击位置、点击顺序、访问 内容、页面停留时间;
分析系统接收数据,根据用户点的击位置、点击顺序、访问内容、页面停 留时间分析所述用户的来源和兴趣类型;
根据来源、兴趣类型分析用户特征,包括性别、年龄范围、爱好、习惯;
重复多次数据收集和分析,生成网站热点开启用户动态跟踪;
用户在用户终端继续访问其他网站;
数据收集器继续传输用户数据;
分析系统继续分析用户特征;
根据分析的结果动态更新网站热点图的热区变化。
本发明产生的有益效果是本发明通过在用户网站上放置一个数据收集器, 可以收集用户在网站上鼠标行为,例如点击、移动、徘徊等。同时收集用户访问的来源网站、当前访问的网页内容、用户在该网页上的停留时间即浏览路 径等,之后结合鼠标在网站上点击的坐标,进行抽象整合,形成基于鼠标轨迹 和点击,以及用户属性的热区图。并且根据时间的推移,进行热区图的更新。 当有新用户访问时,可直接在该热区图上动态呈现出来。


下面结合附图和实施例对本发明作进一步说明。
图1是本发明实施例一所述方法所使用的系统及信息流向示意图2是本发明实施例一所述方法的运行框图3是本发明实施例一所述方法形成的网站热点图。
具体实施方式
实施例一
本实施例是一种动态热点跟踪的方法,本实施例使用互联网、提供网页服 务的网站、浏览网页的用户终端、分析系统,整个系统如图1所示。本实施例 所述的互联网包括局域网和广域网。网站指的是提供各种网页服务的服务商, 按本实施例所述方法提供的对象主要是提供各种信息服务的网页服务商。用户 终端是指最终的网页用户,而不是指小型局域网的节点。分析系统安装在专门 提供分析服务的服务商的服务器中,该服务商为网页服务商广告商提供用户群 体的分析信息,以便网页提供商和广告商改善网页布局和质量。
本实施例的基本思路是当用户浏览一个网站时,根据用户鼠标轨迹识别 用户兴趣、判断访问者的基本属性(如性别、来源等),跟踪单个用户或者群体 用户对网站的所有访问路径,提取点击频度形成热点分布特征,实时绘制以用 户网站截图为背景的多维度抽象点击区域,并且跟随用户的访问轨迹进行动态 的展现。具体做法是通过在用户的网站上放置一个Javascript脚本作为数据收集器,JavaScript脚本为一种专门用于在网页上执行程序的轻量级程序代码, 用户访问网站后,该脚本程序将下载到用户的电脑上,进行解释执行,执行结 果可以直接作用于网页上。通过使用一种基于Javascript和XML的异步网页交 互技术-AJAX,可以在用户打开网页后,浏览器后台自动将用户的相关数据通 过HTTP GET方式传输到指定的服务器,而不影响用户的正常网页操作。 本实施例是通过如下运行步骤而实现的,流程框图见图2:
1) 用户在用户终端链接网站的网页。这一步骤就是用户登录网页,类似于 启动一个程序。
2) 网站向用户传送网页时传送数据收集器。用户登录任何一个网页,为使 用户可以顺利的浏览该网页,服务商通常都要将一些应用软件安装在用户的终 端上。本步骤所述的数据收集器就是这样一个小软件,数据收集器是一个 Javascript脚本,在页面后台运行,不会在页面上形成任何附加的痕迹。 Javascript脚本可以认为是一个传感器,收集用户鼠标的运动轨迹,并将鼠标 运动的轨迹转换为数据发送给分析系统。
3) 数据收集器向分析系统传输首次访问数据,建立新用户档案。对每个特 定的用户,都要建立档案以便进行分析。
4) 分析系统接收数据并建立所述用户的用户模型。分析系统在建立用户档 案后利用数据收集器初次传来的数据建立用户模型,这些用户模型包括用户的 初始访问时间、给该用户分配的唯一标识、该用户浏览网站使用的用户名、用 户访问该网站的频度、用户的浏览习惯、用户的来源、用户感兴趣的内容等, 这只是包含非常初级的用户原始数据,用以对该用户进行跟踪。
5) 获取用户正在访问的网页页面截图。建立用户才莫型后,分析系统将用户正在访问的网页全幅截图,即将所访问的网页的界面制作为图片格式的图像数 据储存起来,以便后续分析使用。
6) 用户浏览网页,对页面上的多个链接或图片进行点击。本步骤实际是用 户对网页进行浏览、阅读,看到感兴趣的内容就点击,以便进一步了解该条标 题信息的具体情况。
7) 所述的数据收集器传输点击数据,包括鼠标点击位置、点击顺序、访 问内容、页面停留时间。本步骤是鼠标数据收集器所收集的鼠标运动轨迹的重 要数据。这些数据包括的内容是
*用户在该页面上鼠标点击的坐标(以屏幕左上角为原点);
*用户访问的来源网站;
*用户当前访问的网页;
*用户访问的内容;
*用户在给页面上的停留时间。
8) 分析系统接收数据,根据用户的点击位置、点击顺序、访问内容、页面 停留时间分析所述用户的来源和兴趣类型。分析系统根据数据收集器发来的数 据对用户的来源和兴趣类型进行分析。所谓来源就是用户是从那个网站的链接 过来的,还是初始登录,以此分析用户使用的是什么初始默认网页,并以此分 析用户的类型。用户的类型通常是
首次访问新用户;
老用户(本周访问过的用户);
忠诚用户(连续3周每周至少访问过5次的用户);
9) 根据来源、兴趣类型分析用户特征,包括性别、年龄范围、爱好、习惯。
10) 根据数据收集和分析,生成网站热点图。本实施例将收集和分析的结 果用网站热点图的方式表达出来。收集和分析的结果还可以用其他方式表达, 例如用表格、直方图、频谱图等等形式,或者直接用文字叙述。本实施例采取 的方式是网站热点图的方式,这种方式最为直观,可以一目了然的表达用户的 兴趣所在。网页热点图可以使用主页以及网站的任意页面,对主页全幅图后在
该网页上标出热点的位置,如图3所示,图3中画面上不规则的片状就是热点。
具体的做法就是系统接到数据收集器收集的数据后,根据特有的算法,结合鼠 标在网站上以屏幕左上角为原点的坐标,进行相邻区域整合,形成基于鼠标点 击和用户属性。这种方法类似于卫星云图的可视化网页热点图,热点图是把每 个点击的坐标对应成网页屏幕上的一个像素点,根据一定的规则绘制的图片。
11) 开启用户动态跟踪。
这里的跟踪指的是首先对该用户进行唯一的标识,并依赖cookie (cookie
含有该用户的唯一标识码,该唯一标识码由Javascript脚本动态生成,并且分 配给用户。
以后用户再次访问该网站的时^f矣,Javascript扭p本会首先辨识用户cookie 存在的唯一标识码,将其传递给服务后台,服务后台程序因此可以根据此唯一 标识码与其系统已经收集过的用户列表进行匹配,并在存储该用户所有信息的 时候,都会同时存入该唯一标识码,用户以后对该用户进行独立的分析。
用户在主页点击链接进入网站的其他网页后还会进入更深入的网页,所以 还需要进一步跟踪用户的浏览行程。12) 用户在用户终端继续访问其他网站。这是用户离开已经访问的网站, 通过链接对其他网站的访问,因此也要继续跟踪。
13) 数据收集器继续传输用户数据。随着用户继续访问其他网站的网页。
14) 分析系统继续分析用户特征。
15) 根据分析的结果动态更新网站热点图的热区变化。根据时间的推移, 进行热区图的变化,当有全新的访客,即一个从没有访问过该网站的新用户访 问网站该页面时,系统将自动收集数据进行处理,直接在该热区图上迭代运算, 从而动态呈现出来最新的热区图,以实现动态跟踪。
通过这个动态变化的网站热点图,网站运营者可以通过掌握用户点击的习 惯,很容易找寻自己有价值的广告位,以赢取更大的利益,同时发现现有网站 版式中不合理的地方,以进行针对性的改进。对于电子商务的运营者,可以通 过设计更合理的商品布局,简化用户操作的流程以提高订单的成功率和客户的 满意度。
实施例二
本实施例是实施例一的改进,本实施例是网站热点图的细化。本实施例所 述的生成网站热点图包括以下子步骤
1)用色阶模式初始化一组颜色点阵,初始化索引调色盘。
色阶模式与RGB (人眼能识别的彩色图像)不同,色阶是指去除各种颜色 之间的差异,纯粹的亮度信息。
索引调色盘与RGB相对,每种颜色并不存储颜色本身的信息,而是将RGB 映射到某一个序号(索引)上。使用这样的方法使图像合并时,非透明区域不 会相互覆盖而是融合。2) 对点击数据进行预处理,包括有效性验证、合并相近数据以及建立数
据索引。
有效性验证使用一些规则验证点击数据是否可以用于处理。这些规则包 括是否超出页面的边界,浏览器类型是否符合要求等等。
合并相近数据将坐标距离小于一定阀值的点的数据合并成一个数据,达 到加速处理以及增强视觉说明力的效果。
数据索引对数据进行一定的排序、分类处理,使处理时能够在最短的时 间内得到需要的数据。
3) 扫描所述网页面上所有的点击数据,获得该页面不同区域的平均点击数。
4) 根据公式H (x, y) =Sum (x-n, y-n, x+n, y+n) /n4十算该页面各热点的绝对平 均热度,根据公式h(x,y)=H(l..n, 1…m)/Max(H(l…n), (l...m))计算该热点的 相对平均热度。
公式中的字母 x, y坐标值(像素); n区域尺寸(像素); H(x, y)某点的热度值;
Sum(l,t,r,b)耳又得以l,t左上角坐标,以r, b为右下角坐标举行范围内点
击数的和;
n2:区i或的面积。
5) 根据每个点的相对平均热度使用公式
C (x, y) =RGB {h (x, y) x 255, h (x, y) x 255, h (x, y) x 255} 计算出该点对应的索引色值,得到热点数据索引图。6) 使用调色盘将索引图从索引模式转换到RGB模式。
因为索引图只是为了能够对相互重叠的点进行合并,而不会相互覆盖而使
用的图像模式,其图像不是人类直接可读的,所以必须转变为人类可读的RGB 图片(普通彩色图片)。
7) 对RGB图像进行锐化处理,生成原始热点图。锐化处理是图像处理的标 准形式,可以使图片中的各个图像元素的边缘更加清晰。
8) 将生成的原始热点图合并到页面截图上,从而获得最终的网站热点图。 获得的网站热点图可以作为网页提供商或广告商的客户分析的依据。
权利要求
1. 一种动态热点跟踪的方法,所述的方法使用互联网、提供网页服务的网站、浏览网页的用户终端、分析系统,其特征在于,所述方法的运行步骤如下用户在用户终端链接网站的网页;网站向用户传送网页时传送数据收集器;数据收集器向分析系统传输首次访问数据,建立新用户档案;分析系统接收数据并建立所述用户的用户模型;获取用户正在访问的网页页面截图;用户浏览网页,对页面上的多个链接或图片进行点击;所述的数据收集器传输点击数据,包括鼠标点击位置、点击顺序、访问内容、页面停留时间;分析系统接收数据,根据用户的点击位置、点击顺序、访问内容、页面停留时间分析所述用户的来源和兴趣类型;根据来源、兴趣类型分析用户特征,包括性别、年龄范围、爱好、习惯;重复多次数据收集和分析,生成网站热点图;开启用户动态跟踪;用户在用户终端继续访问其他网站;数据收集器继续传输用户数据;分析系统继续分析用户特征;根据分析的结果动态更新网站热点图的热区变化。
2. 根据权利要求1所述的一种动态热点跟踪的方法,其特征在于,所述的 生成网站热点图过程包括以下子步骤1)用色阶模式初始化一组颜色点阵,初始化索引调色盘;2) 对点击数据进行预处理,包括有效性验证、合并相近数据以及建立数 据索引;3) 扫描所述网页面上所有的点击数据,获得该页面不同区域的平均点击数;4) 根据/>式H (x, y) =Sum (x-n, y-n, x+n, y+n) /n2计算该页面各热点的绝对平 均热度,根据公式h(x, y)=H(l. .n, l...m)/Max (H (l...n) , (l...m))计算该热点的相 对平均热度;5) 根据每个点的相对平均热度使用公式C(x, y)=RGB{h(x, y) x 255, h(x, y)x 255, h(x,y)x 255) 计算出该点对应的索引色值,得到热点数据索引图;6) 使用调色盘将索引图从索引模式转换到RGB模式;7) 对RGB图像进行锐化处理,生成原始热点图;8) 将生成的原始热点图合并到页面截图上,从而获得最终的网站热点图。
全文摘要
本发明涉及一种动态热点跟踪的方法,是一种电数字数据处理的方法。所述的方法的运行步骤包括用户链接网站的网页;传送数据收集器;传输首次访问数据,建立新用户档案;建立用户模型;获取页面截图;用户浏览网页;传输点击数据;接收数据,分析用户的来源和兴趣类型;分析用户特征;生成网站热点图;开启用户动态跟踪;用户继续访问其他网站;继续传输用户数据;继续分析用户特征;更新网站热点图的热区变化。本发明通过在用户网站上放置一个数据收集器,收集用户在网站上鼠标行为。同时收集用户访问的来源网站、当前访问的网页内容、用户在该网页上的停留时间即浏览路径等,进行抽象整合,形成基于鼠标轨迹和点击,以及用户属性的热区图。
文档编号G06F17/30GK101446979SQ200810246709
公开日2009年6月3日 申请日期2008年12月26日 优先权日2008年12月26日
发明者丹耀·克雷顿, 昆 赵, 赵武阳 申请人:北京科尔威视网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1