互联网数据信息点击量的统计方法和装置的制作方法

文档序号:7659993阅读:232来源:国知局

专利名称::互联网数据信息点击量的统计方法和装置的制作方法
技术领域
:本发明涉及计算机互联网数据信息的统计技术,特别涉及互联网数据信息点击量的统计方法和装置。
背景技术
:随着互联网信息服务的发展,在网站经营领域,互联网数据信息的点击量备受网站经营者、广告商、网民的关注,这里的互联网数据信息包括网站上各种各样的新闻、广告、文章、图片、动画等,而新闻、广告、文章、图片、动画这样的网站元素称为统计粒度。对于网站经营者来说,互联网数据信息的点击量是网站发展进行决策的依据。如,什么样的信息最受用户的欢迎,增加或者减少互联网数据信息服务内容对用户点击量的影响如何,不同用户对互联网数据信息有什么样的需求等。对于广告商来说,由于对广告受众把握的不确定性而造成广告的盲目招J改,统计分析广告的点击量能有效解决广告浪费的问题。对站点访问情况进行详细分析,能帮助企业更好地作出商务决策。对制造商而言,统计点击量可决定某类产品是否有继续生产的必要,或对站点进行针对性改造完善,使之更具吸引力,并让客户和企业内部用户能实现高效访问。目前出现了各式各样的统计分析互联网数据信息的工具,比如日志分析软件,流量统计系统,网站决策支持系统等等,这些工具可以部分的解决上面提到的问题,但同时也存在很多局限性。曰志分析软件如WebTends、Http-analyze、wwwstat、Webalizer等,这些曰志分析软件对IIS(Internet信息服务)的分析很到位,将在某一时段内网站上所有被访问过的URL地址(UniformResourceLocator,统一资源定位符)列出来,根据设定的阈值,将大于阈值的页面或者链接的点击量显示出来,将其他的页面或者链接的点击量数值丢弃。从上面的分析可以看出,这种分析方法只能列出前几十位点击量较大的页面或者链接。如果用户想要获得一个点击量不是很高的广告页面的点击分析,这些工具就不能满足要求。拓基科技流量统计系统(tjCount)是一款运行在PHP环境下的统计软件,其统计功能包括IP统计,点击量统计,最新N位访客详情(包括访问时间,IP地址,地理位置,访问页面,来源等统计),地域统计分片斤,来路统计分4斤,页面统计分析,当前在线人数,及在线访客详情(包括最新访问时间,IP地址,地理位置,所在页面,来源等信息)等。PHPStat网站决策支持系统也是一款运行在PHP+MySQL环境下的网站流量统计软件,其统计功能主要包含访问者统计,24小时流量统计,网站来源统计,关键字统计,搜索引擎统计,地区来源统计。FXCounter(FXCounter网站统计系统)统计的数据包括总访问、今年访问、本月访问、今日访问、总浏览、今年浏览、本月浏览、今日浏览、在线人数。北京IDC网提供网站流量监测与日志分析,分析网站数据及访问量、点击率、页面访问率等,为用户提供详细的统计信息。内容包括总体统计,资源统计,访问者统计,活动统计,技术统计,引用者和关键字,以及浏览器和操作平台。上述软件都是通过分析网站的Web服务器的站点访问日志记录的方法来获得统计指标(WEB服务器是一个用于管理WEB页面的软件,并使这些页面通过本地网络或者Internet供客户浏览使用,较常用的WEB服务器包括Apache、IIS和Iplanet的Enterprise服务器),按照访问量的多少排列出不同时间段,不同时长范围的网页或网站的次序,往往只有前几十位,但是无法获知每一种类型的网络资源数据信息受哪些用户的青睐,高点击量的网络资源数据信息又是哪些用户的关注,且有些访问量低的信息丟失了,也无法分析出这些资源的受众和访问量低的原因。另夕卜,这些统计工具都是采用异步统计方法(即与实时变化的网站访问情况不匹配,通常是对访问的历史记录进行统计),在商业竟争激烈的今天,无法满足网站经营者和广告商等在进行决策时,对实时访问信息的需求。
发明内容本发明的目的在于提供互联网数据信息点击量的统计方法和装置,实现网站元素的多粒度统计,满足网站经营者和广告商等在进行决策时,对用户访问信息的需求。为实现上述目的,本发明采用如下技术方案一种互联网数据信息点击量的统计方法,包括如下步骤按照不同网站的统计需求,将互联网数据信息划分为不同类型;将用户所点击的网站上的互联网数据信息的地址,记录到点击数据表中该互联网数据信息所属类型的目录中并保存;对所述点击数据表中存储的各种类型的互联网数据信息的点击量进行统计。为实现上述目的,本发明还提供一种互联网数据信息点击量的统计装置,包括分类模块,用于按照不同网站的统计需求,将互联网数据信息划分为不同类型;记录模块,用于根据所述分类模块的类型设置,将用户所点击的网站上的互联网数据信息的地址和该用户标识,记录到点击数椐表中该互联网数据信息所属类型的目录中,所述用户标识与该用户所点击的互联网数据信息的地址对应;存储模块,存储所述点击数据表;统计模块,用于对所述点击数据表中记录的各种类型的互联网数据信息的点击量进行统计。通过对互联网数据信息进行分类,如将网站上的互联网数据信息分成新闻、广告、文章、图片、动画等类型,并按照这些类型对网站进行规划,使网站呈现多粒度的组织结构,将用户所点击的网站上的互联网数据信息的地址记录到点击数据表中该互联网数据信息所属类型的目录中,如用户所点击的文章信息,则该文章信息的URL地址被记录到点击数据表中文章类型的目录中,再对点击数据表中的点击量进行统计;该方法能清楚、准确统计出各种类型的互联网数据信息的点击量,即实现多粒度统计,且该统计粒度可以灵活控制,大到一个网站,一个版面,一个栏目,小到一个广告,一篇文章,页面上的某块位置,精确小粒度的统计分析使网站经营者或者广告商准确地对站点访问情况进行详细分析,能帮助企业更好地作出商务决策,将用户所点击的互联网数据信息和用户信息联系起来,可以统计出目标信息的用户群,有很好的商业价值。解决了现有点击量统计软件只能简单地罗列出所有被点击的互联网数据信息的地址,却不知道所点击的内容属于哪种类型的信息,进而无法做出正确决策的问题。本发明还可对点击量进行实时统计或分时段统计,实时统计能够为网站经营者或者广告商4是供更加详细的点击量信息,以侵/f乍出更理想的决策,分时段统计在对点击量实时性要求不高的情况下使用,这样可减轻网站服务器的负担。图1为本发明的实施例中互联网数据信息点击量的统计方法流程示意图;图2为本发明的实施例中互联网数据信息点击量的统计方法中用户信息表、互联网数据信息类型表和点击数据表的关系示意图;图3为本发明的实施例中互联网数据信息点击量的实时统计设置示意图4为本发明的实施例中互联网数据信息点击量的分时段统计设置示意图;图5为本发明的实施例中互联网数据信息点击量的统计装置示意图。具体实施方式下面结合附图对本发明的具体实施例对进行描述如图1所示,互联网数据信息点击量的统计方法的流程示意图,包括如下步骤(Sl)按照不同网站的统计需求,将互联网数据信息划分为不同类型;(S2)将用户所点击的网站上的互联网数据信息的地址,记录到点击数据表中该互联网数据信息所属类型的目录中并保存;(S3)对所述点击数据表中记录的各种类型的互联网数据信息的点击量进行统计。通过对互联网数据信息进行分类,如将网站上的互联网数据信息分成新闻、广告、文章、图片、动画等类型,每一种类型称为一个统计粒度。并按照这些类型对网站进行规划,使网站的呈现多粒度的组织结构,将用户所点击的网站上的互联网数据信息的地址记录到该互联网数据信息所属类型对应的点击数据表中,如用户所点击的文章信息,则该文章信息的地址被记录到点击数据表中文章所属类型的目录中,再对点击数据表中的点击量进行统计;该方法清楚、准确统计出各种类型的互联网数据信息的点击量,即实现多粒度统计,使网站经营者或者广告商准确地对站点访问情况进行详细分析,能帮助企业更好地作出商务决策,且本发明将用户所点击的互联网数据信息和用户信息联系起来,可以统计出目标信息的用户群,有很好的商业价值。上述步骤(S1)中,可以根据网站内容的属性和特征对网站上互联网数据信息分门别类地列出,并按照一定的体系系统组织起来。这里网站内容的属性是指一类事物彼此之间的相同点,即事物的某种属性,如带有宣传性用语的图片或者视频,并含有向消费者邀约购买其产品的意思的互联网数据信息,被归入广告类。类似的,也可以有文章类,版面类等互联网数据信息。同种类型的互联网数据信息存》文在一起。根据上述对互联网数据信息的分类对网站进行规划,即按照统计粒度将网站的组织结构规划成线性结构,或者二维表结构,或者等级结构,或者网状结构。线性结构是网站最简单的一种结构,它是以某种顺序组织的,可以是时间顺序,也可以是逻辑甚至是字母顺序,通过这些顺序呈线性地链接。二维表结构就好象一张平面二维表,允许用户横向(左<->右)、纵向(上<_>下)地浏览信息,如看i果程表一样。等级结构由一条等级主线构成索引,每一个等级点又由一条线性结构构成,如网站导航等就是这种结构。网状结构是最复杂的组织结构,完全没有限制,网页组织自由链接,这种结构允许访问者从一个信息栏目跳到另一个栏目去,其目的就是充分利用网络资源和充分享受超级链接。比如一个报社的网站,用等级结构来组织,可以按照"版面/栏目/文章/广告,,这样的四级目录来划分。这样网站上每个资源的URL就可以这样表示一个版面http:〃…/banmianl;一个栏目http:〃…/banmianl/la謹l;一篇文章http:〃…/banmianl/lanmul/wenzhangl;一个广告http:〃…/banmianl/lanmul/guanggao1。当用户点击一个版面的时候,点击数据中就会记录下这个版面的URL,通过这个URL就能知道是哪个版面被点击了。同理栏目和文章的点击数据也这样荻得。通过^见范组织网站的树形目录结构,通过URL地址(如http://www.aaa.com/abc)或者中文地址(如"粉红女郎")来标识资源。这样网站上任何一个信息资源的点击都能被记录下来,小到一段广告词,大到一个新闻频道(频道是指网站某一类内容的分类)。步骤(S2)中,在按照上述方式规划的网站上,将用户所点击的互联网数据信息的地址,记录到点击数据表中该互联网数据信息所属类型的目录中并保存;该点击数据表存储在网站的服务器的数据库中。下面以一个才艮社的网站为例说明该步骤的执行过程假设在一个报社的网站上需要统计版面,栏目,文章,广告的点击量。首先,按照版面,栏目,文章,广告规范网站组织结构(该网站是按照统计粒度由大到小组织成等级结构,具体讲是树形结构)。互联网数据信息资源包括四种类型的数据文章数据,版面数据,广告数据,栏目数据。版面用page表示,栏目用node表示,文章用article表示,广告用advertise表示。如果用户点击了版面1上的文章1,栏目1中的文章2,栏目2中的广告l。网站中的每个被点击的互联网数据信息的地址,表示的语义如下表1所示:<table>tableseeoriginaldocumentpage9</column></row><table>表l在对网站上的互联网数据信息实现多粒度统计的同时,为了更好地满足网站经营者和广告商等在进行决策时的需求,还可以将该用户的用户标识记录到点击数据表中,所述用户标识与该用户所点击的互联网数据信息的地址对应。所述用户标识对应多个该用户所点击的互联网数据信息的地址,或者一个互联网数据信息的地址对应多个用户标识。然后对点击数据表中记录的各种类型互联网数据信息的点击量进行统计。这样将用户所点击的互联网数据信息的类型和用户信息联系起来,统计出目标信息的用户群,即分析出每一种类型的网络资源数据信息受哪些用户的青睐,高点击量的网络资源数据信息又是哪些用户的关注,访问量低的资源的受众和访问量低的原因等,为网站经营者或者广告商提供决策的依据,有4艮好的商业价值。下面仍以报社网站为例说明该步骤中用户标识与该用户所点击的互联网数据信息的地址的对应关系如果用户A点击了版面l上的文章1,栏目1中的文章2;用户B点击了版面l上的文章l,栏目1中的文章2,栏目2中的广告1。网站中的每个被点击的互联网数据信息的地址(用URL表示),表示的语义如下表2所示<table>tableseeoriginaldocumentpage9</column></row><table>该表2是以URL的顺序来排列用户所点击的互联网数据信息资源的,是每一种类型的互联网数据信息资源都对应什么样的用户;当然也可以用户ID的顺序进行排列,反映出一个用户都点击了哪些互联网数据信息资源,以用户ID的顺序排列如下表3:URL语义用户IDhttp://sitename/pagel/articlel版面l上的文章lAhttp://sitename/nodel/article2栏目1中的文章2Ahttp://sitename/pagel/articlel版面l上的文章lBhttp:〃sitename/nodel/article2栏目l中的文章2Bhttp://sitename/node2/advertisel栏目2中的广告1B表3上述用户标识可以为用户注册时网站的服务器为用户分配的ID。某些网站为用户提供登录入口,用户必须在该网站上进行注册才能访问浏览该网站的资源,用户在注册时,网站的服务器会记录用户的个人信息,包括该用户的个人信息(如真实姓名,性别,证件号码等)以及其他相关信息(如职业,受教育水平,兴趣等)。为了保证服务器中数据存储的条理性,该用户信息表在网站的服务器中与点击数据表分开存放,统计分析点击量时,可以通过点击数据表中记录的用户ID,向用户信息表查询该ID所对应的用户信息。上述用户标识也可以为IP地址等,如那些无需注册就能浏览网络资源的网站,服务器会记录该用户访问时所用的IP地址。统计分析点击量时,通过IP向用户信息表查询该用户信息,当然也可采用其它任何可标识用户的方法。图2反映了在报社网站的服务器中,记录了用户ID和用户资料的用户信息表、互联网数据信息类型表、点击数据表的关系。其中,互联网数据信息类型表包括版面类型数据表,文章类型数据表,广告类型数据表以及栏目类型数据表。在实际的关系型数据库中,为了表示数据的唯一性和一致性,需对每个表建立一个主键(primarykey,PK),而当一个表(如A表)要引用另一个表(如B表)的主键时,需为A表建立外键(foreignkey,FK),外键用于建立和加强两个表数据之间的链接的一列或多列,加强数据的完整性,使数据库可以自动处理两表之间的对应关系,不用手工管理。该图中,用户信息表的主键PK值与点击数据表中的外键FK1相等,而版面类型数据表的主键PK,文章类型数据表的主键PK,广告类型数据表的主键PK以及栏目类型数据表的主键PK分别与点击数据表中的FK1,FK2,FK3,FK4的值对应相等。在步骤(S3)中,利用上述点击数据表,可以统计出各种类型互联网数据信息的点击量。例如,用户点击了一条URL,其具体地址为http:〃sitename/pagel/articlel(即站点上版面1中的文章1),点击该条URL的用户标识分别为"A"和"B",即用户"A"和用户"B"均点击过该条URL,这条URL和用户的标识记录到点击数据表中。对该条URL的点击量的统计,可以釆用采用计数器的方式,为每一种类型的互联网数椐信息分别分配一个计数器,上述articlel对应的计数器的当前值,就是上述URL地址中文章1的点击量,上述URL地址中pagel(版面)点击量可以通过pagel所对应的计数器的当前值来获得。当然,对用户所访问的互联网数据信息的URL的点击量也可以采用诸如曲线图等统计方法。如果要获得点击量最高的文章,就在点击数据表中查询出记录次数最多(如果采用计数器方式,计数器的当前值最大的)的那篇文章,类似的,还可以获得点击率最高的版面、栏目或者广告。如果要获得某个广告被那些用户点击了,就利用点击数据表和用户ID组合查询出某广告的关注人群,并可获得用户的个人信息资料,了解这样的产品在哪些用户群中受欢迎,如点击数据表中点击广告的用户标识为A,该用户标识A对应的外键是FK1,再通过FK1与用户信息表联系起来,就可以用户信息表中查询出该用户标识A的个人资料信息。类似的,可以知道某个版面,栏目或者文章的关注人群。如果想知道哪位记者的稿件最受欢迎,就利用点击数据和网络资源中的文章数据查询出记录最多的文章作者。除了上述的这些统计分析数据外,利用本发明提供的方法可以灵活设计并获得各种所需的点击统计数据,即实现多粒度统计。如图3所示。基于上述的点击数据表,在网站的Web服务器中,可以对数据表中记录的互联网数据信息的点击量进行实时统计,实时统计是每次用户的点击,其点击内容所属的计数器都会相应的进行累力口,这样可以获取实时信息,有助于网站经营或者广告商能更加及时准确地获取用于决策的信息。即与实时变化的网站访问情况相匹配,而不是对访问的历史记录进行统计。如图4所示,在网站的Web服务器中,也可以对所述数据表中记录的互联网数据信息的点击量进行分时段统计,分时段统计就是根据预设置,例如预设置每5秒统计一次,在这5秒内,用户点击互联网数据信息,仅仅记录每次点击的URL,而各计数器值不发生变化,当到了预设的进行统计的时刻,各计数器才对该时间段内的点击数量进行统计和累力口。对实时性要求不高的企业来说,每隔一段时间(如图中统计频率设置为5秒,或者更长时间,用户可灵活设置该统计频率)将新增加的点击记录统计一遍,这样可减轻服务器负担。上述互联网数据信息的统计方法,把用户和该用户所点击的内容的关联记录下来,利用这些信息来分析网络资源的用户群。本发明提供的方法对点击量进^f亍实时统计,并可设置统计的频率。互联网数据信息点击量的统计粒度可以灵活控制,大到一个网站,一个网页,小到一个广告,页面上的某块位置。页面上某块位置的点击量对某些行业是重要的,比如报社网站或者新闻网站,页面上不同的位置所附带的新闻价值是不一样的。精确小粒度的统计分析的商业价值对公司企业来说很重要。因此本发明提供的实现多粒度统计的互联网数据信息点击量的统计方法,能够更好满足网站经营者或者广告商等的实际需求。和上述互联网数据信息点击量的统计方法相应,本发明还提供一种互联网数据信息点击量的统计装置,如图5所示,包括分类模块51,用于按照不同网站的统计需求,将互联网数据信息划分为不同类型;记录模块52,用于根据所述分类模块51的类型设置,将用户所点击的网站上的互联网数据信息的地址和该用户标识,记录到点击数据表中该互联网数据信息所属类型的目录中,所述用户标识与该用户所点击的互联网数据信息的地址对应;存储模块53,用于存储所述点击数据表;统计模块54,用于对所述点击数据表中记录的各个类型的互联网数据信息的点击量进行统计。其中,所述统计冲莫块54包括与每种类型的互联网数据信息分别对应的计数器,用于根据所述记录模块所记录到点击数据表中的互联网数据信息的地址,进行计数统计o此外,上述装置还可以包括设置模块55,用于设置所述统计模块的统计频率,该统计频率为实时统计或者分时^R统计,具体"&置方式如图3或图4所示。上述用户标识对应多个该用户所点击的互联网数据信息的地址,或者一个互联网数据信息的地址对应多个用户标识,如上文中表2和表3所示。利用上述装置,可高效准确统计出每一种类型的网络资源数据信息受哪些用户的青睐,高点击量的网络资源数据信息又是哪些用户的关注,访问量低的信息资源的受众和访问量低的原因,且采用实时统计,即与实时变化的网站访问情况相匹配,而不是对访问的历史记录进行统计,在商业竟争激烈的今天,很好满足了网站经营者和广告商等在进行决策时,对实时访问信息的需求。另外,对实时性要求不高的企业来说,可采用分时段统计,每隔一段时间(如图3中设置的5秒,或者更长时间)将新增加的点击记录统计一遍,这样可减轻服务器负担。以上结合较佳实施例来描述本发明,但并不用以限制本发明,本
技术领域
的普通技术人员应当知道,凡在本发明思想的应用范围内所作的等效目的的变更与修改,均应在本专利申请的保护范围之内。权利要求1、一种互联网数据信息点击量的统计方法,其特征在于,包括如下步骤按照不同网站的统计需求,将互联网数据信息划分为不同类型;将用户所点击的网站上的互联网数据信息的地址,记录到点击数据表中该互联网数据信息所属类型的目录中并保存;对所述点击数据表中存储的各种类型的互联网数据信息的点击量进行统计。2、根据权利要求1所述的互联网数据信息点击量的统计方法,其特征在于,所述将用户所点击的网站上的互联网数据信息的地址,记录到点击数据表中该互联网数据信息所属类型的目录中的步骤还包括将该用户的用户标识记录到点击数据表中,所述用户标识与该用户所点击的互联网数据信息的地址对应。3、根据权利要求2所述的互联网数据信息点击量的统计方法,其特征在于,所述用户标识对应多个该用户所点击的互联网数据信息的地址,或者一个互联网数据信息的地址对应多个用户标识。4、根据权利要求2或3所述的互联网数据信息点击量的统计方法,其特征在于,所述用户标识为用户注册时网站为用户分配的ID,或者该用户的IP地址。5、根据权利要求1、2或3所述的互联网数据信息点击量的统计方法,其特征在于,对所述点击数据表中存储的各种类型的互联网数据信息的点击量进行统计的步骤具体包括为不同类型的互联网数据信息各分配一个计数器,利用所述计数器对所述点击数据表中存储的各种类型的互联网数据信息的点击量进行统计。6、根据权利要求1、2或3所述的互联网数据信息点击量的统计方法,其特征在于,对所述点击数据表中记录的互联网数据信息的点击量进行实时统计,或者对所述点击数据表中记录的互联网数据信息的点击量进行分时段统计。7、一种互联网数据信息点击量的统计装置,其特征在于,包括分类模块,用于按照不同网站的统计需求,将互联网数据信息划分为不同类型;记录模块,用于根据所述分类模块的类型设置,将用户所点击的网站上的互联网数据信息的地址和该用户标识,记录到点击数据表中该互联网数据信息所属类型的目录中,所述用户标识与该用户所点击的互联网数据信息的地址对应;存储模块,用于存储所述点击数据表;统计模块,用于对所述点击数据表中记录的各种类型的互联网数据信息的点击量进行统计。8、根据权利要求7所述互联网数据信息点击量的统计装置,其特征在于,所述统计模块包括与每种类型的互联网数据信息分别对应的计数器,用于根据所述记录模块所记录的互联网数据信息的地址进行计数统计。9、根据权利要求7或8所述互联网数据信息点击量的统计装置,其特征在于,还包括设置模块,用于设置所述统计模块的统计频率,该统计频率为实时统计或者分时段统计。10、根据权利要求7所述互联网数据信息点击量的统计装置,其特征在于,所述用户标识对应多个该用户所点击的互联网数据信息的地址,或者一个互联网数据信息的地址对应多个用户标识。全文摘要本发明公开了互联网数据信息点击量的统计方法和装置,涉及计算机互联网数据信息的统计领域。为解决现有点击量统计工具不能满足网站经营者和广告商等的需求的问题而发明。其中,互联网数据信息点击量的统计方法包括按照不同网站的统计需求,将互联网数据信息划分为不同类型;将用户所点击的网站上的互联网数据信息的地址,记录到点击数据表中该互联网数据信息所属类型的目录中并保存;对所述点击数据表中存储的各种类型的互联网数据信息的点击量进行统计。互联网数据信息点击量的统计装置包括分类模块、记录模块、存储模块及统计模块。本发明实现了网站元素的多粒度统计,有很好的商业价值。文档编号H04L12/24GK101159592SQ200710142939公开日2008年4月9日申请日期2007年8月10日优先权日2007年8月10日发明者星吴,吴定明,赓孙,易文飞申请人:北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1