一种媒体画像分析的方法与流程

文档序号:25025153发布日期:2021-05-11 16:51阅读:104来源:国知局
一种媒体画像分析的方法与流程

本发明属于媒体信息分析技术领域,具体涉及一种媒体画像分析的方法。



背景技术:

媒体是传播信息的媒介。它是指人借助用来传递信息与获取信息的工具、渠道、载体、中介物或技术手段,也指传送文字、声音等信息的工具和手段。也可以把媒体看作为实现信息从信息源传递到受信者的一切技术手段。媒体有两层含义,一是承载信息的物体,二是指储存、呈现、处理、传递信息的实体,在网络媒体画像的分析中,媒体画像是对媒体流量情况进行全方位的属性的勾画是媒体各方面的数据体现,即是对媒体流量进行分析的过程,然而市面上各种的媒体画像仍存在各种各样的问题。

如授权公告号为cn110622480a所公开的移动视频流的流量画像系统、设备和方法,其虽然实现了首先,观察osi模型下层的多个数据包流。为各观察到的流获取数据包流模式,并比较各获取的模式与预定义特性流模式。从所观察到的流中选择任何一个其数据包流模式接近所述预定义特性流模式的数据包流作为视频流媒体流。通过观察累积数据随时间的斜率,在填充状态、稳定状态以及耗尽状态中识别视频流媒体流的缓冲状态。最后,根据其数据包流模式提供所选视频流媒体流的多媒体相关信息,但是并未解决现有媒体在运行使用的时候,对于用户活跃量、访问量、广告点击、广告曝光和sivt比例等的问题,为此我们提出一种媒体画像分析的方法。



技术实现要素:

本发明的目的在于提供一种媒体画像分析的方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种媒体画像分析的方法,包括有以下步骤:

s1、用户活跃量检测记录:通过媒体后端数据库对媒体用户进行实施监控,并且记录每日用户的登陆情况,并且将登陆情况存储在网页日志中,并且对活跃用户的各种行为信息进行有效的记录;

s2、媒体页面记录每日的页面访问量:媒体页面通过网页日志对网页的每日访问量进行记录,并且网页日志在进行记录的时候,区分媒体用户和游客用户分别的数量,并且记录游客用户成为媒体用户的数量;

s3、媒体后端对媒体网页的广告点击率进行记录:在每日媒体网页进行浏览的时候,媒体后端时刻记录媒体网页的广告点击率,以及广告页面的停留时间和翻页次数;

s4、通过s3中的广告浏览情况对广告的曝光率进行有效的计算:通过对网页广告点击率、广告页面停留时间和翻页次数对广告的曝光率进行有效的计算,并且广告的曝光率记为u,广告点击率记为p,广告页面停留时间记为t,广告页面翻页次数记为m,则广告的曝光率的公式为

s5、通过访问量和活跃量计算sivt比例的数值:对sivt比例的计算,则是通过访问量和活跃量来进行计算的,且通过数据流算法实现对sivt的比例进行计算,数据流算法中假设假设数据流δ={a1、a2、a3……am},其中m为数据流的长度,任意元素ai={1、2……n}中选择,如果我们对数据流处理想要求的函数为通常为一个实数,很多基本函数被证明在空间亚线性(o(min{n,m}))的情况下无法得到精确解,假设我们算法的输出为a(σ)。如果算法满足下面的不等式,我们将算法称为(ε,δ)近似的,

为零或者是趋于零的时候则满足下面的不等式即可,

pr{|a(σ)-φ(σ)|>∈}≤δ。

优选的,所述s1中的登陆情况包括有登陆时长、登陆设备和登陆频率,所述登陆时长是用户在登陆一次至下线的时间长度,所述登陆设备是获取设备的id信息,所述登陆频率是用户在一天内登陆媒体的次数。

优选的,所述所述登陆频率的设定时长为2h,即用户在第一次登陆媒体之后,在后续的2h之内,无论再次登陆多少次,均按照依次登陆进行计算。

优选的,所述s1中的行为信息包括有浏览记录,览记录包括对各个广告播放次数、广告播放总时长、各个广告的时长、用户页面访问记录、页面访问时长和浏览总时长。

优选的,所述获取的方式如下:所述s1中的网页日志的获取采用网络嗅探器获取流媒体用户的网站日志文件,并将网络日志传输给媒体后端。

优选的,所述s2中的页面访问量分为pv访问量、独立ip访问数和uv访问数,所述页面访问量的周期设定时长是4h,即是4h之内的访问次数均按照一次访问量计算。

优选的,所述s2中的游客成为媒体用户的数量的时候先对游客的记录进行分析,并且通过蚁群算法实现对用户进行访问内容的推送。

优选的,所述蚁群算法一种用来寻找优化路径的概率型算法,所述蚁群算法在进行计算的时候先设定一个矩阵,并且再依次对矩阵进行迭代计算,得出最优的推送内容。

优选的,所述s3中的广告点击率、广告页面的停留时间和翻页次数用于对广告的曝光率记性计算,得出广告在页面中被用户进行浏览的可能性。

优选的,所述s5中的数据流算法经常使用到哈希,通过使用的hash必须保证具有较低的冲突率,2-universalhashing和strongly2-universalhashing定义如下,如果h是一个从u映射到d的哈希函数族,x、y∈u,x≠y满足下面不等式,

则称hash函数族是2-universal的,

如果满足:

则称hash函数族是strongly2-universal的。

与现有技术相比,本发明的有益效果是:

本发明能够有效的记录媒体流量中的用户活跃量、访问量、广告点击、广告曝光和sivt比例等,能够实现对媒体的能力进行有效的分析,并且通过数据流算法实现对媒体有效和无效浏览数据量进行有效的分析,能够实现清晰的媒体流量信息,并且通过广告时长和点击率等实现对广告的曝光率进行有效的计算,区分广告内容是误点进入,还是观看进入。

附图说明

图1为本发明的步骤结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供一种技术方案:一种媒体画像分析的方法,包括有以下步骤:

s1、用户活跃量检测记录:通过媒体后端数据库对媒体用户进行实施监控,并且记录每日用户的登陆情况,并且将登陆情况存储在网页日志中,并且对活跃用户的各种行为信息进行有效的记录;

s2、媒体页面记录每日的页面访问量:媒体页面通过网页日志对网页的每日访问量进行记录,并且网页日志在进行记录的时候,区分媒体用户和游客用户分别的数量,并且记录游客用户成为媒体用户的数量;

s3、媒体后端对媒体网页的广告点击率进行记录:在每日媒体网页进行浏览的时候,媒体后端时刻记录媒体网页的广告点击率,以及广告页面的停留时间和翻页次数;

s4、通过s3中的广告浏览情况对广告的曝光率进行有效的计算:通过对网页广告点击率、广告页面停留时间和翻页次数对广告的曝光率进行有效的计算,并且广告的曝光率记为u,广告点击率记为p,广告页面停留时间记为t,广告页面翻页次数记为m,则广告的曝光率的公式为

s5、通过访问量和活跃量计算sivt比例的数值:对sivt比例的计算,则是通过访问量和活跃量来进行计算的,且通过数据流算法实现对sivt的比例进行计算,数据流算法中假设假设数据流δ={a1、a2、a3……am},其中m为数据流的长度,任意元素ai={1、2……n}中选择,如果我们对数据流处理想要求的函数为通常为一个实数,很多基本函数被证明在空间亚线性(o(min{n,m}))的情况下无法得到精确解,假设我们算法的输出为a(σ)。如果算法满足下面的不等式,我们将算法称为(ε,δ)近似的,

为零或者是趋于零的时候则满足下面的不等式即可,

pr{|a(σ)-φ(σ)|>∈}≤δ。

为了实现对用户的登陆次数和登陆信息进行采集记录,本实施例中,优选的,所述s1中的登陆情况包括有登陆时长、登陆设备和登陆频率,所述登陆时长是用户在登陆一次至下线的时间长度,所述登陆设备是获取设备的id信息,所述登陆频率是用户在一天内登陆媒体的次数。

为了实现对不同时间段的登陆信息进行有效的记录,保持登陆信息的准确性,本实施例中,优选的,所述所述登陆频率的设定时长为2h,即用户在第一次登陆媒体之后,在后续的2h之内,无论再次登陆多少次,均按照依次登陆进行计算。

为了实现对登陆用户的活动行为进行记录,便于对媒体画像进行分析,本实施例中,优选的,所述s1中的行为信息包括有浏览记录,览记录包括对各个广告播放次数、广告播放总时长、各个广告的时长、用户页面访问记录、页面访问时长和浏览总时长。

为了实现对用户登陆信息进行获取,并且进行登陆信息的传输,本实施例中,优选的,所述获取的方式如下:所述s1中的网页日志的获取采用网络嗅探器获取流媒体用户的网站日志文件,并将网络日志传输给媒体后端。

为了实现对不同的登陆方式进行区分,并且设定访问周期时长,便于确定网页的访问记录的准确性,本实施例中,优选的,所述s2中的页面访问量分为pv访问量、独立ip访问数和uv访问数,所述页面访问量的周期设定时长是4h,即是4h之内的访问次数均按照一次访问量计算。

为了实现对新用户进行媒体内容的推送计算,本实施例中,优选的,所述s2中的游客成为媒体用户的数量的时候先对游客的记录进行分析,并且通过蚁群算法实现对用户进行访问内容的推送,所述蚁群算法一种用来寻找优化路径的概率型算法,所述蚁群算法在进行计算的时候先设定一个矩阵,并且再依次对矩阵进行迭代计算,得出最优的推送内容。

为了实现对广告观看的有效记录和无效记录进行区分,确定广告的曝光率,本实施例中,优选的,所述s3中的广告点击率、广告页面的停留时间和翻页次数用于对广告的曝光率记性计算,得出广告在页面中被用户进行浏览的可能性。

为了实现对数据流算法中的冲突率进行计算和降低,本实施例中,优选的,所述s5中的数据流算法经常使用到哈希,通过使用的hash必须保证具有较低的冲突率,2-universalhashing和strongly2-universalhashing定义如下,如果h是一个从u映射到d的哈希函数族,x、y∈u,x≠y满足下面不等式,

则称hash函数族是2-universal的,

如果满足:

则称hash函数族是strongly2-universal的。

本发明的工作原理及使用流程:

第一步、用户活跃量检测记录:通过媒体后端数据库对媒体用户进行实施监控,并且记录每日用户的登陆情况,并且将登陆情况存储在网页日志中,并且对活跃用户的各种行为信息进行有效的记录;

第二步、媒体页面记录每日的页面访问量:媒体页面通过网页日志对网页的每日访问量进行记录,并且网页日志在进行记录的时候,区分媒体用户和游客用户分别的数量,并且记录游客用户成为媒体用户的数量;

第三步、媒体后端对媒体网页的广告点击率进行记录:在每日媒体网页进行浏览的时候,媒体后端时刻记录媒体网页的广告点击率,以及广告页面的停留时间和翻页次数;

第四步、通过s3中的广告浏览情况对广告的曝光率进行有效的计算:通过对网页广告点击率、广告页面停留时间和翻页次数对广告的曝光率进行有效的计算,并且广告的曝光率记为u,广告点击率记为p,广告页面停留时间记为t,广告页面翻页次数记为m,则广告的曝光率的公式为

第五步、通过访问量和活跃量计算sivt比例的数值:对sivt比例的计算,则是通过访问量和活跃量来进行计算的,且通过数据流算法实现对sivt的比例进行计算,数据流算法中假设假设数据流δ={a1、a2、a3……am},其中m为数据流的长度,任意元素ai={1、2……n}中选择,如果我们对数据流处理想要求的函数为通常为一个实数,很多基本函数被证明在空间亚线性(o(min{n,m}))的情况下无法得到精确解,假设我们算法的输出为a(σ)。如果算法满足下面的不等式,我们将算法称为(ε,δ)近似的,

为零或者是趋于零的时候则满足下面的不等式即可,

pr{|a(σ)-φ(σ)|>∈}≤δ。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1