一种基于DPI的OTT视频收视率分析方法、设备及存储介质与流程

文档序号:25291100发布日期:2021-06-01 17:42阅读:128来源:国知局
一种基于DPI的OTT视频收视率分析方法、设备及存储介质与流程

技术领域:

本发明涉及网络流量管理和监控领域,具体地,涉及一种基于dpi的ott视频收视率分析方法、设备及存储介质。



背景技术:

随着智能电视渗透率的不断提高,智能电视提供给人们的不仅仅是直播端的服务,它涵盖生活(购物、医疗)、娱乐(游戏)、教育等功能,内容资源也朝着多元、个性化发展。在碎片化时代,用户大屏使用行为的拉锯战中,点播成为大赢家。为了吸引用户注意力,在用户碎片化的时间里提供便捷式服务,更加人性化的观看体验、与用户建立粘性关系等都是点播更受青睐的原因。电视受众从传统电视向ott终端转移,面对大屏,用户智能点播行为已经显著超越传统直播收视行为,用户在大屏上消耗的时间日趋在向点播行为倾斜。并且智能电视受众主要是高学历、高收入和消费能力强的中产阶级群体,广告商业价值逐渐凸显。

传统收视率调查的维度已不足以支撑广告主、电视台等精准营销的需求,时代技术的发展需要全新多维度的数据分析体系,去完善智能电视收视率统计和研究。

因此,本领域亟需一种基于dpi的ott视频收视率分析方法、设备及存储介质。

有鉴于此,提出本发明。



技术实现要素:

有鉴于此,本发明的目的在于提供一种基于dpi的ott视频收视率分析方法、设备及存储介质,以解决现有技术中的至少一项技术问题。

具体地,本发明的第一方面,提供了一种基于dpi的ott视频收视率分析方法,包括以下步骤:

获取数据:利用dpi设备获取数据,包括各视频id;

统计时长:去除流的间隔时长,统计同一视频的实际观看时长;

计算收视率:计算各视频的收视率。

采用上述技术方案,通过dpi数据获得用户实际传输流量的时长作为实际观看时长,而非统计用户打开该视频的时长,排除了广告、用户暂停等情况,并且覆盖范围更大,使得获得的ott收视率更准确。

进一步地,所述基于dpi的ott视频收视率分析方法,还包括以下步骤:

数据分组:对获取的数据按照视频id和用户账号进行分组。

采用上述技术方案,分组处理数据流,便于发现重复数据,便于对同类数据进行统一处理,提高计算效率。

进一步地,所述数据分组,还包括以下步骤:

按照流顺序排序,相邻流的间隔大于阈值的,划分到不同组。

采用上述技术方案,便于去除间隔时间,便于对相对集中的观看统一处理,提交计算效率和计算精度。

进一步地,所述基于dpi的ott视频收视率分析方法,还包括以下步骤:

数据筛除:同一组数据中同一视频id存在多种数据,只保留一种数据。

采用上述技术方案,同一组数据为某账号下一段时间内观看所有平台下某一视频的数据,若存在多种数据,则说明在同一时间下利用多个平台或者设备对同一视频进行观看,会构成重复统计,所述数据筛除能防止重复统计,使得收视率计算得更精准。

进一步地,所述数据筛除,包括以下步骤:

判断同一组数据中是否存在同一视频的多种数据,若是,比较多种数据,保留时长值最大的数据。

采用上述技术方案,将观看时间最长值作为保留下来的数据,使得保留下来的观看时长涵盖这段时间在其他设备的时长,使得计算结果更准确。

进一步地,所述统计时长包括以下步骤:

计算数据累积时长tdata:tdata=end_t-start_t,其中start_t为最小流开始时间,end_t为最大流开始时间end_t;

计算报文累积时长tpcap:其中其中,δti为每个分段视观看频时长,endi为每个视频分片的结束时间,starti为每个视频分片的开始时间。

计算实际观看时长t:t=max(tdata,tpcap),其中,tdata为数据累积时长,tpcap为报文累积时长。

采用上述技术方案,分别计算报文累积时长和数据累积时长,采用多种方式统计实际观看时长,防止数据丢失造成数值错误,提高容错率。

进一步地,所述计算收视率包括以下步骤:

计算视频id收视率:视频id收视率=该视频id实际观看时长/所有视频id实际观看时长。

采用上述技术方案,按照视频id计算出某个视频的收视率,不易丢失相关数据,结果更准确。

进一步地,所述计算收视率包括以下步骤:

计算分段视频的收视率:分段视频收视率=该分段视频实际观看时长/该视频id实际观看时长。

采用上述技术方案,获得分段视频收视率,使收视率的计算精确到视频的某个片段,便于后期向用户推荐精彩片段或者用户自行查找精彩片段。

本发明第二方面提供了一种基于dpi的ott视频收视率分析设备,所述设备包括:

存储器及处理器,所述存储器上至少有一条指令,所述至少一条指令由所述处理器加载并执行,以实现上述方法。

本发明第三方面提供了一种计算机可读存储介质,所述存储介质上存储至少一条指令,所述至少一条指令由处理器加载并执行,以实现上述方法。

综上所述,本发明具有以下有益效果:

1.通过dpi数据获得用户实际传输流量的时长作为实际观看时长,而非统计用户打开该视频的时长,排除了广告、用户暂停等情况,使得获得的ott收视率更准确;

2.所述数据筛除能防止重复统计,使得收视率计算得更精准;

3.分组处理数据流,便于发现重复数据,便于对同类数据进行统一处理,提高计算效率;

4.分别计算报文累积时长和数据累积时长,采用多种方式统计实际观看时长,防止数据丢失造成数值错误,提高容错率。

附图说明:

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于dpi的ott视频收视率分析方法第一种实施方式的示意图;

图2为本发明基于dpi的ott视频收视率分析方法第二种实施方式的示意图;

图3为本发明基于dpi的ott视频收视率分析方法第三种实施方式的示意图;

图4为本发明一个视频数据的组成的示意图。

具体实施方式:

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

以下将通过实施例对本发明进行详细描述。

以下对本申请涉及的一些概念进行解释:

1.dpi(deeppacketinspection):是一种基于数据包的深度检测技术,针对不同的网络应用层载荷(例如http、dns等)进行深度检测,通过对报文的有效载荷检测决定其合法性。dpi设备通过对网络的关键点处的流量和报文内容进行检测分析,可以根据事先定义的策略对检测流量进行过滤控制,能完成所在链路的业务精细化识别、业务流量流向分析、业务流量占比统计、业务占比整形、以及应用层拒绝服务攻击、对病毒、木马进行过滤和滥用p2p的控制等功能。

2.ott(overthetop):是指互联网公司越过运营商,发展基于开放互联网的各种视频及数据服务业务。国家广播电影电视总局181号文件的下发,标志着中国可管可控的ott模式的建立,通过牌照制方式实现对ott的可管可控,由广电总局认可的集成牌照方负责提供内容播控,且互联网电视与牌照方客户端完全绑定,通过牌照方的集成播控平台对客户端实行控制和管理。

3.流:一个tcp或者udp连接。最小流为用户观看时间最早的那条流;最大流为用户观看时间最晚的那条流。

4.视频分片:一个视频文件被切成多个.ts格式的视频切片。

5.分段视频:一个视频文件被分成多个分段视频,每个分段视频被分成多个.ts格式的视频分片。

为了更好的理解上述技术方案,下面将结合说明书附图以及具体地实施方式对上述技术方案进行详细的说明。

具体地,参考图1,本发明提供了一种基于dpi的ott视频收视率分析方法,包括以下步骤:

s100.获取数据:利用dpi设备获取数据,包括各视频id;利用dpi设备从获得视频分片数据的uri中解析出视频id,例如v0032wi2vx9(腾讯视频id)。

s400.统计时长:去除流的间隔时长,统计同一视频的实际观看时长;

s500.计算收视率:计算各视频的收视率。

采用上述技术方案,通过dpi数据获得用户实际传输流量的时长作为实际观看时长,而非统计用户打开该视频的时长,排除了广告、用户暂停等情况,使得获得的ott收视率更准确,并且,收视率调查覆盖全面,结果更准确。

参考图2和图3,在本发明一种优选的实施方式中,所述基于dpi的ott视频收视率分析方法,还包括以下步骤:

s200.数据分组:s210.对获取的数据按照视频id和用户账号进行分组。

在本发明一种优选的实施方式中,对获取的数据再按照视频播放类型进行分类。所述视频播放类型包括点播、直播、回看等方式。

采用上述技术方案,分组处理数据流,便于发现重复数据,便于对同类数据进行统一处理,提高计算效率。

在本发明一种优选的实施方式中,所述s200.数据分组,还包括以下步骤:

s220.按照流顺序排序,相邻流的间隔大于阈值的,划分到不同组。可以设置阈值为30min,间隔时间超过30min的,划到不同组。

采用上述技术方案,便于去除间隔时间,便于对相对集中的观看统一处理,提交计算效率和计算精度。

在本发明一种优选的实施方式中,所述基于dpi的ott视频收视率分析方法,还包括以下步骤:

s300.数据筛除:同一组数据中同一视频id存在多种数据,只保留一种数据。

采用上述技术方案,同一组数据为某账号下一段时间内用户观看所有平台下某一视频的数据,所述平台包括android、ios、pc、电视盒子等不同类型,从获得视频分片的数据和日志上报数据中的user-agent字段解析出平台类型;每个设备具有唯一编号,从用户日志上报数据的idfaoaidguid字段解析出用户设备唯一编号。如若存在多种数据,则说明在同一时间下利用多个平台或者设备对同一视频进行观看,会构成重复统计,所述数据筛除能防止重复统计,使得收视率计算得更精准。

在本发明一种优选的实施方式中,所述s300.数据筛除,包括以下步骤:

s310.判断同一组数据中是否存在同一视频的多种数据,若是,s320.比较多种数据,保留时长值最大的数据。

采用上述技术方案,将观看时间最长值作为保留下来的数据,使得保留下来的观看时长涵盖这段时间在其他设备的时长,使得计算结果更准确。

在本发明一种优选的实施方式中,所述s400.统计时长包括以下步骤:

s410.计算数据累积时长tdata:tdata=end_t-start_t,其中start_t为最小流开始时间,end_t为最大流开始时间end_t;每条流的开始时间到结束时间非常短,在1秒左右,舍去最大流的长度,有效避免重复计算,并且只需获取及存储每条流的开始时间,减少计算资源占用,提高资源利用率。

s420.计算报文累积时长tpcap:其中其中,δti为每个分段视观看频时长,endi为每个视频分片的结束时间,starti为每个视频分片的开始时间。

参考图4,δtm为某个视频的某个分段视频的第m个视频分片的观看时长,为该视频分片的结束时间endm减去开始时间startm,δtn为某个视频第n个分段视频的观看时长,为该范围内所有视频分片的观看时长之和,tpcap为某个视频的报文累积时长,为该视频所有分段视频的观看时长之和。

s430.计算实际观看时长t:t=max(tdata,tpcap),其中,tdata为数据累积时长,tpcap为报文累积时长。

采用上述技术方案,分别计算报文累积时长和数据累积时长,采用多种方式统计实际观看时长,防止数据丢失造成数值错误,提高容错率。

参考图3,在本发明一种优选的实施方式中,所述s500.计算收视率包括以下步骤:

s510.计算视频id收视率:视频id收视率=该视频id实际观看时长/所有视频id实际观看时长。

采用上述技术方案,按照视频id计算出某个视频的收视率,不易丢失相关数据,结果更准确。

在本发明一种优选的实施方式中,所述s500.计算收视率包括以下步骤:

s520.计算分段视频的收视率:分段视频收视率=该分段视频实际观看时长/该视频id实际观看时长。

采用上述技术方案,获得分段视频收视率,使收视率的计算精确到视频的某个片段,便于后期向用户推荐精彩片段或者用户自行查找精彩片段。

基于同一发明构思,本发明提供了一种基于dpi的ott视频收视率分析设备,所述设备包括:

存储器及处理器,所述存储器上至少有一条指令,所述至少一条指令由所述处理器加载并执行,以实现上述方法。

基于同一发明构思,本发明提供了一种计算机可读存储介质,所述存储介质上存储至少一条指令,所述至少一条指令由处理器加载并执行,以实现上述方法。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、设备和方法,可以通过其它的方式实现。

应当理解,本申请实施例中,从权、各个实施例、特征可以互相组合结合,都能实现解决前述技术问题。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1