数据处理的方法和装置的制造方法

文档序号:10516345阅读:396来源:国知局
数据处理的方法和装置的制造方法
【专利摘要】本发明实施例提供了一种数据处理的方法和装置,涉及通信技术领域。本发明的方法主要包括:获取视频播放日志,所述视频播放日志为终端发送的视频播放过程中生成的日志;从所述视频播放日志中提取与预设属性匹配的目标数据;根据所述预设属性,为所述目标数据添加信息标签,以便后续根据所述信息标签分析所述视频播放日志,其中,所述信息标签用于描述所述目标数据的基本特征。与现有技术中直接通过日志中的程序源代码分析用户行为信息以及终端状况相比,本发明能够为日志中各个属性的数据添加用于描述其基本特征的信息标签,在后续分析日志时,可直接通过信息标签对其进行分析即可,从而提高了分析日志的效率。
【专利说明】
数据处理的方法和装置
技术领域
[0001] 本发明实施例设及通信技术领域,尤其设及一种数据处理的方法和装置。
【背景技术】
[0002] 在实际应用中,在视频播放器播放视频的过程中会产生大量的日志,用于记录用 户的操作行为、网络状况、视频播放器的版本、终端系统的类型等信息。用户可W通过日志 实现检查错误发生的原因、寻找受到攻击时攻击者留下的痕迹等操作;若终端将生成的日 志上报给日志服务器,管理员还可W通过日志服务器对各个终端用户的访问行为信息W及 终端状况进行分析。
[0003] 由于视频播放器播放视频的过程中生成的日志中的内容是程序源代码,所W管理 员分析各个用户行为信息或者终端状况时,需要从日志服务器侧获取各个终端发送的日 志,然后对日志中的程序源代码进行分析,最后才能获得需要的信息。然而,程序源代码只 有专业的编程人员才能完全看懂,非编程人员并不能完全看懂,并且由于程序源代码所表 达的信息并不直观,所W即使是编程人员,也需要进行详细分析,才能获取需要的信息。由 此可知,现有的直接通过日志中的程序源代码分析用户行为信息W及终端状况的效率较 低。

【发明内容】

[0004] 本发明实施例提供一种数据处理的方法和装置,用W解决现有技术直接通过日志 中的程序源代码分析用户行为信息W及终端状况的效率较低的问题。
[0005] -方面,本发明实施例提供一种数据处理的方法,所述方法包括:
[0006] 获取视频播放日志,所述视频播放日志为终端发送的视频播放过程中生成的日 志;
[0007] 从所述视频播放日志中提取与预设属性匹配的目标数据;
[000引根据所述预设属性,为所述目标数据添加信息标签,W便后续根据所述信息标签 分析所述视频播放日志,其中,所述信息标签用于描述所述目标数据的基本特征。
[0009] 另一方面,本发明实施例提供一种数据处理的装置,所述装置包括:
[0010] 获取单元,用于获取视频播放日志,所述视频播放日志为终端发送的视频播放过 程中生成的日志;
[0011] 提取单元,用于从所述获取单元获取的所述视频播放日志中提取与预设属性匹配 的目标数据;
[0012] 添加单元,用于根据所述预设属性,为所述提取单元提取的所述目标数据添加信 息标签,W便后续根据所述信息标签分析所述视频播放日志,其中,所述信息标签用于描述 所述目标数据的基本特征。
[0013] 本发明实施例提供的数据处理的方法和装置,能够在获取视频播放日志后,从该 视频播放日志中提取与预设属性匹配的目标数据,并为目标数据添加用于描述目标数据基 本特征的信息标签,在后续分析视频播放日志中记录的用户行为信息w及终端状况时,可 直接对信息标签进行分析,而无需分析日志中的程序源代码,从而提高了通过视频播放日 志分析用户行为信息W及终端状况的效率。
【附图说明】
[0014] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W根 据运些附图获得其他的附图。
[0015] 图1为本发明实施例提供的一种数据处理的方法的流程图;
[0016] 图2为本发明实施例提供的一种数据处理的装置的组成框图;
[0017] 图3为本发明实施例提供的另一种数据处理的装置的组成框图。
【具体实施方式】
[0018] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0019]本发明实施例提供了一种数据处理的方法,如图1所示,该方法包括:
[0020] 101、获取视频播放日志。
[0021 ]其中,视频播放日志为终端发送的视频播放过程中生成的日志。当终端生成视频 播放日志后,会将生成的视频播放日志上报给服务器,W便分析者(编程人员或非编程人 员)根据各个终端发送的视频播放日志对用户行为信息W及终端状况进行分析。在实际应 用中,视频播放日志主要分为两类:动作日志和屯、跳日志。其中,动作日志中包括与特定动 作相关的数据信息,例如,暂停、快进和快退等;屯、跳日志中包括与视频播放有关的会持续 变化的数据信息,例如,视频播放过程中终端的内存占用量W及视频下载量等。
[0022] 需要说明的是,服务器在获取视频播放日志时,可W实时获取接收到的最新的视 频播放日志,并对该最新的视频播放日志进行步骤102-103所述的操作;也可W获取预设周 期内接收到的视频播放日志,并对运段时间内的视频播放日志进行步骤102-103所述的操 作;也可W根据预设时间规则获取视频播放日志,并对获取的视频播放日志进行步骤102- 103所述的操作。
[0023] 102、从视频播放日志中提取与预设属性匹配的目标数据。
[0024] 其中,视频播放日志中记录有各种属性信息,例如,时间信息、设备信息和网络信 息等。在实际应用中,设备信息包括设备的静态属性信息和设备的动态属性信息。其中,设 备的静态属性信息包括:设备品牌、设备型号、设备内存容量、设备内置存储容量、设备外部 扩展存储容量、设备操作系统、设备CPU(Central Processing Unit,中央处理器)型号、设 备CPU频率、设备CPU核数和设备屏幕分辨率;设备的动态属性信息包括:设备可用内存大 小、设备CPU占用率、设备剩余电量、设备屏幕亮度和设备音量。此外,网络信息包括网络类 型、IP( Internet Protocol,网间协议)地址和地理位置。
[0025] 当服务器获取视频播放日志后,会将视频播放日志中的数据分别与预设的各个属 性进行匹配,从中获取与各个属性匹配成功的数据作为目标数据,并对目标数据进行后续 添加信息标签操作。
[0026] 103、根据预设属性,为目标数据添加信息标签,W便后续根据信息标签分析视频 播放日志。
[0027] 其中,信息标签用于描述目标数据的基本特征。
[0028] 若预设属性为时间,则从视频播放日志中提取时间后,可对该时间添加用于描述 其基本特征的信息标签,例如,工作时间标签(包括工作时间段和非工作时间段)、自然时段 标签(包括上午、中午、下午和晚间)、自然季节标签(包括春、夏、秋、冬)、节假日标签(例如 元旦假期、国庆节假期等)和带宽特征标签(包括带宽忙时和带宽闲时)等。
[0029] 若预设属性为设备,则从视频播放日志中提取关于设备的数据后,可对运些数据 添加用于描述其基本特征的信息标签,例如,设备类型标签(例如电视、手机等)、设备操作 系统类型标签(例如苹果系统、安卓系统或者微软系统)、设备操作系统版本标签(即操作系 统的版本号)、设备内存容量标签(包括超高容量、高容量、中等容量和低容量四个等级)、设 备存储容量标签(包括超高容量、高容量、中等容量和低容量四个等级)、设备屏幕分辨率标 签(包括移动兼容、极速、流杨、高清和超清五个等级)、设备内存占用率标签(包括非常高、 高、中、低和超低五个等级)、设备CPU占用率标签(包括非常高、高、中、低和超低五个等级)、 设备剩余电量标签(包括非常高、高、中、低和超低五个等级)、设备屏幕亮度标签(包括非常 高、高、中、低和超低五个等级)和设备音量标签(包括非常高、高、中、低和超低五个等级) 等。
[0030] 若预设属性为网络,则从视频播放日志中提取关于网络的数据后,可对运些数据 添加用于描述其基本特征的信息标签,例如,网络类型标签(包括有线网络、WiFi (Wireless-Fidelity,无线保真)、4G、3G和2G)、国家标签(例如中国)、省市标签(例如河北 省)、城市标签(例如石家庄市)和运营商标签(例如中国移动)等。
[0031] 当服务器为各个属性的数据添加完对应的信息标签后,会自动保存运些信息标 签,W便后续编程人员或者非编程人员均可通过查看信息标签分析用户行为信息或者终端 状态。
[0032] 需要说明的是,信息标签的表现形式可W为自然语言、也可W为其他语言,在此不 作限定。
[0033] 本发明实施例提供的数据处理的方法,能够在获取视频播放日志后,从该视频播 放日志中提取与预设属性匹配的目标数据,并为目标数据添加用于描述目标数据基本特征 的信息标签,在后续分析视频播放日志中记录的用户行为信息W及终端状况时,可直接对 信息标签进行分析,而无需分析日志中的程序源代码,从而提高了通过视频播放日志分析 用户行为信息W及终端状况的效率。
[0034] 进一步的,为了进一步提高分析视频播放日志的效率,可W在为目标数据添加信 息标签之后,根据预设格式保存目标数据对应的信息标签,从而使得在存在大量信息标签 时,各个信息标签之间的关系更加清晰。
[0035] 下面W W下两种保存方式为例进行介绍:
[0036] 方式一:将目标数据对应的信息标签导入到特定格式的表格中,并保存表格。
[0037] 在将信息标签导入到表格中并保存表格后,当需要对视频播放日志进行分析时, 分析者可直接获取该表格,并对表格中的信息标签进行分析,从中获得用户行为信息或者 终端状况等信息。
[0038] 示例性的,表1为方式一中特定格式的表格,从第Ξ行起,每一行对应一条日志,其 中包括运条日志的各个属性信息的信息标签,分析者通过查看信息标签可直观获知终端状 况W及用户行为信息(例如用户在哪个时间观看了视频),从而提高了分析视频播放日志的 效率。
[0039] 表 1
[0040]
[0042] 方式二:根据预设标签顺序,对视频播放日志中的目标数据对应的信息标签进行 排序;将排序后的信息标签构成多维标签向量,并保存多维标签向量。
[0043] 具体的,当信息标签W多维标签向量的形式存储时,一个多维标签向量对应一条 视频播放日志,分析者可通过查看多维标签向量中的各个元素(一个元素是一个信息标 签),实现对视频播放日志的分析。
[0044] 在实际应用中,多维标签向量的表现形式可W为"((工作时间标签,自然时段标 签,自然季节标签,节假日标签,带宽特征标签),(设备类型标签,设备操作系统类型标签, 设备操作系统版本标签,设备内存容量标签,设备存储容量标签,设备屏幕分辨率标签,设 备内存占用率标签,设备CPU占用率标签,设备剩余电量标签,设备屏幕亮度标签,设备音量 标签),(网络类型标签,国家标签,省市标签,城市标签,运营商标签))",也可W为"(工作时 间标签,自然时段标签,自然季节标签,节假日标签,带宽特征标签,设备类型标签,设备操 作系统类型标签,设备操作系统版本标签,设备内存容量标签,设备存储容量标签,设备屏 幕分辨率标签,设备内存占用率标签,设备CPU占用率标签,设备剩余电量标签,设备屏幕亮 度柄签,设备首量t不签,网络类型t不签,国豕t不签,省市t不签,城市t不签,担宫商柄签),在此 不作限定。
[0045] 进一步的,根据预设属性,为目标数据添加信息标签的具体实现方式可W为:获取 预设属性对应的标签条件;若目标数据与某标签条件匹配成功,则为目标数据添加匹配成 功的标签条件对应的信息标签。
[0046] 具体的,每个属性对应至少一个信息标签,每个信息标签包含至少一个标签条件, 若目标数据与某信息标签中的某标签条件匹配,则服务器会为该目标数据添加匹配成功的 标签条件对应的信息标签。
[0047] 示例性的,已知预设属性为时间,时间属性对应的信息标签包括工作时间标签、自 然时段标签、自然季节标签、节假日标签和带宽特征标签。下面W工作时间标签为例进行介 绍:工作时间标签中的标签条件包括"若满足工作日期间的8:00-19:00,则为工作时间段" 和"若满足工作日期间的8 :00-19:00?外的时间,则为非工作时间段"。若目标数据为 "2015-11-10,10:36:23",则将目标数据分别与运两个标签条件进行匹配,匹配结果为目标 数据是工作时间段,则为该目标数据添加内容为工作时间段的工作时间段标签。
[0048] 进一步的,在上述实施例中提及,在获取视频播放日志时,可W实时获取接收到的 最新的视频播放日志,并对该最新的视频播放日志中各个属性的数据添加信息标签;也可 W获取在预设周期内接收到的视频播放日志,并对运些视频播放日志中各个属性的数据分 别添加信息标签。
[0049] 需要说明的是,通过实时对接收到的最新的视频播放日志中各个属性的数据添加 信息标签,能够在分析者需要分析视频播放日志中用户行为信息W及终端状况时,可快速 获取当前时间之前的任何一条视频播放日志的信息标签,而无需等待信息标签的添加,从 而提高了分析效率。
[0050] 进一步的,为了节省服务器侧的存储空间,提高资源利用率,可W在服务器为目标 数据添加信息标签之后,将视频播放日志删除。也就是说,在获得信息标签后,可W将视频 播放日中的程序源代码删除。
[0051] 进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种数据处理 的装置,该装置应用于服务器中,如图2所示,该装置包括:获取单元21、提取单元22和添加 单元23。其中,
[0052] 获取单元21,用于获取视频播放日志,视频播放日志为终端发送的视频播放过程 中生成的日志;
[0053] 当终端生成视频播放日志后,会将生成的视频播放日志上报给服务器,W便分析 者根据各个终端发送的视频播放日志对用户行为信息W及终端状况进行分析。在实际应用 中,视频播放日志主要分为两类:动作日志和屯、跳日志。其中,动作日志中包括与特定动作 相关的数据信息,例如,暂停、快进和快退等;屯、跳日志中包括与视频播放有关的会持续变 化的数据信息,例如,视频播放过程中终端的内存占用量W及视频下载量等。
[0054] 提取单元22,用于从获取单元21获取的视频播放日志中提取与预设属性匹配的目 标数据;
[0055] 其中,视频播放日志中记录有各种属性信息,例如,时间信息、设备信息和网络信 息等。在实际应用中,设备信息包括设备的静态属性信息和设备的动态属性信息。其中,设 备的静态属性信息包括:设备品牌、设备型号、设备内存容量、设备内置存储容量、设备外部 扩展存储容量、设备操作系统、设备CPU型号、设备CPU频率、设备CPU核数和设备屏幕分辨 率;设备的动态属性信息包括:设备可用内存大小、设备CPU占用率、设备剩余电量、设备屏 幕亮度和设备音量。此外,网络信息包括网络类型、IP地址和地理位置。
[0056] 添加单元23,用于根据预设属性,为提取单元22提取的目标数据添加信息标签,W 便后续根据信息标签分析视频播放日志,其中,信息标签用于描述目标数据的基本特征。
[0057] 需要说明的是,信息标签的表现形式可W为自然语言、也可W为其他语言,在此不 作限定。
[0058] 本发明实施例提供的数据处理的装置,能够在获取视频播放日志后,从该视频播 放日志中提取与预设属性匹配的目标数据,并为目标数据添加用于描述目标数据基本特征 的信息标签,在后续分析视频播放日志中记录的用户行为信息W及终端状况时,可直接对 信息标签进行分析,而无需分析日志中的程序源代码,从而提高了通过视频播放日志分析 用户行为信息W及终端状况的效率。
[0化9] 进一步的,如图3所示,该装置还包括:
[0060]保存单元24,用于添加单元23为目标数据添加信息标签之后,根据预设格式保存 目标数据对应的信息标签。
[0061 ] 进一步的,如图3所示,保存单元24,包括:
[0062] 导入模块241,用于将目标数据对应的信息标签导入到特定格式的表格中;
[0063] 第一保存模块242,用于保存表格。
[0064] 进一步的,如图3所示,保存单元24,包括:
[0065] 排序模块243,用于根据预设标签顺序,对视频播放日志中的目标数据对应的信息 标签进行排序;
[0066] 构建模块244,用于将排序模块243排序后的信息标签构成多维标签向量;
[0067] 第二保存模块245,用于保存构建模块构建的多维标签向量。
[006引进一步的,如图3所示,添加单元23,包括:
[0069] 获取模块231,用于获取预设属性对应的标签条件;
[0070] 添加模块232,用于当目标数据与某标签条件匹配成功时,为目标数据添加匹配成 功的标签条件对应的信息标签。
[0071] 进一步的,如图3所示,获取单元21,包括:
[0072] 第一获取模块211,用于实时获取接收到的最新的视频播放日志;
[0073] 第二获取模块212,用于获取在预设周期内接收到的视频播放日志。
[0074] 通过第一获取模块211实时获取接收到的最新的视频播放日志,添加单元再对该 最新的视频播放日志中各个属性的数据添加信息标签,能够在分析者需要分析视频播放日 志中用户行为信息W及终端状况时,可快速获取当前时间之前的任何一条视频播放日志的 信息标签,而无需等待信息标签的添加,从而提高了分析效率。
[00巧]进一步的,如图3所示,该装置还包括:
[0076] 删除单元25,用于在添加单元23为目标数据添加信息标签之后,将视频播放日志 删除。
[0077] 在获得信息标签后,删除单元25将视频播放日志删除,能够节省服务器的存储空 间,从而提高资源利用率。
[0078] 该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方 法实施例中的细节内容进行逐一寶述,但应当明确,本实施例中的装置能够对应实现前述 方法实施例中的全部内容。
[0079] 上述数据处理的装置包括存储器和处理器,上述获取单元、提取单元和添加单元 等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现 相应的功能。
[0080] W上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可 W是或者也可W不是物理上分开的,作为单元显示的部件可W是或者也可W不是物理单 元,即可W位于一个地方,或者也可W分布到多个网络单元上。可W根据实际的需要选择其 中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性 的劳动的情况下,即可W理解并实施。
[0081] 通过W上的实施方式的描述,本领域的技术人员可W清楚地了解到各实施方式可 借助软件加必需的通用硬件平台的方式来实现,当然也可W通过硬件。基于运样的理解,上 述技术方案本质上或者说对现有技术做出贡献的部分可软件产品的形式体现出来,该 计算机软件产品可W存储在计算机可读存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指 令用W使得一台计算机设备(可W是个人计算机,服务器,或者网络设备等)执行各个实施 例或者实施例的某些部分所述的方法。
[0082] 最后应说明的是:W上实施例仅用W说明本发明的技术方案,而非对其限制;尽管 参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可 W对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换; 而运些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和 范围。
【主权项】
1. 一种数据处理的方法,其特征在于,所述方法包括: 获取视频播放日志,所述视频播放日志为终端发送的视频播放过程中生成的日志; 从所述视频播放日志中提取与预设属性匹配的目标数据; 根据所述预设属性,为所述目标数据添加信息标签,以便后续根据所述信息标签分析 所述视频播放日志,其中,所述信息标签用于描述所述目标数据的基本特征。2. 根据权利要求1所述的方法,其特征在于,在为所述目标数据添加信息标签之后,所 述方法进一步包括: 根据预设格式保存所述目标数据对应的信息标签。3. 根据权利要求1或2所述的方法,其特征在于,根据预设格式保存所述目标数据对应 的信息标签,包括: 将所述目标数据对应的信息标签导入到特定格式的表格中; 保存所述表格。4. 根据权利要求1或2所述的方法,其特征在于,根据预设格式保存所述目标数据对应 的信息标签,包括: 根据预设标签顺序,对所述视频播放日志中的目标数据对应的信息标签进行排序; 将排序后的信息标签构成多维标签向量; 保存所述多维标签向量。5. 根据权利要求1至4中任一项所述的方法,其特征在于,根据所述预设属性,为所述目 标数据添加信息标签,包括: 获取所述预设属性对应的标签条件; 若所述目标数据与某标签条件匹配成功,则为所述目标数据添加匹配成功的标签条件 对应的信息标签。6. 根据权利要求1至5中任一项所述的方法,其特征在于,在为所述目标数据添加信息 标签之后,所述方法进一步包括: 将所述视频播放日志删除。7. -种数据处理的装置,其特征在于,所述装置包括: 获取单元,用于获取视频播放日志,所述视频播放日志为终端发送的视频播放过程中 生成的日志; 提取单元,用于从所述获取单元获取的所述视频播放日志中提取与预设属性匹配的目 标数据; 添加单元,用于根据所述预设属性,为所述提取单元提取的所述目标数据添加信息标 签,以便后续根据所述信息标签分析所述视频播放日志,其中,所述信息标签用于描述所述 目标数据的基本特征。8. 根据权利要求7所述的装置,其特征在于,所述装置进一步包括: 保存单元,用于在所述添加单元为所述目标数据添加信息标签之后,根据预设格式保 存所述目标数据对应的信息标签。9. 根据权利要求7或8所述的装置,其特征在于,所述保存单元,包括: 导入模块,用于将所述目标数据对应的信息标签导入到特定格式的表格中; 第一保存模块,用于保存所述表格。10. 根据权利要求7或8所述的装置,其特征在于,所述保存单元,包括: 排序模块,用于根据预设标签顺序,对所述视频播放日志中的目标数据对应的信息标 签进彳丁排序; 构建模块,用于将所述排序模块排序后的信息标签构成多维标签向量; 第二保存模块,用于保存所述构建模块构建的所述多维标签向量。11. 根据权利要求7至10中任一项所述的装置,其特征在于,所述添加单元,包括: 获取模块,用于获取所述预设属性对应的标签条件; 添加模块,用于当所述目标数据与某标签条件匹配成功时,为所述目标数据添加匹配 成功的标签条件对应的信息标签。12. 根据权利要求7至11中任一项所述的装置,其特征在于,所述装置进一步包括: 删除单元,用于在所述添加单元为所述目标数据添加信息标签之后,将所述视频播放 日志删除。
【文档编号】H04N21/442GK105872731SQ201510845407
【公开日】2016年8月17日
【申请日】2015年11月26日
【发明人】杜炤
【申请人】乐视云计算有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1