一种报表生成方法、装置和系统的制作方法_2

文档序号:9200347阅读:来源:国知局
广信息的投放效果数据,得到实时投放效果数据”具体可以如下:
[0043]根据该实时操作数据计算该推广信息的浏览量、点击率、下载量和/或扣费等,对该浏览量、点击率、下载量和/或扣费进行统计,得到实时投放效果数据。
[0044]例如,具体可以采用流式实时计算系统,如腾讯数据处理系统(TDP,Tencent DataProcessing)来进行实时计算并统计,以得到实时投放效果数据,等等。
[0045]可选的,为了进一步提高所得数据的准确性和可靠性,还可以对这些数据进行校对,即,在步骤“根据该实时操作数据计算该推广信息的投放效果数据,得到实时投放效果数据”之后,该报表生成方法还可以包括如下操作:
[0046](I)根据该离线数据计算该推广信息的投放效果数据,得到离线投放效果数据。
[0047]例如,如果该离线数据存储在TDW中,则此时,可以由TDW根据该离线数据计算该推广信息的投放效果数据,比如根据该离线数据计算该推广信息的浏览量、点击率、下载量和/或扣费等,然后对该浏览量、点击率、下载量和/或扣费进行统计,得到离线投放效果数据。
[0048](2)采用离线投放效果数据对该实时投放效果数据进行校对。
[0049]例如,具体可以将该离线投放效果数据和实时投放效果数据进行比较,若差异低于预置阈值,则确定校对通过;反之,若差异高于预置阈值,则确定校对不通过。
[0050](3)若校对通过,则执行根据该实时投放效果数据生成报表的步骤,具体可参见步骤 105 ;
[0051](4)若校对不通过,则执行根据该离线投放效果数据生成报表的步骤,具体可参见步骤105。
[0052]104、在确定当前运行环境存在故障时,根据该离线数据计算该推广信息的投放效果数据得到离线投放效果数据。
[0053]例如,具体可以根据该离线数据计算该推广信息的浏览量、点击率、下载量和/或扣费等;对该浏览量、点击率、下载量和/或扣费进行统计,得到离线投放效果数据。
[0054]比如,若该离线数据存储在TDW中,则此时可以由TDW来计算该离线投放效果数据,此处计算方式与步骤103中的离线计算相同,详见步骤103,在此不再赘述。
[0055]105、根据该实时投放效果数据或离线投放效果数据生成报表。
[0056]其中,若此前已经得到实时投放效果数据,则此时可以根据实时投放效果数据生成报表,同理,若此前得到的是离线投放效果数据,那么此时,则可以根据离线投放效果数据生成报表。
[0057]其中,该报表的样式可以根据实际应用的需求预先进行设定,比如,可以预置多种报表模板以供用户选择,其中,每一种报表模板均具有报表模板信息,用于标识并描述其对应的报表模板;即,步骤“根据该实时投放效果数据或离线投放效果数据生成报表”具体可以如下:
[0058]获取报表模板信息,根据该报表模板信息和实时投放效果数据生成报表;或者,
[0059]获取报表模板信息,根据该报表模板信息和离线投放效果数据生成报表。
[0060]由上可知,本实施例采用获取用户对推广信息如广告的实时操作数据,将该实时操作数据保存至离线数据中,并对当前运行环境是否存在故障进行监测,若不存在故障,则根据该实时操作数据计算该推广信息的投放效果数据,得到实时投放效果数据;反之,若存在故障,则根据该离线数据计算该推广信息的投放效果数据得到离线投放效果数据,然后根据该实时投放效果数据或离线投放效果数据生成报表;由于在运行环境正常的情况下,一般可以提供正确可靠的数据,因此,此时采用实时计算的方式来得到报表,不仅可以保证数据的实时性,提高数据处理效率,而且,也可以保证其正确性和可靠性;而在运行环境存在故障的情况下,本方案又可以以离线计算的方式作为补充,以保证数据的正确性和可靠性,因此,相对于现有方案而言,本方案可以更为灵活地根据当前的运行环境选择最合适的处理方式来生成报表,不仅可以保证可靠性和准确性,而且可以提高其数据处理效率,实现实时性。
[0061]实施例二、
[0062]根据实施例一所描述的方法,以下将举例作进一步详细说明。
[0063]在本实施例中,以该推广信息具体为广告,且该报表生成装置作为报表生成子系统集成在广告推荐系统中为例进行说明。
[0064]如图2a所示,该广告推荐系统可以包括广告投放子系统、报表展示子系统和报表生成子系统,其中,报表生成子系统可以包括海量数据接入模块、实时数据计算模块、存储模块、离线数据计算模块和报表生成模块等,如下:
[0065](I)广告投放子系统;
[0066]该广告投放子系统,用于获取需要投放的广告数据,将获取到的广告数据投放给用户,并收集用户对该投放的广告数据所作出的操作,比如浏览、点击和/或下载等,得到相应的操作信息,将该操作信息上报给报表生成子系统。
[0067](2)报表生成子系统;
[0068]该报表生成子系统可以包括海量数据接入模块、实时数据计算模块、存储模块、离线数据计算模块和报表生成模块等,如下:
[0069]a)海量数据接入模块:用于将广告投放子系统上报的操作信息接入,根据该操作信息生成实时操作数据,并分别将该实时操作数据传送给实时数据计算模块和存储模块。由于该操作信息的量较大,一般可以达到亿级流量,因此,该海量数据接入模块具体可以腾讯数据银行(TDBank,Tencent Data Bank)等海量数据接入系统来实现。
[0070]此外,该海量数据接入模块,还可以对当前运行环境是否存在故障进行监测。
[0071]b)实时数据计算模块:用于接收海量数据接入模块传送的实时操作数据,在确定当前运行环境不存在故障时,根据接收到的实时操作数据计算该广告数据的实时投放效果数据。
[0072]其中,该实时数据计算模块具体可以采用TDP来实现。
[0073]c)存储模块:用于基于内存存储,缓存实时数据计算模块的计算数据,包括计算过程中所涉及或产生的数据、以及得到的实时投放效果数据等,并向报表生成模块提供该实时投放效果数据。
[0074]其中,该存储模块可以采用多种方式来实现,比如,可以采用分布式KV(关键字-值,Key-Value)存储系统来实现。
[0075]d)离线数据计算模块:基于hadoop架构,可以支撑海量数据的存储与离线计算,用于接收海量数据接入模块传送的实时操作数据,将接收到的实时操作数据保存至离线数据中,作为容灾备份;此外,在确定当前运行环境存在故障时,还可以根据相应的离线数据离线计算该广告数据的离线投放效果数据,并向报表生成模块提供该离线投放效果数据。
[0076]可选的,该离线数据计算模块,还可以接收报表生成模块回写的实时投放效果数据,并采用离线投放效果数据对所述实时投放效果数据进行校对,若校对通过,则触发报表生成模块执行根据所述实时投放效果数据生成报表的操作;若校对不通过,则触发报表生成模块执行根据所述离线投放效果数据生成报表的操作。
[0077]其中,该离线数据计算模块可以采用TDW实现。
[0078]e)报表生成模块:用于根据该实时投放效果数据或离线投放效果数据生成报表,将该报表传送给报表展示子系统。其中,还可以将实时投放效果数据回写到离线数据计算模块(比如TDW)中,供数据校对使用。
[0079](3)报表展示子系统;
[0080]报表展示子系统,用于接收报表生成子系统发送的报表,在接收到报表展示请求时,根据该报表展示请求对相应的报表进行展示。
[0081]基于上述广告推荐系统的结构,以下将对其执行流程进行详细说明。
[0082]一种报表生成方法,如图2b所示,具体流程可以如下:
[0083]201、广告投放子系统实时获取用户对投放的广告数据所作出的操作,比如浏览、点击和/或下载等,得到相应的操作信息,将该操作信息上报给报表生成子系统的海量数据接入模块。
[0084]202、海量数据接入模块在接收到该操作信息后,根据该操作信息生成实时操作数据,并将该实时操作数据传送给实时数据计算模块和离线数据计算模块。
[0085]203、海量数据接入模块对当前运行环境是否存在故障进行监测,若确定当前运行环境不存在故障,则触发实时数据计算模块执行步骤204,若确定当前运行环境存在故障,则触发离线数据计算模块执行步骤205。
[0086]例如,具体可以
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1