用于评估表单页面使用效果及提供原始数据的方法及装置的制造方法_4

文档序号:9687248阅读:来源:国知局
] 平均使用次数,其计算规则为;平均使用次数=页面PV/页面UV ;
[0157] 平均回访周期,其计算规则为;平均回访周期=用户访问时间跨度/老用户PV ;所 述访问时间跨度是指最后一次访问日期与第一次访问日期之间的时间间隔。
[015引需要说明的是,上述指标的定义采用了本领域人员的常规表述方式,在具体计算 上述某个指标的值时,都是在指定的时间段内进行的,例如;某表单页面在7天内的有效提 交率等。
[0159] 上面描述的基础数据指标和复合指标是本申请实施例采用的表单页面使用效果 指标,在其他实施方式中,可W根据具体的评估需求定义其他的指标W及相应的计算规则, 只要通过所述计算规则计算得到的指标能够评估表单页面的使用情况,就都能够实现本申 请的技术核必,都在本申请的保护范围之内。
[0160] 在步骤102中已经将客户端用户对表单页面及其所包含字段的访问情况的表单 操作原始数据,存储在日志文件中,因此可W直接对所述日志文件中记录的表单操作原始 数据进行分析计算,获得对应具体表单页面的指标值,作为评估所述表单页面使用效果的 依据。
[0161] 考虑到表单操作原始数据比较零散、而且数量通常比较多,直接基于该数据进行 分析计算,会比较耗时,因此本申请提供了一种优选实施方式,在执行上述分析计算之前先 执行本步骤,即;根据预先设定的表单页面使用效果指标及其计算规则,对所述日志文件中 记录的表单操作原始数据W及预先获取的用户基本信息进行汇总分析,生成关于表单页面 W及表单字段的可供查询的中间数据表。
[0162] 为了生成便于查询的中间数据表,首先要根据所述表单页面使用效果指标及其计 算规则,进行中间数据表的设计,即:确定采用哪几个中间数据表存储日志文件记录的表单 操作原始数据,W及每个数据表应该包含哪些字段。例如,设计如下所示的Η个数据表:
[0163] 表二、字段错误数据中间表nbas_fielde;r;ror
[0164]
[0165] 表Η、字段耗时数据中间表nbas_fiel化ime
[0166]
[0167]
[0168] 表四、form打点数据数据中间表nbas_fo;rm
[0169]

[0170] 完成中间数据表的设计后,就可W对所述日志文件中记录的表单操作原始数据W 及预先获取的用户基本信息进行汇总分析,并按照所述中间数据表的结构生成数据记录, 存储在中间数据表中。
[0171] 所述预先获取的用户基本信息是指与用户属性相关的信息,例如;用户所在的国 家(或者地区)、用户的帐号类型(收费用户、免费用户等)等,送些信息都属于用户的基本 信息,可W在用户注册过程中获取或者采用其他方式获取,并预先存储在系统中,需要时可 W通过用户标识查找到对应的基本信息。
[0172] 上述对表单操作原始数据和用户基本信息进行汇总分析的过程,通常包括W下操 作:把收集到的表单操作原始数据进行加工,去除掉表单操作原始数据中不需要的部分,保 留需要的部分,并进行一些必要的关联计算或查询,然后存储到中间数据表中,供后续的查 询操作使用。
[0173] 例如,从"表单字段blur出错"日志中提取出关于某表单字段的出错信息后,并从 该条信息中获取对应的用户标识信息(或者用其他方式获取用户标识,例如从表单页面标 识PagelD字段中提取),然后根据用户标识查询已存储的用户基本信息,获取该用户所在 的国家或地区W及该用户的帐号类型等,再将该表单字段的出错信息和对应用户的上述基 本信息根据用户标识进行关联拼接,得到关于某表单字段blur出错的更为详细的信息,并 按照上述表二定义的数据格式存储在nbas_fielderror表中。上面给出的Η个中间数据表 W及上述例子描述的汇总分析过程仅仅是示意性的,在实际实施过程中可W根据需求设计 不同的中间数据表,实际的汇总分析过程可能会更为复杂。
[0174] 在具体实施过程中,上述数据处理过程通常也称作ETL(Extraction-Transformat ion-Loading的英文缩写)计算服务过程,即对表单操作原始数据进行提取、转换、装载的 过程,通过该过程,可W将采集到的分散、零乱的表单操作原始数据整合在一起,生成关于 表单页面W及表单字段的可供查询的中间数据表,将送些中间数据表存储在数据库中,即 得到了关于表单页面的用户行为数据库。
[0175] 之所W称为中间数据表,是因为所述数据表中存放的并不是最终的指标值,而是 可供查询的原子数据,计算某个指标值时还需要基于送些原子数据进行查询和计算。由于 预先执行了上述ETL计算服务过程,零散的原始数据按照相互之间的关系整合在不同的数 据表中,从而能够通过相对简单的查询和计算过程获取指标的值,有效提高后续查询的执 行效率。
[0176] 上述mi计算服务过程通常不是一次完成的,随着日志文件的不断更新,该计算 服务过程也会定期执行,不断地将日志文件中的新数据存储到中间数据表中,生成新的可 供查询的中间数据表。在本实施例的一个具体例子中,每天执行一次rni计算服务,执行 ETL计算服务的频率可W根据具体的需要进行相应的调整,本申请对此不作具体的限定。
[0177] 步骤104 ;根据预先设定的表单页面使用效果指标及其计算规则,对所述中间数 据表进行相应的查询和计算,获取对应具体表单页面的指标值,作为评估所述表单页面使 用效果的依据。
[0178] 执行步骤103生成了可供查询的中间数据表,在本步骤中就可W针对评估者的指 标查询请求,获取对应具体表单页面的指标值,供评估者评估表单页面的用户使用效果。具 体说该过程包括W下104-1至104-3送Η个子步骤,下面结合附图2进行说明。
[0179] 步骤104-1 ;接收评估者发送的查询请求,所述查询请求中包含针对具体表单页 面的待查询指标。
[0180] 评估者需要对某个表单页面的用户使用效果进行评估时,会向提供指标查询服务 的服务端发送指标查询请求,该请求中包含针对具体表单页面的待查询指标。提供指标查 询服务的服务端接收该请求后,执行后续步骤104-2,查询计算所述指标的值。
[0181] 步骤104-2 ;按照预先设定的表单页面使用效果指标包含的对所述指标的定义, 在所述中间数据表中执行查询操作,获取所述指标的值;或者,获取计算所述指标所需的相 关数据,并按照所述指标的计算规则计算所述指标的值。
[0182] 为了便于查询计算指标的值,可W预先设置指标查询规则。所述指标查询规则是 指,根据表单页面使用效果指标及其计算规则设置的、如何将对特定指标的查询请求转换 为具体的查询操作,从而从所述中间数据表中查询计算出所述待查询指标的值。如果中间 数据表存储在关系型数据库中,则指标查询规则设置的就是如何通过具体的S化语句从中 间数据表中查询计算所述指标的值。
[0183] 对于基础数据指标,通常可W执行一次查询操作获取所述指标的值;对于复合指 标,通常需要执行两次或者多次查询操作,获取计算该指标所需的相关数据,(例如分别获 取计算规则中的分子部分和分母部分的值),然后再按照计算规则执行相应的计算,最终获 取所述指标的值。
[0184] 例如,评估者要获取7天内某张表单页面的新老用户分布情况,根据指标查询规 则的设置,将对该指标的查询转换成如下所示的S化语句,通过对上述表四所示的nbas_ 化rm数据表的一次查询,即可获取所述指标的值:
[0185] selectform_id,is_old,count(*)ascountsfromnbas_formwhereform_id= 壯orm_id#andact="entericTandDATE_SUB(CU畑ATEQ,INTERVAL7DAY)< =stat_date groupbyis_oldorderbyis_olddesc;
[0186] 再例如,评估者要获取某字段7天内新用户提交的错误数量,根据指标查询规 则的设置,将对该指标的查询转换成如下所示的S化语句,通过对上述表二所示的nbas_ 円elderror数据表的一次查询,即可获取所述指标的值。
[0187]selectmark_id,count(*)ascountsfromnbas_fielderrorwheremark_id= #mark_id#andis_old= "yes"andDATE_SUB(CURDATE〇,INTERVAL7DAY)< =stat_date;
[0188] 如果待查询的所述指标是复合指标,例如,某字段在7天内的字段出错率,则需要 针对nbas_fielderror数据表执行两次查询操作,分别获取该字段在7天内的出错数,W及7 天内所有字段的出错数,然后按照预先设定的表单页面使用效果指标包含的对该指标的计 算规则:字段出错率=本字段出错数/所有字段出错数,计算已获取的上述两个数值的比 值,就得到了该字段在7天内的字段出错率。
[0189] 上面描述的实施方式,接收评估者提供的待查询指标后,根据预先设定的指标查 询规则生成相应的查询语句执行对应的查询操作、并根据需要按照计算规则执行进一步的 计算,最终获取待查询指标的值。在其他实施方式中,可W不设置指标查询规则,而是由评 估者或者需要进行指标查询的用户自行输入符合语法规则的查询语句,并进行相应的计 算,同样可W实现本申请的技术方案。
[0190] 步骤104-3;将已获取的所述指标的值返回给所述评估者,供所述评估者评估表 单页面的使用效果。
[0191] 评估者通过上述查询过程获取了关于表单页面的指标值,就可W依据指标值评估 表单页面的使用效果了。由于采用了本申请提供的方法,各个指标值反应的就是表单页面 的用户使用情况,因此评估者通常可W直接对获取的指标值进行解读,从而获知具体表单 页面的用户使用效果。
[0192] 例如,评估者通过查询操作获取了某个表单页面的有效提交平均耗费时间,如果 该指标值明显大于预先设定的阔值或者是常规经验值,说明该表单页面可能存在界面设计 不够清晰或者为用户提供的引导、参考信息不够明确等问题。送种情况下,评估者可W进一 步查询该表单页面中的各个字段的字段耗时指标W及字段出错率等信息,从而获知该表单 页面中是否存在导致用户耗时较长的字段,并针对字段出错原因,进一步有针对性地分析 送些字段采用的设计元素是否合理、给出的默认值是否合适、是否有必要的、清晰的提示信 息等,从而对表单页面的改进提供有效的指导。
[0193] 上面通过步骤101-步骤104,描述了本申请技术方案的一种优选实施方式。需要 说明的是,上述步骤对于本申请技术方案的实施来说并不都是必需的。例如,步骤101在表 单页面中部署化vascript代码是为了通过化vascript打点的方式比较快捷地收集原始数 据,在其他实施方式中可W不执行上述步骤101,而是采用其他方式进行原始数据的采集, 本申请对此不作具体限定,只要后台服务端能够采集到反映客户端对表单页面及其字段的 访问情况的原始数据即可;此外,执行ETL计算服务的步骤103也不是必需的,该步骤是为 了对原始数据进行预处理生成中间数据表,W提高后续查询操作的执行效率,在其他实施 方式中可W不
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1