一种APP应用商店搜索关键字的分析方法与流程

文档序号:12470353阅读:1184来源:国知局
一种APP应用商店搜索关键字的分析方法与流程

本发明属于App应用商店搜索和大数据处理的技术领域,具体地涉及一种APP应用商店搜索关键字的分析方法。



背景技术:

随着智能移动终端的迅速普及和迅猛发展,App应用商店也越来越被大众接受并使用。为App选择正确的关键字,在产品的成功上会起到至关重要的作用,根据相关数据显示,63%的下载量源于应用商店的搜索行为,所以App开发商一定要确保在关键字上下足功夫,否则这会直接导致App开发商损失大量潜在App下载量。而且,APP应用商店搜索关键字的分析结果可以作为潜力App风险投资的参考资料。

但是,当前缺少以第三方的视角分析各大App应用商店的搜索关键字数据的技术,尚无官方渠道来获取各大App应用商店的搜索关键字数据。



技术实现要素:

本发明的技术解决问题是:克服现有技术的不足,提供一种APP应用商店搜索关键字的分析方法,其以第三方的视角分析各大App应用商店的搜索关键字数据,从而可进行进一步数据分析,为潜力App风险投资提供参考。

本发明的技术解决方案是:这种APP应用商店搜索关键字的分析方法,其包括以下步骤:

(1)从运营商移动核心网中镜像出2G/3G/4G流量数据;

(2)实时采集、清洗步骤(1)的数据,将清洗出的App应用商店搜索关键字数据存储在数据库中;

(3)搜索关键字原始数据库:将实时清洗App应用商店搜索关键字数据系统输出的日期时间、App应用商店名称、搜索关键字、移动终端用户ID数据存储到数据库中;

(4)每日统计搜索关键字任务:本任务每日执行一次,统计前一天的各大App应用商店中的每个搜索关键字的使用人数,并且按照搜索关键字的使用人数进行降序排序,将输出结果保存到搜索关键字日统计数据库中;

(5)每月统计搜索关键字任务:本任务每月执行一次,统计上个月的各大App应用商店中的每个搜索关键字的使用人数,并且按照搜索关键字的使用人数进行降序排序,将输出结果保存到搜索关键字月统计数据库中。

由于使用运营商的移动互联网原始数据作为数据来源,进行各大App应用商店搜索关键字分析,因此以第三方的视角分析各大App应用商店的搜索关键字数据,从而可进行进一步数据分析,为潜力App风险投资提供参考。

附图说明

图1是根据本发明的APP应用商店搜索关键字的分析方法的流程图。

图2是根据本发明的HTTP数据报文解析示意图。

图3是根据本发明的提取搜索关键字示意图。

具体实施方式

如图1所示,这种APP应用商店搜索关键字的分析方法,其包括以下步骤:

(1)从运营商移动核心网中镜像出2G/3G/4G流量数据;

(2)实时采集、清洗步骤(1)的数据,将清洗出的App应用商店搜索关键字数据存储在数据库中;

(3)搜索关键字原始数据库:将实时清洗App应用商店搜索关键字数据系统输出的日期时间、App应用商店名称、搜索关键字、移动终端用户ID数据存储到数据库中;

(4)每日统计搜索关键字任务:本任务每日执行一次,统计前一天的各大App应用商店中的每个搜索关键字的使用人数,并且按照搜索关键字的使用人数进行降序排序,将输出结果保存到搜索关键字日统计数据库中;

(5)每月统计搜索关键字任务:本任务每月执行一次,统计上个月的各大App应用商店中的每个搜索关键字的使用人数,并且按照搜索关键字的使用人数进行降序排序,将输出结果保存到搜索关键字月统计数据库中。

由于使用运营商的移动互联网原始数据作为数据来源,进行各大App应用商店搜索关键字分析,因此以第三方的视角分析各大App应用商店的搜索关键字数据,从而可进行进一步数据分析,为潜力App风险投资提供参考。

另外,所述步骤(1)的数据包括:移动设备的附着、去附着、路由区域更新的管理数据报文,以及移动设备访问互联网的业务数据报文。

另外,所述步骤(2)中数据格式为:

日期时间:生成数据的时间,包括年月日时分;

App应用商店名称:搜索关键字数据的来源App应用商店;

搜索关键字:App应用商店中搜索的关键字;

移动终端用户ID:在移动终端设备的某App应用商店中搜索关键字的

移动终端用户的标识,其原文来源是IMSI、IMEI或MSISDN。

另外,所述步骤(2)包括以下分步骤:

(2.1)HTTP数据报文解析;

(2.2)HTTP数据报文溯源;

(2.3)App应用商店流量识别;

(2.4)提取搜索关键字。

另外,如图2所示,所述步骤(2.1)中,按照TCP/IP协议自底层向上层解析相关数据报文。

另外,所述步骤(2.1)中,当移动核心网中的HTTP请求报文时,依次解析承载隧道协议部分的网络接口层、网络层IP协议、传输层UDP协议和应用层GTP协议和隧道协议业务本身的网络层IP协议、传输层TCP协议和应用层HTTP协议。

另外,所述步骤(2.2)中,根据HTTP数据报文GTP协议的TEID查询移动终端附着/区域更新时记录的TEID与IMSI的映射关系。

另外,所述步骤(2.3)中,根据输入HTTP报文HOST属性,匹配各大App应用商店流量的HOST特征,匹配算法使用KMP模式匹配算法;如果匹配上App应用商店,输入HTTP数据和App应用商店名称,否则不处理该报文。

另外,App应用商店查询关键字的HTTP报文格式通过搭建实验环境抓取,包括以下分步骤:

(2.3.1)准备一台可以正常上网的笔记本电脑,将其搭建成无线wifi服务器;

(2.3.2)将手机连接上边的无线wifi服务器;

(2.3.3)笔记本电脑上运行抓包程序Wireshark,过滤显示HTTP报文;

(2.3.4)手机上打开App应用商店,查询样例App;

(2.3.5)Wireshark上过滤框中查询样例App,如果App名称中包含中文,使用UTF-8或GB2312编码代替中文,查看查询结果,以确定App应用商店搜索请求使用的编码方式;

(2.3.6)根据步骤(2.3.5)中显示的报文,总结出App应用商店查询关键字的HTTP报文。

另外,如图3所示,所述步骤(2.4)包括以下分步骤:

(2.4.1)根据App应用商店名称获取关键字模式配置;

(2.4.2)判断输入报文的URL是否满足关键字模式中对URL的要求,如果不满足要求,退出当前处理;

(2.4.3)将输入报文的URL参数分解成键值对集合,URL参数间使用&分隔,参数键值间使用=分隔,根据分隔符号分解参数;

(2.4.4)判断参数键值对集合是否包含关键字模式中的键名称,如果不满足要求,退出当前处理;

另外,获取键名称对应的参数值,根据编码方式解码,输出日期时间、App应用商店名称、搜索关键字、移动终端用户ID。

本发明的有益效果如下:

1.本案中的原始数据直接来源于运营商的移动互联网数据,中间无人工干预,确保分析数据结果是真实场景的如实反映。

2.本案中可以拉通各大App应用商店的搜索关键字数据,进行横向对比,也可以以时间维度纵向分析每个搜索关键字的热度变化趋势,进行多维度、多角度数据分析。

以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1