本发明属于企业信息分析方法技术领域,特别是涉及一种基于大数据的企业信息分析方法。
背景技术:
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像mapreduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
目前,现有的企业信息分析方法在企业发展定位方面的分析不够全面,且在分析过程中,过于依赖用户的已知兴趣点,长久之后,会造成用户对单一兴趣点的疲劳反应。
技术实现要素:
本发明的目的在于提供一种基于大数据的企业信息分析方法,根据该企业的销售总额确定该企业与平均值之间的市场份额差距,便于企业对自身发展状况的定位,以便制定未来发展战略;通过随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,以便于采集已知用户兴趣点之外的兴趣点,解决了现有的企业信息分析方法在企业发展定位方面的分析不够全面的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于大数据的企业信息分析方法,包括以下步骤:
步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;
步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;
步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:
a:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;
b:根据网页搜索热度对每一网页集合中的网页进行规划。
进一步地,所述步骤一中,对用户所输入的企业名称进行处理时包括以下步骤:
ss01:根据该企业的服务类型和企业产品确定该企业所经营行业,并对该行业进行行业集中度分析;
ss02:将行业集中度的分析结果进行平均值计算,并根据该企业的销售总额确定该企业与平均值之间的市场份额差距。
进一步地,所述步骤二中用户搜索使用信息包括用户的web访问日志和cookie。
进一步地,所述步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为对每一网络集合根据搜索热度的递减趋势进行显示。
进一步地,所述步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为:随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,然后采集用户对该网页的关注度。
本发明具有以下有益效果:
1、本发明通过根据该企业的销售总额确定该企业与平均值之间的市场份额差距,便于企业对自身发展状况的定位,以便制定未来发展战略。
2、本发明通过根据用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重,便于用户获取与自身兴趣点相匹配的信息。
3、本发明通过随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,以便于采集已知用户兴趣点之外的兴趣点。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明为一种基于大数据的企业信息分析方法,包括以下步骤:
步骤一:对企业的网页数据进行采集,并根据用户所输入的企业名称进行企业信息处理,并根据企业名称提取与该企业相关的网页;
步骤二:通过用户登录信息获取用户搜索使用信息,然后对用户兴趣点和用户搜索使用习惯进行判断,并根据用户兴趣点和用户搜索使用习惯对步骤一中与该企业相关的网页进行筛选;
步骤三:对步骤二中所筛选的与该企业相关的网页进行网页集合处理:
a:根据步骤二中的用户兴趣点和用户搜索使用习惯对网页集合进行排序,并确定各类信息所占单个网页集合的比重;
b:根据网页搜索热度对每一网页集合中的网页进行规划。
其中,步骤一中,对用户所输入的企业名称进行处理时包括以下步骤:
ss01:根据该企业的服务类型和企业产品确定该企业所经营行业,并对该行业进行行业集中度分析;
ss02:将行业集中度的分析结果进行平均值计算,并根据该企业的销售总额确定该企业与平均值之间的市场份额差距。
其中,步骤二中用户搜索使用信息包括用户的web访问日志和cookie。
其中,步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为对每一网络集合根据搜索热度的递减趋势进行显示。
其中,步骤三中,根据网页搜索热度对每一网页集合中的网页进行规划的方法为:随机抽取一个与用户兴趣点相异的网页类型,并添加到网络集合中,然后采集用户对该网页的关注度。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。