本发明涉及一种数据处理领域装置,尤其是一种数据统计分析更全面、准确与专业的大数据统计分析系统。
背景技术:
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,在大数据的概念提出至今,很少有实际应用确切实现大数据的开发,在统计分析中数据分析尤为重要,然而,传统的统计分析依据单一的检索引擎效果很差。
技术实现要素:
为了克服现有的技术存在的不足,本发明提供一种大数据统计分析系统,该大数据统计分析系统通过学术模式块和应用模式块区分数据统计分析的目的,提高数据分析统计的专业性;通过关键词分解模块与同义词库配合将统计流程由传统单一检索转化为分解的精确检索实现更加全面与准确的统计分析,真正实现大数据的应用。
本发明解决其技术问题所采用的技术方案是:本发明包括数据服务器、数据库、模式切换块、学术模式块、应用模式块、启动模块、关键词编辑窗口框、关键词分解模块、同义词库、客户端、统计筛选/分析模块。
数据服务器通过数据库与模式切换块电性连接,模式切换块与学术模式块、应用模式块电性相连,启动模块分别与学术模式块、应用模式块电性相连,数据库分别与关键词编辑窗口框、同义词库、统计筛选/分析模块电性连接,客户端与关键词编辑窗口框、统计筛选/分析模块分别电性连接,关键词分解模块分别与关键词编辑窗口框、同义词库电性连接;模式切换块与关键词编辑窗口框电性连接;所述的启动模块至少包括电源启动程序;所述的模式切换块为物理切换装置用于选择连通学术模式块或应用模式块;所述的关键词编辑窗口框为获取用户关键词的编辑窗口程序;所述的关键词分解模块用于将关键词编辑窗口框的关键词按照预设语法分解,具体地分解算法包括:获取关键词,关键词分解,在同义词库中寻找分解后关键词的同义组合,形成检索单元集合,对单元集合元素分别检索。
在一个优选或可选地实施例中,所述的数据库为在线网络数据库或数据库接口,为与其连接的端口提供资源。
在一个优选或可选地实施例中,所述的学术模式块包括以学术目的检索算法设计的搜索引擎应用。
在一个优选或可选地实施例中,所述的应用模式块包括以应用目的检索算法设计的搜索引擎应用。
在一个优选或可选地实施例中,所述的同义词库为关键词编辑窗口框和同义词库提供同义词。
在一个优选或可选地实施例中,所述的统计筛选/分析模块以检索方式和用户标准映射方式筛选或分析。
在一个优选或可选地实施例中,所述的客户端为pc机或固定式客户端机,至少可以用以向关键词编辑窗口框输入关键词。
本发明的有益效果是,通过学术模式块和应用模式块区分数据统计分析的目的,提高数据分析统计的专业性;通过关键词分解模块与同义词库配合将统计流程由传统单一检索转化为分解的精确检索实现更加全面与准确的统计分析,真正实现大数据的应用。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是大数据统计分析系统实施例的构造图。
图2是关键词分解模块的算法步骤图。
图中
1、数据服务器
2、数据库
3、模式切换块
4、学术模式块
5、应用模式块
6、启动模块
7、关键词编辑窗口框
8、关键词分解模块
9、同义词库
10、客户端
11、统计筛选/分析模块
具体实施方式
在图1所示实施例中,本发明包括数据服务器1、数据库2、模式切换块3、学术模式块4、应用模式块5、启动模块6、关键词编辑窗口框7、关键词分解模块8、同义词库9、客户端10、统计筛选/分析模块11。其中,数据服务器1通过数据库2与模式切换块3电性连接,模式切换块3与学术模式块4、应用模式块5电性相连,启动模块6分别与学术模式块4、应用模式块5电性相连,数据库2分别与关键词编辑窗口框7、同义词库9、统计筛选/分析模块11电性连接,客户端10与关键词编辑窗口框7、统计筛选/分析模块11分别电性连接,关键词分解模块8分别与关键词编辑窗口框7、同义词库9电性连接;模式切换块3与关键词编辑窗口框7电性连接;所述的启动模块6至少包括电源启动程序;所述的模式切换块3为物理切换装置用于选择连通学术模式块4或应用模式块5;所述的关键词编辑窗口框7为获取用户关键词的编辑窗口程序;所述的关键词分解模块8用于将关键词编辑窗口框7的关键词按照预设语法分解,具体地分解算法如图2所示,包括:获取关键词,关键词分解,在同义词库9中寻找分解后关键词的同义组合,形成检索单元集合,对单元集合元素分别检索。
所述的数据库2为在线网络数据库或数据库接口,为与其连接的端口提供资源。
所述的学术模式块4包括以学术目的检索算法设计的搜索引擎应用。
所述的应用模式块5包括以应用目的检索算法设计的搜索引擎应用。
所述的同义词库9为关键词编辑窗口框7和同义词库9提供同义词。
所述的统计筛选/分析模块11以检索方式和用户标准映射方式筛选或分析。
所述的客户端10为pc机或固定式客户端10机,至少可以用以向关键词编辑窗口框7输入关键词。
具体实施时,模式切换块3切换学术模式块和应用模式块,两种模块的检索引擎均为其特定目的设定,有区别的有重点的设定,在选定特定搜索引擎的同时也可以实现特定目的统计分析。
具体实施时候,关键词分解模块8用于将关键词编辑窗口框7的关键词按照预设语法分解,分解算法包括:获取关键词,关键词分解,在同义词库9中寻找分解后关键词的同义组合,形成检索单元集合,对单元集合元素分别检索,在一个实施例中,比如,统计关键词为“上海居住人口数量”,将“上海”(假设上海包括:a、b、c区)分解为其同义词“a、b、c区”,形成集合为“a区居住人量;b区居住人量;b区居住人量”,然后分别统计分析“a区居住人量”,“b区居住人量”,“c区居住人量”,之后合计a、b、c区居住人量。在实践中检索分解的单元往往很多,比如,按照“居住”的同义词继续分解二。
具体实施时,所述的统计筛选/分析模块11以检索方式和用户标准映射方式筛选或分析,具体实施时,用户提前在服务器设置筛选的标准,统计筛选/分析模块11将检索结果再次检索并与标准进行映射,设映射的近似度最大评估值为客户端100,用户同样可以设置特定的映射近似度作为筛选的标准。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。