一种产业监测分析平台的制作方法

文档序号:24877674发布日期:2021-04-30 12:54阅读:78来源:国知局
一种产业监测分析平台的制作方法

本发明涉及信息处理技术领域,尤其涉及一种产业监测分析平台。



背景技术:

产业是指由利益相互联系的、具有不同分工的、由各个相关行业所组成的业态总称,尽管它们的经营方式、经营形态、企业模式和流通环节有所不同,但是,它们的经营对象和经营范围是围绕着共同产品而展开的,并且可以在构成业态的各个行业内部完成各自的循环。

现有的产业及企业的数据庞大,用户查询其他产业或企业的信息往往通过广告、介绍及网络查询等方式获取信息,操作复杂且效率低下,难以准确获取信息,缺少对产业进行监测分析的平台,不符合现有的高效的要求。



技术实现要素:

本发明的目的在于提供一种产业监测分析平台,平台采集并整合产业信息,以图表展示给用户,用户根据需求检索匹配产业及企业信息,操作简单且效率高。

为实现上述目的,本发明采用以下技术方案:

一种产业监测分析平台,包括管理端及客户端,所述管理端包括中央处理模块、信息采集模块、信息整合管理模块、存储模块及供需匹配模块;所述客户端包括操作模块及展示模块;

所述信息采集模块采集企业的基础信息,信息整合管理模块整合信息采集模块采集的信息进行整合并分类分级,得到产业整合信息并上传给存储模块及中央处理模块,中央处理模块控制展示模块将产业整合信息以图表展示;

用户通过所述操作模块向供需匹配模块输入需求关键字,供需匹配模块根据需求关键字从存储模块提取匹配相似度最高的企业推荐给用户。

进一步地,所述信息采集模块采用分布式爬虫模型对企业的基础信息进行采集,通过所述中央处理模块向信息采集模块输送采集任务及指令,分布式爬虫模型启动爬虫线程并获取url,根据采集任务制定的目标网站爬取url对应的页面,下载并获取页面数据。

进一步地,所述信息采集模块通过信息处理子模块对获取的页面数据进行清洗及解析,生成与采集任务相匹配的格式化数据集并存储到存储模块中。

进一步地,所述信息整合模块包括分类整合子模块及分级评分子模块,所述分类整合子模块根据企业的基础信息进行分类整合,得到产业整合信息并在展示模块以图表进行展示,所述分级评分子模块采用模糊德尔菲法及层级分析法对企业进行评分,根据评分从高到低依次得到企业排名。

进一步地,所述展示模块包括电脑端、手机端及平板端中的任一种对产业整合信息进行展示。

进一步地,所述产业整合信息包括产业分布位置、产业总数、产业类型及产业规模。

进一步地,所述供需匹配模块包括检索子模块、相似度子模块、近邻过滤子模块及结果推荐子模块,用户通过所述操作模块输入需求关键字形成检索式传输给检索子模块,所述检索子模块根据检索式连接存储模块提取企业的基础信息并进行模糊匹配,得到匹配企业,所述相似度子模块对匹配企业进行相似度计算,得到匹配企业的相似度评分及排名;通过所述近邻过滤子模块获取近邻用户的反馈信息;所述结果推荐子模块分别连接相似度子模块及近邻过滤子模块并对匹配企业及近邻用户的反馈信息进行组合并通过展示模块推送给用户。

进一步地,所述相似度计算子模块采用余弦相似度算法计算检索式与企业的基础信息的相似度并评分,所述近邻过滤子模块采用user-based协同过滤算法获取近邻用户的反馈信息。

进一步地,所述企业的基础信息包括所属行业、当前位置、注册时间、注册资金、人员规模、营收、利润及企业关键字;所述检索式为所属行业、当前位置、注册时间、注册资金、人员规模、营收、利润及企业关键字中的一项或多项组合。

进一步地,所述操作模块包括输入模块及输出模块,通过所述输入模块连接中央处理模块并控制供需匹配模块获取符合用户需求的企业;用户通过所述输出模块对存储模块进行数据下载、调用、查询及上传。

采用上述技术方案后,本发明与背景技术相比,具有如下优点:

1、本发明用户通过客户端控制及获取客户端内的数据信息,客户端通过信息采集模块采集企业信息,通过信息整合管理模块整合得到产业整合信息并存储到存储模块及在展示模块中展示给用户,用户通过操作模块输入需求关键字在供需匹配模块匹配得到平台推荐的企业信息,操作方便且信息或许效率高,通过展示模块直观地获取产业信息。

2、本发明信息采集模块采用分布式爬虫模型获取企业的基础信息,通过分布式部署爬虫集群的分布式爬虫模型,爬取目标网站的定向数据,提高了爬取效率及数据的精确度。

3、本发明的供需匹配模块通过模糊匹配、余弦相似度算法及user-based协同过滤算法获取并推荐最适合用户需求的产业、企业信息,精确度高且操作方便,节省大量时间成本。

附图说明

图1为本发明系统框架图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例

参考图1所示,本发明公开了一种产业监测分析平台,包括管理端及客户端,管理端包括中央处理模块、信息采集模块、信息整合管理模块、存储模块及供需匹配模块;客户端包括操作模块及展示模块。

信息采集模块采集企业的基础信息,信息整合管理模块整合信息采集模块采集的信息进行整合并分类分级,得到产业整合信息并上传给存储模块及中央处理模块,中央处理模块控制展示模块将产业整合信息以图表展示。

用户通过操作模块向供需匹配模块输入需求关键字,供需匹配模块根据需求关键字从存储模块提取匹配相似度最高的企业推荐给用户。

操作模块包括输入模块及输出模块,通过输入模块连接中央处理模块并控制供需匹配模块获取符合用户需求的企业;用户通过输出模块对存储模块进行数据下载、调用、查询及上传。

信息采集模块采用分布式爬虫模型对企业的基础信息进行采集,通过中央处理模块向信息采集模块输送采集任务及指令,分布式爬虫模型启动爬虫线程并获取url,根据采集任务制定的目标网站爬取url对应的页面,下载并获取页面数据;通过分布式部署爬虫集群的分布式爬虫模型,爬取目标网站的定向数据,提高了爬取效率及数据的精确度。

信息采集模块通过信息处理子模块对获取的页面数据进行清洗及解析,生成与采集任务相匹配的格式化数据集并存储到存储模块中。

对数据进行整理清洗,主要是对数据进行标准化处理,包括过滤、校验等处理。主要是针对所属行业、技术指标、技术来源等需要进行统计分析的指标等数据进行标准化。主要用到nlp(自然语言)技术,包括分词、词性标注、关键词提取、相似度等,以第三方自然语言处理开放接口(如百度ai开放平台、腾讯文智、bosonnlp等)、开源自然语言处理库(如hanlp、jieba、ansj等)实现。

信息整合模块包括分类整合子模块及分级评分子模块,分类整合子模块根据企业的基础信息进行分类整合,得到产业整合信息并在展示模块以图表进行展示,分级评分子模块采用模糊德尔菲法(max-min)及层级分析法(ahp)对企业进行评分,根据评分从高到低依次得到企业排名。

管理端通过调研,确定产业、企业分类分级的评价因子,将选定的评价因子设计成调查问卷进行调查,利用模糊德尔菲法(max-min)对问卷结果进行分析,筛选出重要的评价因子作为层级分析法的评价准则权重分析的基础;将上述筛选出的评价因子,通过层级分析法进行各项评价准则因子的成对比较,进行比较矩阵计算,得到各阶层评价准则的权重数值;最后,根据管理端管理人员的经验,对权重数值进行微调。

展示模块包括电脑端、手机端及平板端中的任一种对产业整合信息进行展示;根据采集到的数据进行宏观模式、中观模式及微观模式3种模式进行展示,从产业整体发展情况、子产业的情况、企业和产品/服务/解决方案的情况进行展示。

其中,宏观模式为产业的规模、增速、企业数、地域分布情况;中观模式为子产业(软件信息服务业、商务商贸业、现代物流业、文化演艺传播业及机械装备制造业)的情况,包含各产业的规模、增速、企业数、地域分布、市场份额占比、部分关键数据指标情况;微观模式为企业及其产品/服务/解决方案的情况,包含产品//服务/解决方案的类型、概况、市场占比、关键技术应用及应用场景。

产业整合信息包括产业分布位置、产业总数、产业类型及产业规模。

供需匹配模块包括检索子模块、相似度子模块、近邻过滤子模块及结果推荐子模块,用户通过操作模块输入需求关键字形成检索式传输给检索子模块,检索子模块根据检索式连接存储模块提取企业的基础信息并进行模糊匹配,得到匹配企业,相似度子模块对匹配企业进行相似度计算,得到匹配企业的相似度评分及排名;通过近邻过滤子模块获取近邻用户的反馈信息;结果推荐子模块分别连接相似度子模块及近邻过滤子模块并对匹配企业及近邻用户的反馈信息进行组合并通过展示模块推送给用户。

相似度计算子模块采用余弦相似度算法计算检索式与企业的基础信息的相似度并评分,近邻过滤子模块采用user-based协同过滤算法获取近邻用户的反馈信息。

供需匹配模块通过模糊匹配、余弦相似度算法及user-based协同过滤算法获取并推荐最适合用户需求的产业、企业信息,精确度高且操作方便,节省大量时间成本。

企业的基础信息包括所属行业、当前位置、注册时间、注册资金、人员规模、营收、利润及企业关键字;检索式为所属行业、当前位置、注册时间、注册资金、人员规模、营收、利润及企业关键字中的一项或多项组合。

本实施例的用户通过客户端控制及获取客户端内的数据信息,客户端通过信息采集模块采集企业信息,通过信息整合管理模块整合得到产业整合信息并存储到存储模块及在展示模块中展示给用户,用户通过操作模块输入需求关键字在供需匹配模块匹配得到平台推荐的企业信息,操作方便且信息或许效率高,通过展示模块直观地获取产业信息。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1