一种区域性产业画像分析的方法及装置与流程

文档序号:20348387发布日期:2020-04-10 22:48阅读:296来源:国知局
一种区域性产业画像分析的方法及装置与流程

本发明涉及区域性产业分析的技术领域,更具体地,涉及一种区域性产业画像分析的方法及装置。



背景技术:

随着第三次科技革命的到来,科学技术得到了突飞猛进的发展,我国也进入到信息化时代,企业产业信息的分析管理对企业的信息化发展具有重要的意义。对企业产业信息进行分析和管理,具有快速、准确存储及处理大量产业信息的能力,能够提高生产力、加速企业决策过程、加强团队协作、建立企业联盟及实现经济全球化。

企业产业信息分析和管理的传统分析手段主要包括由各部门将自己负责的关于企业的相关信息的数据通过excel表格统计出来、数据只有每个部门掌握的企业信息明细,缺少对企业运行趋势、跨部门信息的联合呈现,在研判企业信息时缺少对企业动态信息的掌握,很少从互联网上获取企业相关信息,并且部门间的信息共享还是通过每月的调度会议,通过纸质材料进行交换共享,效率和时效性非常差。

随着大数据、云计算等技术的快速发展,为实时、准确、高效的掌握企业情况,实现对企业生产经营过程中出现的问题进行及时干预、解决,就需要更加精确、实时的手段来实现对本区域企业的分析。为精确地对企业的各项数据信息进行汇聚分析,精准展现企业的运行状态特征,需要对与企业相关的各项数据进行汇总、清洗、转换、分类存储入库,然后利用数学分析方法构建企业画像分析模型,从而实现对企业各个方面的精准画像分析。但是,目前企业分析方法存在一些问题,主要体现在以下方面:企业相关数据存储分散、缺乏统一管理;数据单一,无法支撑企业精准分析;企业数据缺少关联性整合、智能分析手段缺失;分析结果单一、辅助支撑作用不足;数据获取周期太长、分析结果时效性差。

因此,提供一种高效、准确、智能的区域性产业信息分析管理的方案是本领域亟待解决的技术问题。



技术实现要素:

有鉴于此,本发明提供了一种区域性产业画像分析的方法及装置,解决了现有技术中没有高效、准确、智能的区域性产业信息分析管理的技术问题。

为了解决上述技术问题,本发明提出一种区域性产业画像分析的方法,包括:

在预设区域内,根据企业标识从政务数据库、公共网络数据库、第三方企业信息数据库及企业信息上报数据库中获取企业信息数据,构成企业采集原始数据库;

根据所述企业标识得到企业来源类型,基于所述企业来源类型从所述企业采集原始数据库中抽取所需的原始数据;根据所述原始数据的数据类型与预设的数据清洗策略对应关系对比,得到目标数据清洗策略;利用所述目标数据清洗策略清洗所述原始数据;将清洗过的所述原始数据转换成预设类型的结构化数据,并按数据来源将所述结构化数据存放至对应的数据专题库中;

获取所述数据专题库中的所述结构化数据,按照预设的企业数据融合标准规范进行标准化融合处理得到标准化专题数据;按照企业画像分析维度构建企业数据融合数据库,将所述标准化专题数据对应到所述企业数据融合数据库中得到企业融合数据;

根据设定的企业画像构建维度对所述企业融合数据提取企业画像特征标签,得到企业标签数据;根据所述企业画像构建维度及企业标签数据构建企业画像分析模型;将所述企业画像分析模型以预设的展现策略进行展示。

可选地,其中,利用所述目标数据清洗策略清洗所述原始数据;将清洗过的所述原始数据转换成预设类型的结构化数据,并按数据来源将所述结构化数据存放至对应的数据专题库中,为:

利用所述目标数据清洗策略清洗所述原始数据;将清洗过的所述原始数据转换成预设类型的结构化数据,并按数据来源将所述结构化数据存放至对应的数据专题库中;

将所述原始数据中不符合所述目标数据清洗策略的问题数据放置于问题数据库中;在预设时间段内未收到再次清洗指令时,结束对所述问题数据的处理。

可选地,其中,该方法还包括:

在接收到再次清洗指令时,根据所述再次清洗指令的所需数据类型,与预设的数据清洗策略对应关系对比,得到数据再次清洗策略;利用所述再次清洗策略清洗所述问题数据;将清洗过的所述问题数据转换成预设类型的结构化数据,并按数据来源将所述结构化数据存放至对应的数据专题库中。

可选地,其中,根据设定的企业画像构建维度对所述企业融合数据提取企业画像特征标签,得到企业标签数据,为:

根据企业在行业、国家或世界标准规范区域内的企业公共画像特征,提取公共画像标签数据;

根据企业在所属本地区域内的企业本地画像特征,提取区域画像标签数据;

将所述公共标签与区域标签进行融合,形成企业画像分析综合标签作为企业标签数据。

可选地,其中,根据所述企业画像构建维度及企业标签数据构建企业画像分析模型;将所述企业画像分析模型以预设的展现策略进行展示,为:

根据所述企业画像构建维度及企业标签数据构建企业画像分析模型;

将所述企业画像分析模型以预设的企业基本信息、企业全景画像、企业风险评估、企业经济运行趋势、企业画像标签及企业公告进行展示。

另一方面,本发明还公开一种区域性产业画像分析的装置,包括:企业信息采集器、企业信息清洗处理器、企业信息融合处理器及企业信息分析结果处理器;其中,

所述企业信息采集器,与所述企业信息清洗处理器相连接,用于在预设区域内,根据企业标识从政务数据库、公共网络数据库、第三方企业信息数据库及企业信息上报数据库中获取企业信息数据,构成企业采集原始数据库;

所述企业信息清洗处理器,与所述企业信息采集器及企业信息融合处理器相连接,用于根据所述企业标识得到企业来源类型,基于所述企业来源类型从所述企业采集原始数据库中抽取所需的原始数据;根据所述原始数据的数据类型与预设的数据清洗策略对应关系对比,得到目标数据清洗策略;利用所述目标数据清洗策略清洗所述原始数据;将清洗过的所述原始数据转换成预设类型的结构化数据,并按数据来源将所述结构化数据存放至对应的数据专题库中;

所述企业信息融合处理器,与所述企业信息清洗处理器及企业信息分析结果处理器相连接,用于获取所述数据专题库中的所述结构化数据,按照预设的企业数据融合标准规范进行标准化融合处理得到标准化专题数据;按照企业画像分析维度构建企业数据融合数据库,将所述标准化专题数据对应到所述企业数据融合数据库中得到企业融合数据;

所述企业信息分析结果处理器,与所述企业信息融合处理器相连接,根据设定的企业画像构建维度对所述企业融合数据提取企业画像特征标签,得到企业标签数据;根据所述企业画像构建维度及企业标签数据构建企业画像分析模型;将所述企业画像分析模型以预设的展现策略进行展示。

可选地,其中,所述企业信息清洗处理器,包括:目标数据清洗策略获取单元、原始数据清洗单元及清洗问题数据存储单元;其中,

所述目标数据清洗策略获取单元,与所述企业信息采集器及原始数据清洗单元相连接,用于根据所述企业标识得到企业来源类型,基于所述企业来源类型从所述企业采集原始数据库中抽取所需的原始数据;根据所述原始数据的数据类型与预设的数据清洗策略对应关系对比,得到目标数据清洗策略;

所述原始数据清洗单元,与所述目标数据清洗策略获取单元及清洗问题数据存储单元相连接,利用所述目标数据清洗策略清洗所述原始数据;将清洗过的所述原始数据转换成预设类型的结构化数据,并按数据来源将所述结构化数据存放至对应的数据专题库中;

所述清洗问题数据存储单元,与所述原始数据清洗单元相连接,将所述原始数据中不符合所述目标数据清洗策略的问题数据放置于问题数据库中;在预设时间段内未收到再次清洗指令时,结束对所述问题数据的处理。

可选地,其中,所述企业信息清洗处理器,还包括:再次清洗处理单元,与所述清洗问题数据存储单元相连接,用于在接收到再次清洗指令时,根据所述再次清洗指令的所需数据类型,与预设的数据清洗策略对应关系对比,得到数据再次清洗策略;利用所述再次清洗策略清洗所述问题数据;将清洗过的所述问题数据转换成预设类型的结构化数据,并按数据来源将所述结构化数据存放至对应的数据专题库中。

可选地,其中,所述企业信息分析结果处理器,包括:区域画像标签数据提取处理单元、区域画像标签数据综合处理单元及画像分析结果展现处理单元;其中,

所述区域画像标签数据提取处理单元,与所述企业信息融合处理器及区域画像标签数据综合处理单元相互连接,根据企业在行业、国家或世界标准规范区域内的企业公共画像特征,提取公共画像标签数据;根据企业在所属本地区域内的企业本地画像特征,提取区域画像标签数据;

所述区域画像标签数据综合处理单元,与所述区域画像标签数据提取处理单元及画像分析结果展现处理单元相连接,将所述公共标签与区域标签进行融合,形成企业画像分析综合标签作为企业标签数据;

所述画像分析结果展现处理单元,与所述区域画像标签数据综合处理单元相连接,根据所述企业画像构建维度及企业标签数据构建企业画像分析模型;将所述企业画像分析模型以预设的展现策略进行展示。

可选地,其中,所述企业信息分析结果处理器,包括:画像分析模型创建单元及分析结果展现处理单元;其中,

所述画像分析模型创建单元,与所述企业信息融合处理器及分析结果展现处理单元相连接,根据设定的企业画像构建维度对所述企业融合数据提取企业画像特征标签,得到企业标签数据;根据所述企业画像构建维度及企业标签数据构建企业画像分析模型;

所述分析结果展现处理单元,与所述画像分析模型创建单元相连接,将所述企业画像分析模型以预设的企业基本信息、企业全景画像、企业风险评估、企业经济运行趋势、企业画像标签及企业公告进行展示。

与现有技术相比,本发明提供的区域性产业画像分析的方法及装置,至少实现如下有益效果之一:

(1)本发明所述的区域性产业画像分析的方法及装置,实现了多部门企业数据的统一汇聚与数据治理,挖掘企业数据关联性,构建企业关联模型,通过互联网、第三方等渠道采集企业数据,丰富企业数据来源维度,构建企业画像分析模型,实现企业画像分析结果多维度呈现,构建企业数据更新机制,实现企业数据实时快速更新。

(2)本发明所述的区域性产业画像分析的方法及装置,结合企业分析现状结果,提出从企业多维数据获取、汇总、清洗、转换、分析、整理入库到多源企业数据关联性融合,再到企业画像分析模型构建,最后到企业画像分析结果可视化呈现的全过程企业画像分析方法和技术。实现了对区域内企业各方面的分析、企业各维度信息的精准管理和管控,可以为区域内企业管理部门提供辅助支撑手段。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本发明实施例中所述的一种区域性产业画像分析的方法的步骤流程示意图;

图2为本发明实施例中所述的一种区域性产业画像分析中企业画像分析的整体流程示意图;

图3为本发明实施例中所述的一种区域性产业画像分析中企业数据采集流程示意图;

图4为本发明实施例中所述的一种区域性产业画像分析中企业数据清洗、转换、分类存储流程示意图;

图5为本发明实施例中所述的一种区域性产业画像分析中企业数据融合流程示意图;

图6为本发明实施例中所述的第二种区域性产业画像分析的方法的流程示意图;

图7为本发明实施例中所述的第三种区域性产业画像分析的方法的流程示意图;

图8为本发明实施例中所述的第四种区域性产业画像分析的方法的流程示意图;

图9为本发明实施例中所述的第五种区域性产业画像分析的方法的流程示意图;

图10为本发明实施例中所述的一种区域性产业画像分析的装置的结构示意图;

图11为本发明实施例中所述的第二种区域性产业画像分析的装置的结构示意图;

图12为本发明实施例中所述的第三种区域性产业画像分析的装置的结构示意图;

图13为本发明实施例中所述的第四种区域性产业画像分析的装置的结构示意图;

图14为本发明实施例中所述的第五种区域性产业画像分析的装置的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关申请,而非对该申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1至5所示,图1为本实施例中的一种区域性产业画像分析的方法的步骤流程示意图;图2为本实施例中的一种区域性产业画像分析中企业画像分析的整体流程示意图;图3为本实施例中的一种区域性产业画像分析中企业数据采集流程示意图;图4为本实施例中的一种区域性产业画像分析中企业数据清洗、转换、分类存储流程示意图;图5为本实施例中的一种区域性产业画像分析中企业数据融合流程示意图。该方法包括如下步骤:

步骤101、在预设区域内,根据企业标识从政务数据库、公共网络数据库、第三方企业信息数据库及企业信息上报数据库中获取企业信息数据,构成企业采集原始数据库。

步骤102、根据企业标识得到企业来源类型,基于企业来源类型从企业采集原始数据库中抽取所需的原始数据;根据原始数据的数据类型与预设的数据清洗策略对应关系对比,得到目标数据清洗策略;利用目标数据清洗策略清洗原始数据;将清洗过的原始数据转换成预设类型的结构化数据,并按数据来源将结构化数据存放至对应的数据专题库中。

步骤103、获取数据专题库中的结构化数据,按照预设的企业数据融合标准规范进行标准化融合处理得到标准化专题数据;按照企业画像分析维度构建企业数据融合数据库,将标准化专题数据对应到企业数据融合数据库中得到企业融合数据。

步骤104、根据设定的企业画像构建维度对企业融合数据提取企业画像特征标签,得到企业标签数据;根据企业画像构建维度及企业标签数据构建企业画像分析模型;将企业画像分析模型以预设的展现策略进行展示。

本方案分为区域内企业数据采集获取;数据清洗、转换、分类存储;企业数据关联性融合;企业画像分析模型构建;企业画像分析结果可视化呈现几个重要过程。具体流程如图2所示:

步骤201、区域内企业数据的采集。

步骤202、对采集完成的企业原始数据进行清洗、转换、分类存储。

步骤203、对处理完成的数据进行关联性融合。

步骤204、企业画像分析模型构建。

步骤205、企业画像分析结果可视化呈现。

企业数据的来源主要包括四个方面:

(一)、政府部门数据:通过构建企业数据共享交换平台将涉及与企业相关的主要部门数据进行采集汇聚,数据内容主要包括:

企业工商信息、四上企业信息、科技创新信息、企业经营财务信息、企业能耗信息、企业进出口信息、企业融资贷款信息、企业从业人员信息、企业信息信息、企业实力区域内排名信息、企业政策享受信息、企业空间地理信息等数据信息内容。

(二)、互联网数据:利用互联网数据采集工具从企业网站、招聘网站、电商平台、行业门户、专利、版权等行业信息发布源定向采集企业相关数据信息,包括企业新闻舆情、企业招投标信息、企业年报信息、企业市场交易信息、招聘信息、知识产权、法律诉讼等数据信息。

可选地,网络数据采集主要是针对企业自己生产经营过程中,不需要面向政府进行定时上报,由企业本身参与产生的数据,比如,企业招聘数据、企业招投标数据、企业法律诉讼、新闻舆情、股指交易等数据信息。这些信息都是在侧面一定程度上来反馈企业的整体运营情况,通过互联网上的数据采集,可以实现企业数据的多维度展现。

数据采集标识为企业的关键字库,企业名称、简称、统一社会信用代码、法人信息,都可以作为企业标识。其次,采集的数据多来自于主流网站,通过关键字配置可以在目标网站快速获取相关企业数据信息。

(三)、第三方数据:通过购买等方式从行业协会、研究机构等第三方机构手中采集企业相关数据信息。主要包括:企业行业地位、企业所处产业链环节、企业市场占有率、企业股指波动信息、企业原材料和商品价格波动等数据信息。

(四)、企业直报数据:对于区域内的一些规模较小的企业,由于通过上述三种手段获取的企业信息相对较少,为更好的掌握这些企业的精确信息,需要采用企业填报方式采集企业数据。

可选地,区域内规模较小的企业主要是指规模以下企业,与之相反的则是四上企业,四上企业主要包括(一)、规模以上工业企业:指年主营业务收入2000万元及以上的工业法人单位;(二)、限额以上批零住餐企业:包括年主营业务收入2000万元及以上的批发企业;年主营业务收入在500万元及以上的零售企业;年主营业务收入200万元及以上的住宿餐饮企业。(三)规模以上服务业企业:(1)辖区内年营业收入1000万元及以上,或年末从业人员50人及以上的服务业法人单位。包括:交通运输、仓储和邮政业,信息传输、软件和信息技术服务业,租赁和商务服务业,科学研究和技术服务业,水利、环境和公共设施管理业,教育,卫生和社会工作;以及物业管理、房地产中介服务、房地产租赁经营和其他房地产业等行业。(2)辖区内年营业收入500万元及以上,或年末从业人员50人及以上的服务业法人单位。包括:居民服务、修理和其他服务业,文化、体育和娱乐业。(四)具有建筑业资质的建筑业企业。不在上述“四上企业”范围内的企业界定为规模较小企业。

四上企业的数据可以通过多个政府上报渠道进行数据填报共享,规模较小企业由于不属于规上范畴,无法自行进行数据填报。

企业上报的数据会经过多级审核,确保数据的准确性,审核完毕后完成入库。一般需要直报数据的企业,不同地方有不同的企业规模划分标准。

如图3所示,整个企业数据采集详细流程如下:

步骤301、开始后启动数据采集流程。

步骤302、判断采集数据来源。

步骤303、采集数据来源为政府部门数据时,上传至数据共享交换平台。

步骤304、采集数据来源为企业直报数据时,上传至企业填报数据平台。

步骤305、采集数据来源为互联网数据时,上传至互联网数据采集工具。

步骤306、采集数据来源为第三方数据时,上传至数据推送/接口对接。

步骤307、将政府部门数据、企业直报数据、互联网数据、第三方数据发送至企业采集原始数据库中存储,完成原始企业数据采集。

可选地,如图4所示,对采集完成的企业原始数据进行清洗、转换、分类存储,具体流程如下:

步骤401、开始后启动数据清洗。

步骤402、搜索企业采集原始数据库。

步骤403、从企业采集原始数据库中抽取企业原始数据。

步骤404、配置数据清洗策略。

步骤405、判断数据清洗结果是否符合清洗策略。

步骤406、数据清洗结果不符合清洗策略时,将数据发送至问题数据库。

步骤407、判断问题数据库的数据是否需要重新清洗,当问题数据库的数据需要重新清洗时,重新配置数据清洗策略再次进行清洗;当问题数据库的数据不需要重新清洗时,结束问题数据库重清洗。

步骤408、数据清洗结果符合清洗策略时,将清洗后的数据发送至临时数据库。

步骤409、对临时数据库中的数据进行数据转换。

步骤410、对数据转换的临时数据库中数据进行分类存储。

步骤411、临时数据库中政府数据存储至政府数据专题库。

步骤412、临时数据库中互联网数据存储至互联网数据专题库。

步骤413、临时数据库中第三方数据存储至第三方数据专题库。

步骤414、临时数据库中企业直报数据存储至企业直报数据专题库。

按需进行抽取主要是指通过不同渠道获取过来的数据统一存放到前置设备中,由于企业数据来源不同,在进行数据抽取时,根据企业的不同来源进行抽取处理,一般以政府渠道获取的数据为基础数据,以此数据为基本,再抽取其他渠道获取过来所需的数据内容。

数据清洗策略包括:数据格式清洗(时间、日期、数值、身份证号、手机号等)、图片去重、空值处理、信息不一致、数据逻辑异常、指标值异常。

转换处理将不同的原始格式数据,原始数据格式一般包括:excel格式、word格式等转换成相同类型的的数据,统一转换成结构化数据存放到数据库中。

不符合数据清洗策略的问题数据首先存放到问题库中,如果需要对问题数据进行再次清洗,可以按照具体的业务需求重新配置数据清洗策略与方案,启动新的数据清洗进程。如果问题数据不在进行处理,则问题数据处理流程结束。

数据处理过程有任务监控系统,处理完成后相应处理任务会结束。处理完成的数据已经全部变成为结构化数据,存储在数据库表中。

可选地,如图5所示,对处理完成的数据进行关联性融合,具体业务流程包括:

步骤501、开始后启动数据融合。

步骤502、从专题数据库中获取专题数据。

步骤503、根据数据融合标准规范对专题数据进行数据融合。

步骤504、判断数据融合是否成功。

步骤505、数据融合不成功时,输出数据融合日志。

步骤506、数据融合成功时,将融合后的数据发送至企业数据融合数据库中。

按照企业数据融合标准规范,实现对多源数据的有效融合,包括企业数据唯一标识提取融合,按照企业唯一标识,对不同来源的企业数据进行统一标准化融合处理,构建企业唯一标识库,按照唯一标识提取融合政府部分企业数据信息、互联网采集企业数据信息、第三方采集企业数据信息、企业直报数据信息。

数据融合成功后,按照企业画像分析维度构建企业数据融合数据库,包括:企业基本信息专题库、企业生产运行专题库、企业信用专题库、企业创新专题库等融合数据库。企业分类是在不同采集渠道采集企业数据时就已经分类完毕,政府数据采集时涉及到多个不同部门,其中从工商部门采集的基本信息数据进入企业基本信息专题库,科技局采集到的数据进入企业创新专题库、统计机构采集的企业每月的经营情况数据信息进入企业生产专题库等。

对于没有融合成功的数据,生成企业融合日志,分析融合失败原因,根据融合失败原因重新对数据进行处理分析。融合失败原因为自动分析,在进行数据融合时,数据融合结果会生成数据融合报告,对于没有融合成功的数据会生成原因说明。

可选地,企业画像分析模型构建,可以包括如下内容:

(一)、确定企业画像分析模型构建维度:基本属性维度:包括企业组织机构、生产设备、从业人员情况、企业地理位置等属性。运行属性维度:包括运营管理、产品、关联特征、用能、环保、生产、效益、投资等属性。信用属性维度:企业纳税、信用称号、招投标及合同履行、法律纠纷、抵押贷款、新闻舆情等属性。创新属性维度:技术企业称号、知识产权、技术人才、r&d费用等属性信息。市场属性维度:行业地位、市场占有率、股指数据、产品信息、进出口交易、行业产业链环节等属性。

(二)、依托画像分析模型构建维度提取企业画像特征标签

(1)、首先确定企业公共画像特征,依托企业在整个行业及国家或世界标准规范提取企业公共画像特征。一方面考虑企业在整个行业市场的产品占有率(产品占有率一般是通过第三方采购相关数据内容)确定企业行业地位标签;另一方面考虑企业在国家或全球层面获得的国家或世界认定的称号特征,提取企业荣誉称标签。如:纳税a级信用企业、高新技术企业、知识产权大户、国家技术中心等称号标签;第三,基于企业上市情况提取上市企业标签。

(2)、其次确定企业区域画像特征,依托企业在属地区域情况,构建企业本地区域画像特征。对于在整个行业或者全国及世界层面不突出但是在本地比较突出的企业(本地比较突出,主要是指该企业在分析区域范围内的生产情况比较突出,主要从企业规模、人员数量、税收贡献等几个方面对本地的促进作用比较大),基于企业在本区域内的情况进行标签管理。基于企业纳税情况,提取纳税大户标签;基于企业在本地行业贡献情况,提取企业行业地位标签;基于企业创新投入与知识产权情况,提取创新性企业标签;基于企业生产用能情况,提取企业用能标签;基于企业环保情况,提取企业环保标签。

(3)、将公共标签与区域标签进行融合,形成企业画像分析综合标签,实现企业画像的标签化分析。

(三)、根据企业画像分析模型维度和企业特征标签,确认企业画像分析结果。主要包括:企业基本信息、企业全景画像、企业风险评估、企业经济运行趋势、企业画像标签、企业公告等画像分析结果,精确掌握企业各个方面信息。

其中,业画像分析结果可视化呈现,可以利用echarts图表将企业画像各分析结果综合进行可视化呈现,面向政府企业管理单位提供企业画像分析报告,精准掌握企业各项运行态势,实现企业的精准管理。

在一些可选的实施例中,如图6所示,为本实施例中的第二种区域性产业画像分析的方法的流程示意图,与图1中不同的是,利用目标数据清洗策略清洗原始数据;将清洗过的原始数据转换成预设类型的结构化数据,并按数据来源将结构化数据存放至对应的数据专题库中,为:

步骤601、利用目标数据清洗策略清洗原始数据;将清洗过的原始数据转换成预设类型的结构化数据,并按数据来源将结构化数据存放至对应的数据专题库中。

步骤602、将原始数据中不符合目标数据清洗策略的问题数据放置于问题数据库中;在预设时间段内未收到再次清洗指令时,结束对问题数据的处理。

在一些可选的实施例中,如图7所示,为本实施例中的第三种区域性产业画像分析的方法的流程示意图,与图6中不同的是,还包括:

步骤701、在接收到再次清洗指令时,根据再次清洗指令的所需数据类型,与预设的数据清洗策略对应关系对比,得到数据再次清洗策略。

步骤702、利用再次清洗策略清洗问题数据;将清洗过的问题数据转换成预设类型的结构化数据,并按数据来源将结构化数据存放至对应的数据专题库中。

在一些可选的实施例中,如图8所示,为本实施例中的第四种区域性产业画像分析的方法的流程示意图,与图6中不同的是,根据设定的企业画像构建维度对企业融合数据提取企业画像特征标签,得到企业标签数据,为:

步骤801、根据企业在行业、国家或世界标准规范区域内的企业公共画像特征,提取公共画像标签数据。

步骤802、根据企业在所属本地区域内的企业本地画像特征,提取区域画像标签数据。

步骤803、将公共标签与区域标签进行融合,形成企业画像分析综合标签作为企业标签数据。

在一些可选的实施例中,如图9所示,为本实施例中的第五种区域性产业画像分析的方法的流程示意图,与图6中不同的是,根据企业画像构建维度及企业标签数据构建企业画像分析模型;将企业画像分析模型以预设的展现策略进行展示,为:

步骤901、根据企业画像构建维度及企业标签数据构建企业画像分析模型。

步骤902、将企业画像分析模型以预设的企业基本信息、企业全景画像、企业风险评估、企业经济运行趋势、企业画像标签及企业公告进行展示。

在一些可选的实施例中,如图10所示,为本实施例中的一种区域性产业画像分析的装置1000的结构示意图,该装置可用于实施上述的区域性产业画像分析的方法。具体地,该装置包括:企业信息采集器1001、企业信息清洗处理器1002、企业信息融合处理器1003及企业信息分析结果处理器1004。

其中,企业信息采集器1001,与企业信息清洗处理器1002相连接,用于在预设区域内,根据企业标识从政务数据库、公共网络数据库、第三方企业信息数据库及企业信息上报数据库中获取企业信息数据,构成企业采集原始数据库。

企业信息清洗处理器1002,与企业信息采集器1001及企业信息融合处理器1003相连接,用于根据企业标识得到企业来源类型,基于企业来源类型从企业采集原始数据库中抽取所需的原始数据;根据原始数据的数据类型与预设的数据清洗策略对应关系对比,得到目标数据清洗策略;利用目标数据清洗策略清洗原始数据;将清洗过的原始数据转换成预设类型的结构化数据,并按数据来源将结构化数据存放至对应的数据专题库中。

企业信息融合处理器1003,与企业信息清洗处理器1002及企业信息分析结果处理器1004相连接,用于获取数据专题库中的结构化数据,按照预设的企业数据融合标准规范进行标准化融合处理得到标准化专题数据;按照企业画像分析维度构建企业数据融合数据库,将标准化专题数据对应到企业数据融合数据库中得到企业融合数据。

企业信息分析结果处理器1004,与企业信息融合处理器1003相连接,根据设定的企业画像构建维度对企业融合数据提取企业画像特征标签,得到企业标签数据;根据企业画像构建维度及企业标签数据构建企业画像分析模型;将企业画像分析模型以预设的展现策略进行展示。

在一些可选的实施例中,如图11所示,为本实施例中的第二种区域性产业画像分析的装置1100的结构示意图,与图10中不同的是,企业信息清洗处理器1002,包括:目标数据清洗策略获取单元1101、原始数据清洗单元1102及清洗问题数据存储单元1103。

其中,目标数据清洗策略获取单元1101,与企业信息采集器1001及原始数据清洗单元1102相连接,用于根据企业标识得到企业来源类型,基于企业来源类型从企业采集原始数据库中抽取所需的原始数据;根据原始数据的数据类型与预设的数据清洗策略对应关系对比,得到目标数据清洗策略。

原始数据清洗单元1102,与目标数据清洗策略获取单元1101及清洗问题数据存储单元1103相连接,利用目标数据清洗策略清洗原始数据;将清洗过的原始数据转换成预设类型的结构化数据,并按数据来源将结构化数据存放至对应的数据专题库中。

清洗问题数据存储单元1103,与原始数据清洗单元1102相连接,将原始数据中不符合目标数据清洗策略的问题数据放置于问题数据库中;在预设时间段内未收到再次清洗指令时,结束对问题数据的处理。

在一些可选的实施例中,如图12所示,为本实施例中的第三种区域性产业画像分析的装置1200的结构示意图,与图11中不同的是,企业信息清洗处理器1002,还包括:再次清洗处理单元1201,与清洗问题数据存储单元1103相连接,用于在接收到再次清洗指令时,根据再次清洗指令的所需数据类型,与预设的数据清洗策略对应关系对比,得到数据再次清洗策略;利用再次清洗策略清洗问题数据;将清洗过的问题数据转换成预设类型的结构化数据,并按数据来源将结构化数据存放至对应的数据专题库中。

在一些可选的实施例中,如图13所示,为本实施例中的第四种区域性产业画像分析的装置1300的结构示意图,与图10中不同的是,企业信息分析结果处理器1004,包括:区域画像标签数据提取处理单元1301、区域画像标签数据综合处理单元1302及画像分析结果展现处理单元1303。

其中,区域画像标签数据提取处理单元1301,与企业信息融合处理器1003及区域画像标签数据综合处理单元1302相互连接,根据企业在行业、国家或世界标准规范区域内的企业公共画像特征,提取公共画像标签数据;根据企业在所属本地区域内的企业本地画像特征,提取区域画像标签数据。

区域画像标签数据综合处理单元1302,与区域画像标签数据提取处理单元1301及画像分析结果展现处理单元1303相连接,将公共标签与区域标签进行融合,形成企业画像分析综合标签作为企业标签数据。

画像分析结果展现处理单元1303,与区域画像标签数据综合处理单元1302相连接,根据企业画像构建维度及企业标签数据构建企业画像分析模型;将企业画像分析模型以预设的展现策略进行展示。

在一些可选的实施例中,如图14所示,为本实施例中的第五种区域性产业画像分析的装置1400的结构示意图,与图10中不同的是,企业信息分析结果处理器1004,包括:画像分析模型创建单元1401及分析结果展现处理单元1402。

其中,画像分析模型创建单元1401,与企业信息融合处理器1003及分析结果展现处理单元1402相连接,根据设定的企业画像构建维度对企业融合数据提取企业画像特征标签,得到企业标签数据;根据企业画像构建维度及企业标签数据构建企业画像分析模型。

分析结果展现处理单元1402,与画像分析模型创建单元1401相连接,将企业画像分析模型以预设的企业基本信息、企业全景画像、企业风险评估、企业经济运行趋势、企业画像标签及企业公告进行展示。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1