企业诚信水平标定方法、装置、设备及存储介质与流程

文档序号:33474549发布日期:2023-03-15 09:44阅读:50来源:国知局
企业诚信水平标定方法、装置、设备及存储介质与流程

1.本技术涉及数据处理技术领域,更具体的说,是涉及一种企业诚信水平标定方法、装置、设备及存储介质。


背景技术:

2.当前,可以基于相关政务部门公开的目标企业的政务数据对目标企业的诚信水平进行标定,示例性的,可以使用国家税务总局公布的企业纳税信用等级、相关政务部门公开的企业遵规守纪情况等政务数据评估企业的诚信水平。但是,一个目标企业可能具备多种不同的标识,例如,可以用企业的全称、简称或id等不同标识表征同一个目标企业,并且,也可能存在目标企业的名称被模糊的情况,根据目标企业的名称难以获取到能够表征企业诚信水平的全部政务数据,数据获取的难度较大、成本较高。
3.因此,在实际应用中往往只根据企业纳税信用等级对目标企业的诚信水平进行标定,数据类型单一,标定出的企业诚信水平的准确性不高。


技术实现要素:

4.鉴于上述问题,提出了本技术以便提供一种企业诚信水平标定方法、装置、设备及存储介质,可以利用多种类型的政务数据实现目标企业的诚信水平标定任务。
5.具体方案如下:
6.第一方面,提供了一种企业诚信水平标定方法,包括:
7.获取若干种预设类型的数据,其中,所述数据包括用于表征企业的诚信水平的政务数据;
8.对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据;
9.利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,标定出所述目标企业的诚信水平,其中,所述企业诚信水平标定模型是利用标注有诚信水平的训练数据训练得到的模型。
10.第二方面,提供了一种企业诚信水平标定装置,包括:
11.数据获取单元,用于获取若干种预设类型的数据,其中,所述数据包括用于表征企业的诚信水平的政务数据;
12.数据处理单元,用于对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据;
13.诚信水平标定单元,用于利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,标定出所述目标企业的诚信水平,其中,所述企业诚信水平标定模型是利用标注有诚信水平的训练数据训练得到的模型。
14.第三方面,提供了一种企业诚信水平标定设备,包括:存储器和处理器;
15.所述存储器,用于存储程序;
16.所述处理器,用于执行所述程序,实现上述的企业诚信水平标定方法的各个步骤。
17.第四方面,提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述的企业诚信水平标定方法的各个步骤。
18.借由上述技术方案,本技术在数据获取阶段,获取了若干个预设类型的政务数据,示例如企业经营异常情况、欠税情况、纳税情况、税收违法情况、严重违法情况、环保处罚情况、主体信用情况、行政处罚情况、违规处罚情况以及舆情描述等数据信息,将数据类型作为初始的数据获取依据,可以获取到大量的能够表征企业诚信水平的数据;在数据处理阶段,利用地理信息从所获取的大量数据中提取出目标企业的目标数据,具体的,在所获取的任一条数据的地理信息与欲标定诚信水平的目标企业的基准地理信息匹配的情况下,确定该条数据为目标数据,将所确定的若干条目标数据作为标定目标企业诚信水平的依据,而后利用训练后的企业诚信水平标定模型对所确定的若干条目标数据进行处理,得到目标企业的诚信水平。
19.由于政务数据中的企业名称信息可能会被模糊处理,或者不同类型的政务数据可能采用不同的企业标识来表示同一个企业,如果只依据目标企业的名称来获取政务数据,获取到数量较多的目标企业的数据的难度较大,实现目标数据获取的成本较高,为解决上述问题,本方案以目标企业的基准地理信息作为目标企业的标识,即使在不同数据中对目标企业的名称采用了不同的表述方式,也可以根据该条数据中的地理信息与基准地理信息的匹配程度来确定该数据是否为目标企业的数据,应用本方案提供的数据获取和数据处理两阶段的步骤,可以在数据中的目标企业名称模糊、名称不准确或者表征目标企业的标识多样的情况下,从所获取的众多类型的大量数据中确定出属于目标企业的目标数据,基于所确定的多种类型的目标数据标定出目标企业的诚信水平,降低了获取目标数据所需花费的成本,丰富了企业诚信水平的评估维度。
附图说明
20.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
21.图1为本技术实施例提供的一种企业诚信水平标定方法的流程示意图;
22.图2为本技术实施例提供的另一种企业诚信水平标定方法的流程示意图;
23.图3为本技术实施例提供的一种企业诚信水平标定装置的结构示意图;
24.图4为本技术实施例提供的企业诚信水平标定设备的结构示意图。
具体实施方式
25.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
26.企业诚信可以体现在道德、社会等多个方面,因此可以利用企业经营、税收、行政和环境等方面的数据对企业诚信水平进行评估。
27.本技术提供了一种企业诚信水平标定方法、装置、设备和存储介质,本技术方案可以基于具备数据处理能力的终端,实现多数据维度的企业诚信水平标定任务,所述终端可以是手机、电脑、服务器、云端等。
28.图1是本技术实施例提供的一种企业诚信水平标定方法的流程示意图,结合图1所示,该方法可以包括如下步骤:
29.步骤s101、获取若干种预设类型的数据。
30.其中,所述数据可以包括用于表征企业的诚信水平的政务数据,示例性的,示例性的,可以从相关部门公开的工商数据、司法数据和舆情数据等政务数据中,提取出经营异常数量、严重违法数量、行政处罚数量、税收违法金额、环保处罚金额、欠税公告数量、纳税信用等级、主体信用评级、上市公司违规处罚数量以及舆情信息描述等数据,基于提取出的目标企业的数据标定目标企业的诚信水平,也就是说,所设置的政务数据类型可以包括经营异常、严重违法、行政处罚、税收违法、环保处罚、欠税以及纳税信用等。
31.在完成步骤s101的数据获取之后,对于所获取的每一条数据执行步骤s102-s104以进行数据处理,直到处理完成所获取的全部数据。
32.步骤s102、提取所述数据的地理信息。
33.具体的,在利用数据的地理信息时,可以对地理信息进行坐标转换,以便将各个地理信息映射到一个坐标系中。
34.步骤s103、判断所述地理信息与目标企业的基准地理信息是否匹配,若是,则执行步骤s104。
35.步骤s104、确定所述数据为目标数据。
36.需要说明的是,在相关部门公开的政务数据中,可能采用企业id、企业全称或企业简称等多种表述方式来指代同一个企业,并且也可能存在对企业名称进行了模糊处理或省略处理的情况,难以通过欲标定诚信水平的目标企业的名称搜索并获取到能够表征目标企业的诚信水平的政务数据。但是对于一个确定的目标企业而言,其具备着确定的地理位置,可以称之为目标企业的基准地理信息,所述确定的地理位置在不同的坐标系下可以具备多种不同的表述,这些不同的表述都可以映射到一个确定的坐标系中的一点或一点附近,因此,对于所获取的每一条数据,可以用所述数据的地理信息和目标企业的基准地理信息的匹配程度,来衡量所述数据与目标企业的相关程度,在所述数据的地理信息与所述基准地理信息匹配的情况下,认为所述数据属于所述目标企业,将所述数据确定为目标数据,即用于标定所述目标企业的诚信水平的数据。
37.在处理完成全部的所获取数据之后,可以确定出若干条所述目标数据,由于所述目标数据是来源于步骤s101所获取的若干种预设类型的数据的,这些确定出的数据可以具备着不同的数据类型,而后执行步骤s105。
38.步骤s105、利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,标定出所述目标企业的诚信水平。
39.具体的,所述企业诚信水平标定模型所处理的数据对象可以是在对若干条所述目标数据进行拼接融合之后,根据融合后的数据生成的特征向量,其中,所述企业诚信水平标定模型可以是利用标注有诚信水平的训练数据训练得到的模型,若干条所述目标数据的特征向量的生成方式与所述训练数据的特征向量的生成方式一致。可选的,可以用百分数的
形式来表征企业的诚信水平。
40.需要说明的是,通过增加用于实现企业诚信水平标定任务的政务数据类型,增加了数据量,扩充了企业诚信水平标定模型的训练数据集,使得可以基于深度学习等算法训练得到能够较为准确的标定企业诚信水平的模型。
41.上述的企业诚信水平标定方法,在数据获取阶段,获取了若干个预设类型的政务数据,将数据类型作为初始的数据获取依据,可以获取到大量的能够表征企业诚信水平的数据;在数据处理阶段,利用地理信息从所获取的大量数据中提取出目标企业的目标数据,具体的,在所获取的任一条数据的地理信息与欲标定诚信水平的目标企业的基准地理信息匹配的情况下,确定该条数据为目标数据,将所确定的若干条目标数据作为标定目标企业诚信水平的依据,而后利用训练后的企业诚信水平标定模型对所确定的若干条目标数据进行处理,得到目标企业的诚信水平。
42.由于政务数据中的企业名称信息可能会被模糊处理,或者不同类型的政务数据可能采用不同的企业标识来表示同一个企业,如果只依据目标企业的名称来获取政务数据,获取到目标企业的全部数据的难度较大,实现成本较高,为解决上述问题,本方案以目标企业的基准地理信息作为目标企业的标识,即使在不同数据中对目标企业的名称采用了不同的表述方式,也可以根据该条数据中的地理信息与基准地理信息的匹配程度来确定该数据是否为目标企业的数据,应用本方案提供的数据获取和数据处理两阶段的步骤,可以在数据中的目标企业名称模糊、名称不准确或者表征目标企业的标识多样的情况下,从所获取的众多类型的大量数据中确定出属于目标企业的目标数据,基于所确定的多种类型的目标数据标定出目标企业的诚信水平,本方案降低了获取目标数据所需花费的成本,丰富了企业诚信水平的评估维度
43.在本技术提供的一些实施例中,所述预设类型可以包括预设的政务数据类型和电力数据数据类型。
44.具体的,在利用了多种类型的政务数据的基础上,还可以使用电力数据作为补充。相较于政务数据,获取企业的电力数据的难度较小,企业的电力数据可以来源于相关部门公开的脱敏测量数据,该数据包括139种企业标签指标类型,包含有可以表征目标企业的窃电行为、违约用电行为以及服务沟通情况的若干种类型的电力数据。可选的,可以根据电力数据类型和企业诚信水平的相关程度,预先设置欲利用的电力数据类型,具体可以包括下述的31种电力数据类型:1、安全用电等级分类,2、企业近12个月发生电网故障情况,3、年检查通过比率,4、近2年内窃电水平,5、近2年内窃电等级,6、近6个月窃电水平,7、近6个月窃电等级,8、企业近3个月内窃电水平,9、企业近3个月内窃电等级,10、近12月内窃电水平,11、近12月内窃电等级,12、近2年内违约用电水平,13、近2年内违约用电等级,14、近6个月违约用电水平,15、近6个月违约用电等级,16、近12月内违约用电水平,17、近12月内违约用电等级,18、企业近3个月内违约用电水平,19、企业近3个月内违约用电等级,20、近12个月内举报水平,21、近12个月内恶意投诉水平,22、近12个月投诉总水平,23、近24个月内投诉频次,24、近12月用户后台点击率,25、电子渠道交费等级,26、电子渠道交费水平,27、信息质量情况,28、风险等级,29、信用等级,30、营业场所位置,31、营业场所变更,共计31个电力数据类型。
45.在上述的基础上,可以根据所获取的若干种类型的电力数据,分析处理得到企业
的用电安全情况、窃电情况、违约用电情况、服务沟通情况、电子渠道信息、基本状况和营业场所特征七方面的信息。具体的,用电安全情况可以用第1-3种电力数据类型的数据表示,其中,安全用电等级分类也可以用缺陷等级来表征,所述缺陷等级可以根据设备发生缺陷后所威胁的安全运行的轻重程度,分为危急缺陷、严重缺陷、一般缺陷三类,示例性的,若企业的缺陷等级越严重、年检查通过比率越低,则企业的诚信水平越低;窃电情况可以用第4-11种电力数据类型的数据表示,示例性的,若企业的窃电次数越多、金额越高,则企业的诚信水平越低;违约用电情况可以用第12-19种电力数据类型的数据表示;服务沟通情况可以用第20-23种电力数据类型的数据表示,示例性的,若企业的被投诉次数越多、对其他企业的恶意投诉次数越多,则企业的诚信水平越低;电子渠道信息可以用第24-27种电力数据类型的数据表示;基本状况可以用第28-29种电力数据类型的数据表示;营业场所特征可以用第30-31种电力数据类型的数据表示,其中,营业场所位置可以是类型编码,可以是通过用电地址结合第三方房屋数据进行判断确定的企业经营位置类型,可以包括繁华商圈、居民区、开发区等。
46.在本技术提供的一些实施例中,在所述利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理之前,还可以包括:
47.对于所确定的若干条所述目标数据中的政务数据,计算每两条政务数据之间的相似度,对相似度超过预设阈值的两条政务数据进行去重处理,得到去重后的若干条目标数据。
48.在上述的基础上,所述利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,可以包括:
49.利用企业诚信水平标定模型对所述去重后的若干条目标数据进行处理。
50.在本技术提供的一些实施例中,所述企业诚信水平标定模型可以是利用标注有诚信水平的训练数据对预训练模型进行再训练得到的模型。
51.其中,所述预训练模型可以是在用于实现中文语义识别的通用任务上训练得到的深度学习模型,具体的,所述预训练模型可以提取输入文本的文本特征,并基于所提取的文本特征进行语义识别。需要说明的是,通用任务与本技术方案欲实现的诚信水平标定任务都涉及到中文信息抽取,因此可以借助于迁移学习,通过对训练后的预训练模型进行再训练的方式,训练出能够较为准确的标定企业诚信水平的模型,并且相较于从零开始训练企业诚信水平标定模型的方案,在企业诚信水平标定任务上对预训练模型进行迁移的方案,也就是对预训练模型进行再训练的方案,减少了训练所述企业诚信水平标定模型所需的训练数据量。
52.可选的,所述通用任务可以是识别评价倾向的评估任务,示例性的,可以是新闻情感倾向性识别任务,在上述的基础上,所使用的训练数据集可以是中文语料数据集,例如news2016zh数据集。
53.可选的,在对训练后的预训练模型进行再训练的过程中,可以采用下述的微调方法discriminative fine-tuning(简称为discr)和slanted triangular learning rates(简称为stlr)。
54.具体的,利用所述discr为每一层模型配置不同的学习率,并按照公式(1)对每一层的模型参数使用随机梯度下降法(sgd)进行参数更新。
[0055][0056]
其中,η是学习率,是模型参数的变化梯度,按照模型的层数将模型参数θ分成θ1,θ2,

,θ
l


,θ
l
,θ
l
表示的是第l层的参数,l是模型的层数。
[0057]
利用所述stlr对再训练过程中的学习率进行配置,具体的,按照公式(2)配置学习率先线性增加到最大值,再计划性衰减。
[0058][0059]
其中,t是训练迭代次数,cut_frac是增加学习率的迭代比例,cut是从增加学习率到减少学习率的迭代次数,p是已增加学习率或将要减少学习率的迭代比例,ratio指出基于最大学习率η
max
时的最小学习率,η
t
是第t次迭代的学习率。示例性的,可以设置cut_frnc=0.1,ratio=32,η
max
=0.01。
[0060]
图2是根据本技术实施例示出的另一种企业诚信水平标定方法的流程示意图,结合图2所示,该方法可以包括如下步骤:
[0061]
步骤s201与上述的步骤s101一致,在此不再赘述。
[0062]
步骤s202、根据数据的地理信息,对所获取的全部数据进行聚类,得到若干个聚类。
[0063]
需要说明的是,步骤s202的执行基础是,同一企业的地理信息可以映射到一个确定坐标系中的一个点上或一个点附近,如果将所获取的各条数据各自的地理信息映射到一个确定的坐标系中,并用各条数据各自的地理信息来表征各条数据,则以数据a为例,所述数据a与所述数据a所属的聚类a中的数据b的距离往往小于所述数据a与其他聚类c中的数据c的距离,换而言之,经过步骤s202的聚类处理,可以将若干条数据的地理信息划分给不同的地理范围,也就是将若干条数据划分成若干个聚类。
[0064]
此外,除了可以采用机器学习领域的聚类算法之外,还可以以格网或街道为单位对所获取的各条数据进行划分,其中,格网是指将地图按照平面坐标进行划分得到的方格。
[0065]
但是一个地理范围内可能存在多家企业,因此需要对于步骤s202得到的每个聚类,执行步骤s203以进行数据中的企业名称信息的模糊匹配。
[0066]
步骤s203、在所述聚类中的各条数据中,查找满足企业名称信息名称匹配条件的数据,利用查找到的若干条数据生成数据组。
[0067]
具体的,上述的步骤s203可以包括:提取各条数据各自的企业名称信息,而后计算每两个企业名称信息间的相似度,以具备最高的平均相似度的企业名称信息为基础名称信息,判断其他的企业名称信息和所述基础名称信息间的相似度是否达到预设阈值,利用具备超过预设阈值的其他的企业名称信息的数据和与所述基础名称信息对应的数据生成一个数据组,而后对所述聚类中的其他数据重复上述操作,直至完成数据组的划分。
[0068]
经过把步骤s203的处理,可以得到若干个数据组,对于每个数据组,其中的各条数
据往往具备相似度较高的地理信息以及相似度较高的企业名称信息。
[0069]
对每一个数据组,执行步骤s204-s208。
[0070]
步骤s204、提取所述数据组中的全部数据的地理信息。
[0071]
步骤s205、利用所述全部数据的地理信息确定与所述数据组对应的地理范围。
[0072]
步骤s206、对所述目标企业的poi数据和所述地理范围进行邻近分析,得到所述poi数据和所述地理范围之间的距离。
[0073]
具体的,所述地理范围可以用面数据的形式表示,地理信息系统中的目标企业的poi数据可以表征所述目标企业的基准地理信息,是一个地理位置点数据,所述距离实际上的点与面间的距离,可以表征所述地理范围与所述poi数据的匹配程度。
[0074]
步骤s207、判断所述距离是否为零,若是,则执行步骤s208。
[0075]
具体的,如果点与面间的距离为零,则可以表征该点属于该面,也就是说,所述数据组中的各条数据属于目标企业。
[0076]
步骤s208、确定所述数据组中的全部数据为目标数据。
[0077]
步骤s209与上述的步骤s105一致,在此不再赘述。
[0078]
此外,在进行步骤s206的邻近分析时,可以同时考虑若干个目标企业和若干个数据组各自的地理范围,具体的,对由若干个目标企业的poi数据构成的点数据集和由若干个地理范围构成的面数据集做邻近分析,得到距离每个点数据最近的面数据的标识,可以称之为该点的邻近面,同时还可以得到每个点及其邻近面之间的距离。
[0079]
需要说明的是,一个企业的电力数据往往具备着同一个标识,并往往用企业名称来表示,因此,除了上述的方案,还可以在确定出目标企业的目标政务数据之后,依据目标企业的名称来获取目标电力数据,而后对目标电力数据和目标政务数据进行融合,得到用于标定目标企业的诚信水平的目标数据。
[0080]
下面对本技术实施例提供的企业诚信水平标定装置进行描述,下文描述的企业诚信水平标定装置与上文描述的企业诚信水平标定方法可相互对应参照。
[0081]
参见图3,图3为本技术实施例公开的一种企业诚信水平标定装置的结构示意图。
[0082]
如图3所示,该装置可以包括:
[0083]
数据获取单元11,用于获取若干种预设类型的数据,其中,所述数据包括用于表征企业的诚信水平的政务数据;
[0084]
数据处理单元12,用于对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据;
[0085]
诚信水平标定单元13,用于利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,标定出所述目标企业的诚信水平,其中,所述企业诚信水平标定模型是利用标注有诚信水平的训练数据训练得到的模型。
[0086]
在本技术提供的一些实施例中,所述基准地理信息为地理信息系统的poi数据。
[0087]
在上述的基础上,所述数据处理单元12对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据的过程可以包括:
[0088]
根据数据的地理信息,对所获取的全部数据进行聚类,得到若干个聚类;
[0089]
对于每一个所述聚类,在所述聚类中的各条数据中,查找满足企业名称信息名称
匹配条件的数据,利用查找到的若干条数据生成数据组;
[0090]
对于每个数据组,提取所述数据组中的全部数据的地理信息,利用所述全部数据的地理信息确定与所述数据组对应的地理范围,对所述poi数据和所述地理范围进行邻近分析,得到所述poi数据和所述地理范围之间的距离,所述距离用于表征所述地理范围与所述poi数据的匹配程度,在所述距离等于零的情况下,确定所述数据组中的全部数据为目标数据。
[0091]
在本技术提供的一些实施例中,该装置还可以包括模型训练单元,用于利用标注有诚信水平的训练数据对预训练模型进行再训练得到企业诚信水平标定模型,其中,所述预训练模型是在用于实现中文语义识别的通用任务上训练得到的深度学习模型。
[0092]
可选的,所述通用任务可以是新闻情感倾向性识别任务。
[0093]
在本技术提供的一些实施例中,所述数据处理单元还可以用于对于所确定的若干条所述目标数据中的政务数据,计算每两条政务数据之间的相似度,对相似度超过预设阈值的两条政务数据进行去重处理,得到去重后的若干条目标数据。
[0094]
在上述的基础上,所述诚信水平标定单元13利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理的过程,可以包括:
[0095]
利用企业诚信水平标定模型对所述去重后的若干条目标数据进行处理。
[0096]
在本技术提供的一些实施例中,所述预设类型可以包括预设的政务数据类型和预设的电力数据类型。
[0097]
本技术实施例提供的企业诚信水平标定装置可应用于企业诚信水平标定设备,如终端:手机、电脑等。可选的,图4示出了企业诚信水平标定设备的硬件结构框图,参照图4,企业诚信水平标定设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
[0098]
在本技术实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
[0099]
处理器1可能是一个中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
[0100]
存储器3可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
[0101]
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
[0102]
获取若干种预设类型的数据,其中,所述数据包括用于表征企业的诚信水平的政务数据;
[0103]
对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据;
[0104]
利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,标定出所述目标企业的诚信水平,其中,所述企业诚信水平标定模型是利用标注有诚信水平的训练数据训练得到的模型。
[0105]
可选的,所述程序的细化功能和扩展功能可参照上文描述。
[0106]
本技术实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程
序,所述程序用于:
[0107]
获取若干种预设类型的数据,其中,所述数据包括用于表征企业的诚信水平的政务数据;
[0108]
对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据;
[0109]
利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,标定出所述目标企业的诚信水平,其中,所述企业诚信水平标定模型是利用标注有诚信水平的训练数据训练得到的模型。
[0110]
可选的,所述程序的细化功能和扩展功能可参照上文描述。
[0111]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0112]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
[0113]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1