风险评估方法、装置、计算机设备和存储介质与流程

文档序号:19117719发布日期:2019-11-13 01:20阅读:237来源:国知局
风险评估方法、装置、计算机设备和存储介质与流程

本申请涉及大数据技术领域,特别是涉及一种风险评估方法、装置、计算机设备和存储介质。



背景技术:

为了便于对处于不同行业的不同企业进行风险评价和比较,目前的风险评估方法均采用各企业之间共通的风险指标进行评价。可是不同行业的企业表现特征和风险信息差异较大,若基于同一风险评价方法对不同行业的企业进行评判,对企业经营信息的评判数据不准确,容易遗漏企业其他关键信息,进而错失预警良机,故而降低了风险评价的准确性。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高企业风险评价准确性的风险评估方法、装置、计算机设备和存储介质。

一种风险评估方法,所述方法包括:

接收终端发送的目标企业的风险评价指令;

根据所述风险评价指令获取与所述目标企业相关的目标经营信息;

根据目标经营信息确认所述目标企业的行业类别,获取与所述行业类别对应的行业风险评估模型,所述行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,所述行业风险评估模型是根据样本企业的样本经营信息训练的,所述样本企业与所述目标企业同属于一个行业类别;

从所述目标经营信息中提取与所述第一风险指标对应的第一指标信息;

将所述第一风险指标和所述第一指标信息输入所述行业风险评估模型得到风险指数;

根据所述风险指数生成针对所述目标企业的风险评价并发送给所述终端。

在其中一个实施例中,行业风险评估模型的生成方法,包括:

获取各行业类别的样本企业的样本运营状态及样本经营信息;

从所述样本经营信息中提取与所述行业类别对应的第二风险指标;

对所述样本经营信息中与所述第二风险指标对应的第二指标信息进行量化得到第二评估数值;

根据所述第二风险指标、所述第二评估数值和所述样本运营状态构建与所述行业类别对应的行业风险评估模型。

在其中一个实施例中,从所述样本经营信息中提取与所述行业类别对应的第二风险指标,包括:

对样本经营信息进行语义分析,提取出样本经营信息的样本信息主体;

对所述样本信息主体进行信息抽取得到行业词语;

对所述行业词语进行筛选得到第二风险指标。

在其中一个实施例中,对所述样本信息主体进行信息抽取得到行业词语,包括:

对历史信息主体进行信息抽取,得到与各历史信息主体对应的主体表达式;

通过聚类算法对主体表达式进行消歧;

获取预设频率阈值;

从消歧后的主体表达式中提取出现频率大于预设频率阈值的词语作为行业词语。

在其中一个实施例中,对所述行业词语进行筛选,得到第二风险指标,包括:

对所述样本运营状态进行评分,得到样本运营得分;

获取与所述样本运营状态对应的各所述样本经营信息;

计算各所述样本经营信息与所述样本经营得分对应的影响系数;

根据所述影响系数从所述行业词语中筛选得到第二风险指标。

在其中一个实施例中,根据所述风险评价指令获取与所述目标企业相关的目标经营信息,包括:

根据所述风险评价指令获取与所述目标企业经营相关的原始数据;

从所述原始数据中提取出历史事件时刻;

根据所述历史事件时刻对所述原始数据进行分类,并对分类后的所述原始数据进行可信度分析得到数据可信度;

获取预设可信度阈值;

根据所述数据可信度大于所述预设可信度阈值的所述原始数据生成目标经营信息。

在其中一个实施例中,根据目标经营信息确认所述目标企业的行业类别,包括:

根据所述目标经营信息生成目标企业的目标画像;

计算所述目标画像与类别画像的画像相似度,所述类别画像是根据所述样本企业的样本经营信息统计得到的;

根据所述画像相似度确认所述目标企业的行业类别。

一种风险评估装置,所述装置包括:

指令接收模块,用于接收终端发送的目标企业的风险评价指令;

经营信息获取模块,用于根据所述风险评价指令获取与所述目标企业经营相关的目标经营信息;

行业模型获取模块,用于获取所述目标企业的行业类别,及与所述行业类别对应的行业风险评估模型,所述行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,所述行业风险评估模型是根据样本企业的样本经营信息训练的,所述样本企业与所述目标企业同属于一个行业类别;

指标信息提取模块,用于从所述目标经营信息中提取与所述第一风险指标对应的第一指标信息;

风险指数计算模块,用于将所述第一风险指标和所述第一指标信息输入所述行业风险评估模型得到风险指数;

企业风险评估模块,用于根据所述风险指数生成针对所述目标企业的风险评价并发送给所述终端。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

上述风险评估方法、装置、计算机设备和存储介质,服务器根据风险评价指令确认目标企业的行业类别,并获取与行业类别对应的行业风险评估模型,该行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,上述风险评估方法可以将第一风险指标和第一指标信息输入行业风险评估模型中获取与目标企业对应的风险指数,并根据行业类别针对性地对目标企业进行分析,提高风险评价的准确性,而且,行业类别是根据目标经营信息得到的,考量并整合了目标经营信息中的有效数据,进一步提高风险评价的准确性。

附图说明

图1为一个实施例中风险评估方法的应用场景图;

图2为一个实施例中风险评估方法的流程示意图;

图3为一个实施例中行业风险评估模型生成方法的流程示意图;

图4为另一个实施例中风险指标提取步骤的流程示意图;

图5为另一个实施例中行业类别判定方法的流程示意图;

图6为一个实施例中风险评估装置的结构框图;

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的风险评估方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信,服务器104通过另一网络与服务器106通信。终端102将风险评价指令发送给服务器104,服务器104接收终端102发送的目标企业的风险评价指令,根据风险评价指令从服务器106获取与目标企业经营相关的目标经营信息;服务器104根据目标经营信息获取目标企业的行业类别,获取与行业类别对应的行业风险评估模型,行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,行业风险评估模型是根据样本企业的样本经营信息训练的,样本企业与目标企业同属于一个行业类别;服务器从目标经营信息中提取与第一风险指标对应的第一指标信息,将第一风险指标和第一指标信息输入行业风险评估模型得到风险指数,根据风险指数生成针对目标企业的风险评价并发送给终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式智能设备,服务器104和服务器106均可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种风险评估方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:

步骤202,接收终端发送的目标企业的风险评价指令。

服务器104接收终端102发送的目标企业的风险评价指令。风险评价指令用于启动对目标经营信息获取的控制操作。风险评价指令可以是包含目标企业的工作代码。风险评价指令可以携带有从预设网址上根据目标企业的名称爬取目标企业经营信息等内容。预设网址可以是政府官网或其他第三方具有公信力的网址,也可以目标企业的网站等。风险评价指令中的目标企业可以通过识别用户在终端102输入的语音信息、文字信息等确定。终端102可以获取用户输入的语音信息或文字信息,并根据语音信息或文字信息识别出目标企业,而后生成风险评价指令。例如,用户可以在使用风险评估界面的过程中,点击语音识别功能,终端102获取用户输入的语音信息并识别出目标企业,并生成携带有目标企业的风险评价指令。

步骤204,根据所述风险评价指令获取与所述目标企业相关的目标经营信息。

服务器104根据风险评价指令获取与目标企业相关的目标经营信息。目标经营信息可以是目标企业的工商变更信息、各种贷还款信息、法律公告、环保舆情信息或者财务信息等,目标经营信息的来源可以是银行报文、法律公告、行政公告等具有公信力的第三方公文,也可以是发表的新闻报道等。服务器可以根据目标企业的企业名称或简称或代称从互联网爬取目标经营信息,也可以在目标企业的网站上获取目标企业发表的目标经营信息。

步骤206,根据目标经营信息确认获取所述目标企业的行业类别,获取与所述行业类别对应的行业风险评估模型,所述行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,所述行业风险评估模型是根据样本企业的样本经营信息训练的,所述样本企业与所述目标企业同属于一个行业类别。

服务器104根据目标经营信息确认目标企业的行业类别,获取与行业类别对应的行业风险评估模型。目标企业的行业类别可以根据目标企业的目标经营信息确定具体经营范围,再根据具体经营范围确定,行业类别可以分为房地产业、制造业、轻工业、重工业、批发零售业、服务业与其他等。行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系。行业风险评估模型是通过对样本企业的样本经营信息进行分析训练得到的。样本企业与目标企业同属于一个行业类别。不同行业类别具有不同的行业风险评估模型,每个行业风险评估模型中的风险指标不完全一致,且各风险指标对应的风险系数也不完全一致。

第一风险指标是从与行业类别对应的样本企业的样本经营信息中提取出的,不仅是影响样本运营状态的重要指标,也与行业类别息息相关。例如,针对房地产行业,第一风险指标可以为住宅投资额、房屋施工面积、房屋开工面积、房屋竣工面积、国内到期贷款、当年已还贷款、企业未到期贷款、企业股权变更等;针对制造业,第一风险指标可以是年销量、原料价格、产品产量、采购经理指数(pmi)、库存、积压订单、出口订单、企业未到期贷款、企业股权变更等;针对批发零售业,第一风险指标可以是产品批发价、当前运营商库存、产品销售价、未到货订单、预期销售额等。

步骤208,从所述目标经营信息中提取与所述第一风险指标对应的第一指标信息。

服务器104从所述目标经营信息中提取与所述第一风险指标对应的第一指标信息。服务器可以根据指标信息提取规则从目标经营信息中提取出第一指标信息。指标信息提取规则可以是:当第一风险指标与数值相关时,获取第一风险指标的数值单位,提取目标经营信息中与数值单位相邻的数值为第一指标信息。

例如,目标经营信息为“xx年xx月xx日,借款人a对外担保出现不良贷款业务,业务对应被担保人b,到期日为xx1,业务对应的款项为xx2万元”,第一风险指标为“不良贷款”,第一风险指标“不良贷款”与金额数值相关,服务器根据第一风险指标“不良贷款”获取金额数值的单位为“元、万元、亿元、美元等”,服务器从目标经营信息中提取出的第一指标信息为“xx2万元”。

步骤210,将所述第一风险指标和所述第一指标信息输入所述行业风险评估模型得到风险指数。

服务器104将第一风险指标和第一指标信息输入行业风险评估模型得到风险指数。行业风险评估模型可以是第一评估数值和第一风险系数构成的与风险指数对应的函数式,根据第一评估数值和第一风险系数可以计算得到风险指数,其中,第一评估数值是将第一指标信息量化得到,第一风险系数是第一风险指标在函数式中的权重;行业风险评估模型也可以是由第一风险指标及第一指标信息建立的映射关系,根据不同的第一指标信息最终映射得到风险指数。

步骤212,根据所述风险指数生成针对所述目标企业的风险评价并发送给所述终端。

服务器104根据风险指数生成针对目标企业的风险评价并发送给终端102。不同风险指数对应不同的企业运营状态。风险指数用于描述企业的经营状态,对企业风险进行表征。当风险指数越高,企业出现破产或坏账的风险概率越高。例如,当风险指数为1级时,服务器判定目标企业为良性运营状态,且风险极低,可以生成的风险评价为“目标企业的风险指数为1级,企业为良性运营状态,建议投资或贷款”;当风险指数为10级时,服务器判定目标企业为恶性运营状态,且风险极高,可以生成的风险评价为“目标企业的风险指数为10级,企业为恶性运营状态,建议收回投资或贷款”。

上述风险评估方法中,可以获取与目标企业的行业类别对应的第一风险指标,并根据第一风险指标针对性地对目标企业进行分析,提高风险评价的准确性,而且,对目标经营信息的量化评估,考量并整合了目标经营信息中的有效数据,进一步提高风险评价的准确性。

在一个实施例中,如图3所示,行业风险评估模型的生成方法,具有以下步骤:

步骤302,获取各行业类别的样本企业的样本运营状态及样本经营信息。

服务器104获取各行业类别的样本企业的样本运营状态及样本经营信息。服务器104根据行业类别分别提取样本企业的样本运营状态及样本经营信息。例如,服务器可以将样本企业分为房地产、制造业、轻工业、重工业、批发零售、服务业与其他、城投债券等行业类别,而后根据各行业类别获取相关的样本企业的各种信息。

样本企业可以存储在企业数据库中。企业数据库可以包含现在正在运营的企业、停止运营的企业以及运营失败的企业;企业数据库也可以包含未出现企业风险的企业以及已出现企业风险的企业。样本经营信息可以是样本企业的工商变更信息、各种贷还款信息、法律公告、环保舆情信息或者财务信息等。样本企业可以具有多个与运营时间对应的样本运营状态,每个样本运营状态与至少一条样本经营信息对应。

步骤304,从所述样本经营信息中提取与所述行业类别对应的第二风险指标。

服务器104从样本经营信息中提取与行业类别对应的第二风险指标。服务器104可以对样本经营信息进行语义分析,并对样本经营信息进行分词处理,确定各分词的词性。服务器根据词性从样本经营信息中提取出不含有主语和谓语的信息短语。服务器可以将信息短语中出现的分词按出现频次进行排序,而后将排序在前的分词设定为与行业类别对应的第二风险指标;服务器也可以将信息短语中出现频次大于预定值的分词设定为与行业类别对应的第二风险指标。

步骤306,对所述样本经营信息中与所述第二风险指标对应的第二指标信息进行量化得到第二评估数值。

服务器104对样本经营信息中与第二风险指标对应的第二指标信息进行量化得到第二评估数值。服务器可以从样本经营信息中提取出第二指标信息,并从第二指标信息中提取第二指标数值,第二指标数值可以是各种金额数值或者比值或者处罚天数,对第二指标数值进行评估,得到与第二指标数值对应的第二评估数值。

步骤308,根据所述第二风险指标、所述第二评估数值和所述样本运营状态构建与所述行业类别对应的行业风险评估模型。

服务器104根据第二风险指标、第二评估数值和样本运营状态构建与行业类别对应的行业风险评估模型。服务器可以对样本运行状态进行评估,得到与样本运行状态对应的风险指数,服务器再根据与各样本运营状态对应的样本经营信息构建第二风险指标、第二评估数值和风险指数的多元方程式,并根据多元方程式最终得到与行业类别对应的行业风险评估模型。服务器也可以对样本运行状态进行评估,得到与样本运行状态对应的风险指数,再根据与各样本运营状态对应的样本经营信息构建第二风险指标、第二指标信息和风险指数的映射关系,并根据得到的映射关系构建行业风险评估模型。

服务器可以根据第二风险指标、第二指标信息和样本运营状态构建与行业类别对应的行业风险评估模型,也可以将第二风险指标按照法律、新闻、财务等或是按照工商、司法、企业经营数据、宏观经济、行业新闻等进行二次分类,并根据二次分类的第二风险指标、第二指标信息和企业经营状态建立初始深度学习模型,再对多个初始深度学习模型进行机器学习训练,得到与行业类别对应的深度学习模型。

上述风险评估方法中,通过对不同行业类别的样本企业分别进行信息获取和分析,制定适用不同行业类别的企业风险指数,对企业经营信息进行量化,也便于让用户通过企业的风险指数对位于不同行业类别的企业进行直观地比较和了解。

在一些实施例中,如图4所示,从所述样本经营信息中提取与所述行业类别对应的第二风险指标,具有以下步骤:

步骤402,对样本经营信息进行语义分析,提取出样本经营信息的样本信息主体。

服务器104对样本经营信息进行语义分析,提取出样本经营信息的样本信息主体。服务器可以对各样本经营信息进行切词得到分词,而后服务器确定各分词的词性,并在词向量库中搜索各分词是否存在对应的词向量,服务器根据确定的词向量以及分词的词性得到各样本经营信息的样本信息主体。服务器可以基于词向量和分词的词性构建最短“主谓宾”句式,得到的即为各样本经营信息的样本信息主体。例如,历史经营信息是银行披露的b企业的贷款信息,服务器对该历史经营信息进行语义分析,提取出的历史信息主体是“b企业贷款xx1万元,a企业为b企业进行担保,到期日为xx2月xx3日”。

步骤404,对所述样本信息主体进行信息抽取得到行业词语。

服务器104对样本信息主体进行信息抽取,得到行业词语。例如,样本信息主体为“主谓宾”句式,服务器可以提取出“主谓宾”句式中的宾语,将宾语中出现频次大于预定值的分词设定为与行业类别对应的行业词语。

步骤406,对所述行业词语进行筛选得到第二风险指标。

服务器104对行业词语进行筛选得到第二风险指标。服务器可以对样本运营状态和样本经营信息进行打分,得到对应的分值,再根据各分值得到各样本经营信息的影响系数,服务器将与行业词语对应的样本经营信息的影响系数作为行业词语的影响系数,而后根据影响系数对行业词语进行筛选得到第二风险指标。当一个行业词语与多条样本经营信息对应,且存在多个影响系数时,可以计算影响系数的平均值,并将平均值作为该行业词语的影响系数。

上述风险评估方法中,第二风险指标是基于行业内各企业的样本经营信息和样本运营状态筛选得到的,适应于行业内的所有企业,具有针对性和代表性。

在另一个实施例中,对所述样本信息主体进行信息抽取得到行业词语,包括以下步骤:对历史信息主体进行信息抽取,得到与各历史信息主体对应的主体表达式;通过聚类算法对主体表达式进行消歧;获取预设频率阈值;从消歧后的主体表达式中提取出现频率大于预设频率阈值的词语作为行业词语。

服务器104对样本信息主体进行信息抽取,得到与样本信息主体对应的主体表达式。主体表达式可以是关系或者事件等。关系是由一对名称和联系这对名称的关系构成的相关三元组,例如,比尔盖茨是微软的ceo,关系为ceo(比尔盖茨,微软)。事件可以是固定的事件描述语句,例如,服务器从描述a和b签订合同的段落中,抽取出事件“a和b签订合同”和“合同金额为5千万”。

服务器104通过聚类算法对主体表达式进行消歧。聚类算法可以是k均值聚类法、层次聚类法、密度聚类法等任意一种。服务器将表达同一事件的主体表达式划分为一类,并判断主体表达式是否一致。当判断为一致时,服务器将多条样本经营信息归纳为一条;当判断为不一致时,服务器将多条样本经营信息进行删除。

服务器104获取预设频率阈值,预设频率阈值的大小可以由用户事先设定,也可以由系统在执行过程中不断调整。服务器104从消歧后的主体表达式中提取出现次数大于预设频率阈值的词语,并设定为行业词语。

上述风险评估方法中,通过主体表达式识别出错误的样本经营信息,并从消歧后的主体表达式提取出行业词语,提高了行业词语的精准度。

在一个实施例中,对所述行业词语进行筛选,得到第二风险指标,具有以下步骤:对所述样本运营状态进行评分,得到样本运营得分;获取与所述样本运营状态对应的各所述样本经营信息;计算各所述样本经营信息与所述样本经营得分对应的影响系数;根据所述影响系数从所述行业词语中筛选得到第二风险指标。

服务器104对样本运营状态进行评分,得到样本运营得分。样本运营得分可以是与样本运营状态对应的样本风险指数,也可以是与样本风险指数存在映射关联的数值。例如,样本运营状态为“企业运营处于高利润状态”,服务器可以对样本运营状态打分为“企业风险指数为1”;服务器也可以对样本运营状态打分为“企业得分95分”,其中,样本风险指数越低,企业得分越高。

服务器104获取与样本运营状态对应的各样本经营信息。样本企业的运营状态不会固定不变,会根据当前样本经营信息的变化发生改变。而样本经营信息的变化可以通过时间而确定。服务器可以获取各预设周期内的样本运营状态,并将该预设周期内的样本经营信息与样本运营状态对应。

服务器104计算各样本经营信息与样本经营得分对应的影响系数。服务器可以将样本经营信息中的数值作为自变量,并将样本经营得分作为因变量,计算得到的参数作为各样本经营信息与样本经营得分对应的影响系数。

服务器104将与行业词语对应的样本经营信息的影响系数作为行业词语的影响系数,而后根据影响系数对行业词语进行筛选得到第二风险指标。当一个行业词语与多条样本经营信息对应,且存在多个影响系数时,可以计算影响系数的平均值,并将平均值作为该行业词语的影响系数。服务器可以获取影响系数阈值,将影响系数大于影响系数阈值的行业词语筛选第二风险指标。服务器也可以根据影响系数的大小从大到小对行业词语进行排序,选取排序在前的行业词语作为第二风险指标。

在另一个实施例中,根据所述风险评价指令获取与所述目标企业相关的目标经营信息,包括以下步骤:根据所述风险评价指令获取与所述目标企业经营相关的原始数据;从所述原始数据中提取出历史事件时刻;根据所述历史事件时刻对所述原始数据进行分类,并对分类后的所述原始数据进行可信度分析得到数据可信度;获取预设可信度阈值;根据所述数据可信度大于所述预设可信度阈值的所述原始数据生成目标经营信息。

服务器104根据风险评价指令获取与目标企业经营相关的原始数据。原始数据可以是指未进行处理与目标企业经营相关的网页信息等,也可以是与目标企业经营相关的新闻报道或是法律公文等。

服务器104从原始数据中提取出历史事件时刻,历史事件时刻为目标企业发生历史事件的时刻。例如,网页信息为“2012年01月12日,报社发表“a企业于2011年12月11日吸引投资2000万元””,服务器可以从网页信息中提取出的历史事件时刻为“2011年12月11日”。

服务器104根据历史事件时刻对原始数据进行分类,并对分类后的原始数据进行可信度分析得到数据可信度。服务器获取各原始数据的数据来源及对应的来源可信度,而后判断分类后的原始数据是否一致,当分类后的原始数据被判定为一致时,将数值最大的来源可信度设定为原始数据的数据可信度;当分类后的原始数据被判定为不一致时,服务器再判断两个样本经营信息是否为包含关系,当两个样本经营信息为包含关系时,服务器判定被包含的样本经营信息为错误信息,另一个样本经营信息为正确信息,将正确信息的来源可信度设定为原始数据的数据可信度。当两个样本经营信息不为包含关系时,服务器再对来源可信度进行排序,例如,国家政府部门的来源可信度>省政府部门的来源可信度>市政府部门的来源可信度,服务器判定来源可信度大的样本经营信息为正确信息,并将将正确信息的来源可信度设定为原始数据的数据可信度。

服务器104获取预设可信度阈值,预设可信度阈值的大小可以由用户事先设定,也可以由系统在执行过程中不断调整。服务器104根据数据可信度大于预设可信度阈值的原始数据生成目标经营信息。

在一些实施例中,如图5所示,根据目标经营信息确认所述目标企业的行业类别,包括以下步骤:

步骤502,根据所述目标经营信息生成目标企业的目标画像。

企业画像是服务器预先根据各样本企业的各类信息数据,例如财务信息数据、新闻语料数据以及企业基本信息等经营信息构建的画像。

构建目标企业画像的过程是给企业添加标签的过程,不同的企业的信息数据不同,所以企业画像的标签也是不同的;具体的,服务器在获得待识别企业的财务信息数据、新闻语料数据以及企业基本信息以后,对财务信息数据、新闻语料数据以及企业基本信息进行自然语言处理分析生成对应的标签数据,从而实现根据标签数据生成待识别企业的标签化画像。

步骤504,计算所述目标画像与类别画像的画像相似度,所述类别画像是根据所述样本企业的样本经营信息统计得到的。

服务器104根据企业画像以及类别画像之间的标签的相似度计算两者间的相似度,从而获取目标企业与类别画像企业间的相似度。类别画像是根据所述样本企业的样本经营信息统计得到的。类别画像中的标签是根据样本经营信息得到的。类别画像包含的标签数量大于企业画像的标签数量。。

步骤506,根据所述画像相似度确认所述目标企业的行业类别。

服务器104根据画像相似度确认所述目标企业的行业类别。当企业画像以及类别画像之间的画像相似度大于预设阈值时,服务器可以判定目标企业属于类别画像对应的行业类别。预设阈值可以从0.6~1间取值。

上述风险评估方法中,考量并整合了目标经营信息中的有效数据,生成目标企业的企业画像,对行业类别进行了准确的判断,进一步提高风险评价的准确性。

应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图6所示,提供了一种风险评估装置,包括:指令接收模块602、经营信息获取模块604、行业模型获取模块606、指标信息提取模块608、风险指数计算模块610和企业风险评估模块612,其中:

指令接收模块602,用于接收终端发送的目标企业的风险评价指令。

经营信息获取模块604,用于根据所述风险评价指令获取与所述目标企业相关的目标经营信息。

行业模型获取模块606,用于获取所述目标企业的行业类别,及与所述行业类别对应的行业风险评估模型,所述行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,所述行业风险评估模型是根据样本企业的样本经营信息训练的,所述样本企业与所述目标企业同属于一个行业类别。

指标信息提取模块608,用于从所述目标经营信息中提取与所述第一风险指标对应的第一指标信息。

风险指数计算模块610,用于将所述第一风险指标和所述第一指标信息输入所述行业风险评估模型得到风险指数。

企业风险评估模块612,用于根据所述风险指数生成针对所述目标企业的风险评价并发送给所述终端。

在另一个实施例中,行业模型获取模块606包括样本信息获取单元、指标提取单元、信息量化单元和模型构建单元,其中:

样本信息获取单元,用于获取各行业类别的样本企业的样本运营状态及样本经营信息。

指标提取单元,用于从所述样本经营信息中提取与所述行业类别对应的第二风险指标。

信息量化单元,用于对所述样本经营信息中与所述第二风险指标对应的第二指标信息进行量化得到第二评估数值。

模型构建单元,用于根据所述第二风险指标、所述第二评估数值和所述样本运营状态构建与所述行业类别对应的行业风险评估模型。

在另一个实施例中,行业模型获取模块606包括信息分析提取单元、行业词语抽取单元和风险指标筛选单元,其中:

信息分析提取单元,用于对样本经营信息进行语义分析,提取出样本经营信息的样本信息主体。

行业词语抽取单元,用于对所述样本信息主体进行信息抽取得到行业词语。

风险指标筛选单元,用于对所述行业词语进行筛选得到第二风险指标。

在一些实施例中,行业模型获取模块606包括主体表达式抽取单元、消歧单元、预设频率阈值获取单元和行业词语设定单元,其中:

主体表达式抽取单元,用于对历史信息主体进行信息抽取,得到与各历史信息主体对应的主体表达式。

消歧单元,用于通过聚类算法对主体表达式进行消歧。

预设频率阈值获取单元,用于获取预设频率阈值。

行业词语设定单元,用于从消歧后的主体表达式中提取出现频率大于预设频率阈值的词语作为行业词语。

在一个实施例中,行业模型获取模块606包括运营评分单元、经营信息获取单元、影响系数计算单元和风险指标筛选单元,其中:

运营评分单元,用于对所述样本运营状态进行评分,得到样本运营得分。

经营信息获取单元,用于获取与所述样本运营状态对应的各所述样本经营信息。

影响系数计算单元,用于计算各所述样本经营信息与所述样本经营得分对应的影响系数。

风险指标筛选单元,用于根据所述影响系数从所述行业词语中筛选得到第二风险指标。

在一个实施例中,经营信息获取模块604包括原始数据获取单元、事件时刻提取单元、预设可信度阈值获取单元和经营信息生成单元,其中:

原始数据获取单元,用于根据所述风险评价指令获取与所述目标企业经营相关的原始数据。

事件时刻提取单元,用于从所述原始数据中提取出历史事件时刻。

原始数据分类单元,用于根据所述历史事件时刻对所述原始数据进行分类,并对分类后的所述原始数据进行可信度分析得到数据可信度。

预设可信度阈值获取单元,用于获取预设可信度阈值。

经营信息生成单元,用于根据所述数据可信度大于所述预设可信度阈值的所述原始数据生成目标经营信息。

在一些实施例中,行业模型获取模块606包括目标画像生成单元、相似度计算单元和类别判定单元,其中:

目标画像生成单元,用于根据所述目标经营信息生成目标企业的目标画像。

相似度计算单元,用于计算所述目标画像与类别画像的画像相似度,所述类别画像是根据所述样本企业的样本经营信息统计得到的。

类别判定单元,用于根据所述画像相似度确认所述目标企业的行业类别。

关于风险评估装置的具体限定可以参见上文中对于风险评估方法的限定,在此不再赘述。上述风险评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储企业风险评估数据,例如预设可信度阈值、预设频率阈值、行业风险评估模型等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种风险评估方法。

本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

接收终端发送的目标企业的风险评价指令;

根据所述风险评价指令获取与所述目标企业相关的目标经营信息;

根据目标经营信息确认所述目标企业的行业类别,获取与所述行业类别对应的行业风险评估模型,所述行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,所述行业风险评估模型是根据样本企业的样本经营信息训练的,所述样本企业与所述目标企业同属于一个行业类别;

从所述目标经营信息中提取与所述第一风险指标对应的第一指标信息;

将所述第一风险指标和所述第一指标信息输入所述行业风险评估模型得到风险指数;

根据所述风险指数生成针对所述目标企业的风险评价并发送给所述终端。

在一个实施例中,处理器执行计算机程序时实现行业风险评估模型的生成方法的步骤时,还用于:获取各行业类别的样本企业的样本运营状态及样本经营信息;从所述样本经营信息中提取与所述行业类别对应的第二风险指标;对所述样本经营信息中与所述第二风险指标对应的第二指标信息进行量化得到第二评估数值;根据所述第二风险指标、所述第二评估数值和所述样本运营状态构建与所述行业类别对应的行业风险评估模型。

在一个实施例中,处理器执行计算机程序时实现从所述样本经营信息中提取与所述行业类别对应的第二风险指标的步骤时,还用于:对样本经营信息进行语义分析,提取出样本经营信息的样本信息主体;对所述样本信息主体进行信息抽取得到行业词语;对所述行业词语进行筛选得到第二风险指标。

在一个实施例中,处理器执行计算机程序时实现对所述样本信息主体进行信息抽取得到行业词语的步骤时,还用于:对历史信息主体进行信息抽取,得到与各历史信息主体对应的主体表达式;通过聚类算法对主体表达式进行消歧;获取预设频率阈值;从消歧后的主体表达式中提取出现频率大于预设频率阈值的词语作为行业词语。

在一个实施例中,处理器执行计算机程序时实现对所述行业词语进行筛选,得到第二风险指标的步骤时,还用于:对所述样本运营状态进行评分,得到样本运营得分;获取与所述样本运营状态对应的各所述样本经营信息;计算各所述样本经营信息与所述样本经营得分对应的影响系数;根据所述影响系数从所述行业词语中筛选得到第二风险指标。

在一个实施例中,处理器执行计算机程序时实现根据所述风险评价指令获取与所述目标企业相关的目标经营信息的步骤时,还用于:根据所述风险评价指令获取与所述目标企业经营相关的原始数据;从所述原始数据中提取出历史事件时刻;根据所述历史事件时刻对所述原始数据进行分类,并对分类后的所述原始数据进行可信度分析得到数据可信度;获取预设可信度阈值;根据所述数据可信度大于所述预设可信度阈值的所述原始数据生成目标经营信息。

在一个实施例中,处理器执行计算机程序时实现根据目标经营信息确认所述目标企业的行业类别的步骤时,还用于:根据所述目标经营信息生成目标企业的目标画像;计算所述目标画像与类别画像的画像相似度,所述类别画像是根据所述样本企业的样本经营信息统计得到的;根据所述画像相似度确认所述目标企业的行业类别。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

接收终端发送的目标企业的风险评价指令;

根据所述风险评价指令获取与所述目标企业相关的目标经营信息;

根据目标经营信息确认所述目标企业的行业类别,获取与所述行业类别对应的行业风险评估模型,所述行业风险评估模型用于描述第一风险指标与风险指数之间的对应关系,所述行业风险评估模型是根据样本企业的样本经营信息训练的,所述样本企业与所述目标企业同属于一个行业类别;

从所述目标经营信息中提取与所述第一风险指标对应的第一指标信息;

将所述第一风险指标和所述第一指标信息输入所述行业风险评估模型得到风险指数;

根据所述风险指数生成针对所述目标企业的风险评价并发送给所述终端。

在一个实施例中,计算机程序被处理器执行时实现行业风险评估模型的生成方法的步骤时还用于:获取各行业类别的样本企业的样本运营状态及样本经营信息;从所述样本经营信息中提取与所述行业类别对应的第二风险指标;对所述样本经营信息中与所述第二风险指标对应的第二指标信息进行量化得到第二评估数值;根据所述第二风险指标、所述第二评估数值和所述样本运营状态构建与所述行业类别对应的行业风险评估模型。

在一个实施例中,计算机程序被处理器执行时实现从所述样本经营信息中提取与所述行业类别对应的第二风险指标的步骤时还用于:对样本经营信息进行语义分析,提取出样本经营信息的样本信息主体;对所述样本信息主体进行信息抽取得到行业词语;对所述行业词语进行筛选得到第二风险指标。

在一个实施例中,计算机程序被处理器执行时实现对所述样本信息主体进行信息抽取得到行业词语的步骤时还用于:对历史信息主体进行信息抽取,得到与各历史信息主体对应的主体表达式;通过聚类算法对主体表达式进行消歧;获取预设频率阈值;从消歧后的主体表达式中提取出现频率大于预设频率阈值的词语作为行业词语。

在一个实施例中,计算机程序被处理器执行时实现对所述行业词语进行筛选,得到第二风险指标的步骤时还用于:对所述样本运营状态进行评分,得到样本运营得分;获取与所述样本运营状态对应的各所述样本经营信息;计算各所述样本经营信息与所述样本经营得分对应的影响系数;根据所述影响系数从所述行业词语中筛选得到第二风险指标。

在一个实施例中,计算机程序被处理器执行时实现根据所述风险评价指令获取与所述目标企业相关的目标经营信息的步骤时还用于:根据所述风险评价指令获取与所述目标企业经营相关的原始数据;从所述原始数据中提取出历史事件时刻;根据所述历史事件时刻对所述原始数据进行分类,并对分类后的所述原始数据进行可信度分析得到数据可信度;获取预设可信度阈值;根据所述数据可信度大于所述预设可信度阈值的所述原始数据生成目标经营信息。

在一个实施例中,计算机程序被处理器执行时实现根据目标经营信息确认所述目标企业的行业类别的步骤时还用于:根据所述目标经营信息生成目标企业的目标画像;计算所述目标画像与类别画像的画像相似度,所述类别画像是根据所述样本企业的样本经营信息统计得到的;根据所述画像相似度确认所述目标企业的行业类别。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1