一种基于多模态高维特征的不良资产估值算法的制作方法

文档序号:36401509发布日期:2023-12-16 04:50阅读:48来源:国知局
一种基于多模态高维特征的不良资产估值算法的制作方法

本发明涉及数据收集与处理,提供了一种基于多模态高维特征的不良资产估值算法。


背景技术:

1、金融不良资产广义上指商业银行等持牌金融机构持有的不能为其带来正常经济利益流入的各类股权、债权、实物类资产。金融不良资产处置方式主要包括诉讼清收、债务重组、债权转让、债转股、资产证券化等方式。不良资产处置中离不开对不良资产进行合理的评估定价,该估值将成为不良资产市场上买卖双方交易对价的重要参考依据。

2、目前市场对于不良资产转让估值没有成熟的方法,目前评估机构还不能短期内拿出成熟的估值报告。这也导致市场上的不良资产转让价格具有很大的随机性和不确定性。而一个不良资产包中一般存在很多不良资产案件,每个案件的状况和实际质地千差万别。在不良资产包估值过程中,由于买卖双方信息不对称,欠缺债务人相对完善的财务信息以及未来收益,债权的可变现价值依赖于每个债务人的实际财务状况和还款意愿。

3、当前不良资产包估值的方法主要包括:

4、1、静态现金流贴现模型:按照确定的期望收益率对证券的未来现金流进行折现,此种方法的关键是确定利率和现金流。静态现金流贴现模型在实操中,最大的难题是未来现金流的确定,以及未来利率走势的预测。由于在不良资产交易过程中,不可能对每个案件的债务人进行详细的了解和资产属性量化,因此单个案件的质地和现金流非常难以判断和定义。因此此种方法对于交易过程中的估值并无太大的实际意义;

5、2、蒙特卡洛模拟是一种基于概率论和统计论的计算方法。基本原理就是:以资产的初始价格为起点,在考虑提前偿付与违约情况下模拟多种现金流路径,得到各路径下的现金流,再贴现,并将所有路径下的贴现值进行加权平均,得到资产的理论价格。这种方法同样受制于不良资产交易过程中的现金流是否可能有途径获取;

6、3、对不良资产包样本数据建立多因素回归模型,是通过对历史不良资产包的总结和归纳,总结出影响不良资产包最终价值的因素,然后在此基础上运用统计模型对这些因素进行回归分析,建立回归模型。多因素回归分析采用统计学的分析方法,比较适用于不良资产的定价分析,但需要大量的不良资产处置案例即不良资产包来作为理论研究的基础,同时最终估值的准确性很大程度上依赖于建立回归方程时所选取的变量,如果最初选取的影响不良资产回收率的相关因素是错误的,那么最终的结果可能会和实际情况相距甚远。

7、现有方法中,例如方法1和方法2的是建立在案件现金流的计算或者模拟的基础上,而现金流由于受制于很多客观(不良资产案件的各项属性)和主观(债务人的实际还款意愿)因素以及难以在案件本身体现的其他诸多因素,例如债务人当前的实际财务状况、工作稳定性、家庭负担、健康状况等等,因此这种方法很难适合于不良资产包交易过程中的价值评估。同时目前不管那种估值方法利用的都是结构化数据,并没有将用户贷款时的身份证照片、大头照照片、活体视频、填写地址文本信息、催收语音数据等非结构化数据利用起来,导致资产包估值和真实价值之间存在很大不匹配,估值不准确等问题,因此,基于多模态语音、图像、视频、文本等,结合结构化数据完成不良资产包价值评估很有研究意义的。

8、现有的估值算法存在以下问题:

9、1,现有估值算法只利用了结构化数据,并没有很好的利用用户信贷时的身份证照片、大头照、活体视频、催收语音、居住地址等非结构化数据,导致估值算法无法准确估值,估值可依赖的数据少。

10、2,针对用户信贷的非结构化数据也没有一种可以对其进行结构化的方法,导致高维特征无法被抽取用于算法训练。


技术实现思路

1、本发明的目的在于解决针对用户信贷的非结构化数据现有技术中没有一种可以对其进行结构化的方法,导致高维特征无法被抽取用于算法训练的问题。

2、为了解决上述技术问题,本发明采用以下技术手段:

3、本发明提供了一种基于多模态高维特征的不良资产估值算法,包括以下步骤:

4、步骤1、对非结构化的图像、视频、文本、语音数据进行高维特征提取,得到多模态非结构化特征;

5、步骤2、先进行特征筛选,再进行特征融合,具体的为:

6、对结构化特征进行特筛选,再将筛选出的结构化特征和多模态非结构化特征融合,再利用深度学习,对融合后的特征构建预测算法模型,完成资产包的估值。

7、上述技术方案中,对非结构化的图像、视频、文本、语音数据进行高维特征提取,得到多模态非结构化特征,具体为:

8、通过身份证照片和大头照编码器实现对身份证和大头照的特征编码,得到非结构化图像特征;

9、通过活体视频编码器实现对活体视频的特征编码,得到非结构化视频特征;

10、通过催收语音编码器实现对催收语音的特征编码,得到非结构化语音特征;

11、通过文本编码器实现对身份证ocr识别的文本的特征编码,得到非结构化文本特征。

12、上述技术方案中,获取信贷产品本身存在的结构化数据,结构化数据的加工根据业务指标定义,使用spark sql,python等数据加工引擎编写脚本进行数据提取和指标加工,形成多维结构化数据特征。

13、上述技术方案中,所述特征筛选实现为:对多维结构化数据特征使用iv值计算法计算特征重要性,筛选出iv值大于0.1的多维结构化数据特征。

14、上述技术方案中,步骤2中特征融合具体的为:

15、对iv值大于0.1的多维结构化数据特征和非结构化图像特征、非结构化文本特征、非结构化语音特征、非结构化视频特征进行融合,融合时将非结构化图像特征、非结构化文本特征、非结构化语音特征、非结构化视频特征的每一个维度组成一列,非结构化图像特征是256维特征、非结构化文本特征是256维特征、非结构化语音特征是128维特征、非结构化视频特征是512维特征,结构化特征是1000维特征,组成的特征维度是256+256+128+512+1000=2152维特征。

16、上述技术方案中,身份证照片和大头照编码器的实现包括以下步骤:

17、步骤a1、使用yolov8算法进行身份证照片检测或者大头照的人脸检测,将身份证照片或人脸照片从图像中提取出来;

18、步骤a2、基于身份证照片或人脸照片,使用resnet34网络提取身份证照片或人脸照片主干网络特征;

19、步骤a3、使用vit transformer嫁接到resnet34网络之后;

20、步骤a4、在vit transformer网络之后,针对人脸照片或者身份证照片造假类型使用alexnet,resnet网络进行网络连接,最后使用不同的损失函数进行学习目标定义,让vittransformer学习到图像翻拍,打印等特征信息,得到身份证照片和大头照编码器的模型;

21、步骤a5、身份证照片和大头照编码器的模型使用反向传播算法将每一轮迭代得到的误差向前传递,并进行梯度求导和更新,不断经过多次迭代完成身份证照片和大头照编码器的模型训练;

22、步骤a6、身份证照片和大头照编码器的模型训练完成后,提取vit transformer这一层的特征map作为身份证照片或者大头照的特征表示,其特征分别记作:face_vi_encode,id_vi_encode。

23、上述技术方案中,活体视频编码器的实现包括以下步骤:

24、步骤b1、对活体视频使用opencv进行视频解析,将每一帧图像提取出来存入到图像数组中,记作:,表示图像的序列编号,从1到;

25、步骤b2、循环数图像组中的每一帧,取出图像使用resnet34网络结构进行图像2维特征编码器网络结构的搭建,每个图像对应的网络结构记作,其中表示图像的序列编号,从1到;

26、步骤b3、将每个网络结构拼接一个3层的lstm网络,每个lstm网络记作:,对图像序列按照编号1到n,将和拼接在一起,得到视频编码器模型;

27、步骤b4、对视频编码器模型利用反向传播算法和梯度下降法进行求解,让损失函数最小,经过多次迭代或者损失函数不再下降时,则视频编码器模型训练完毕;

28、步骤b5、将训练后得到的视频编码器模型最后一层特征作为活体视频编码器的特征。

29、上述技术方案中,催收语音编码器的实现包括以下步骤:

30、步骤c1、对催收的语音数据的语音格式进行统一格式处理,语音的格式有:mp3、wav、wma、mp2、flac、midi、ra、ape、aac、cda、mov,使用ffmpeg对语音格式进行转码,统一转成wav格式;

31、步骤c2、对语音数据进行通道分离,将双通道语音分离成单通道语音,使用python函数包中的wavfile函数进行通道分离;

32、步骤c3、基于分离后的语音数据建立催收语音编码器,催收语音编码器的实现过程如下:

33、步骤c3.1、对语音数据按照20ms进行切片,按照切片顺序组成语音序列,序列记作:,为语音数据切片序列的编号;

34、步骤c3.2、对语音数据切片序列进行训练处理,将每一个切片序列都提取mfcc特征,mfcc特征设定为128维,

35、步骤c3.3、提取完成后将mfcc特征按照切片序号作为行,128维特征作为列,组装成二维数据,然后利用图像处理的特征提取方法,利用vit transformer进行语音编码器模型网络搭建实催收现语音编码器特征提取。

36、上述技术方案中,文本编码器实现包括以下步骤:

37、文本信息包含了用户身份证ocr识别的文本,用户在线贷款时填写的地址、表单数据,以及用户催收的语音数据转文本后形成的文本数据,文本编码器的实现包括以下步骤:

38、步骤d1、对语音数据进行语音转文本识别,将语音转成文本;

39、步骤d2、对语音转文本后的数据,用户身份证ocr识别的地址数据、用户贷款填写的居住地址使用bert进行文本编码,对文本进行向量化,得到非结构化文本特征。

40、上述技术方案中,构建预测算法模型:

41、步骤e1、获取数据样本,并对数据样本按照年份进行统计,结构化特征数据有1000维,包含:信贷数据,还款数据,行为数据,征信数据,非结构化图像数据有256维,非结构化文本数据有256维,非结构化语音数据有128维,视频数据有512维,对数据样本进行划分为训练数据和测试数据;

42、步骤e2、对训练集的1000维的结构化特征数据按照业务指标定义进行特征加工,加工逻辑按照年份加工,同时对于非结构化的图像、视频、文本、语音数据进行特征编码,按照年份提取非结构化数据的特征编码,得到多模态非结构化特征;

43、步骤e3、对训练集中的结构化特征、多模态非结构化特征整体计算iv值,剔除不重要的特征,将剩余的结构化特征和多模态非结构化特征进行拼接融合,组成m维向量,得到融合特征;

44、步骤e4、把每个年份的融合特征作为lstm的输入,使用双向的bilstm技术,学习资产包随时间的变化趋势,完成能够预测资产包的价值的资产包估值模型的搭建;

45、步骤e5、对资产包估值模型进行训练,得到训练好的资产包估值模型;

46、步骤e6、当要预测n年后资产包的价值,则将n输入训练好的资产包估值模型便得到资产包的价值,即得到初步估值;

47、步骤e7、使用一个经济影响因子去乘以步骤e6得到的初步估值,得到最终估值,经济影响因子为给定一个区间,经济好大于1,经济不好小于1,从而完成资产包估值区间的确定。

48、因为本发明采用上述技术手段,因此具备以下有益效果:

49、本发明提出了利用vit transformer,bert,cnn,lstm,mfcc等技术对图像、语音、文本、视频等非结构化数据进行特征编码提取特征,并结合信贷数据、行为数据、征信数据等结构化特征进行特征融合,基于lstm建立时间预测模型预测资产包的价值。该方案有效利用了高维非结构化数据,提升了资产包估值精度,为不良资产估值提供了一种新的解决方案,对结构化和非结构化特征融合提供了新的解决思路,该方案可被借鉴到其他领域。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1