基于金融大数据的贷款信息加密管理平台的制作方法

文档序号:33481274发布日期:2023-03-15 12:22阅读:49来源:国知局
基于金融大数据的贷款信息加密管理平台的制作方法

1.本发明涉及数据加密技术领域,具体涉及一种基于金融大数据的贷款信息加密管理平台。


背景技术:

2.目前,信息科学技术正在快速发展,云计算、大数据技术广泛应用于各个领域中,而对于未来的金融业,从大数据中挖掘有价值信息将是其核心竞争力。因此金融大数据的存储保密至关重要,其中,贷款信息的数据中不仅包含银行的核心数据,而且包含客户的隐私数据,对该数据的保密性要求极高。
3.现有技术中,采用基于数据的频率加密方法,对用户贷款信息进行加密,由于加密后数据统计特征较为明显,导致用户贷款信息的加密程度较低,容易被破解,从而导致用户贷款信息的安全性较低。


技术实现要素:

4.为了解决用户贷款信息的加密程度较低的问题,本发明提供一种基于金融大数据的贷款信息加密管理平台,所采用的技术方案具体如下:本发明提出了一种基于金融大数据的贷款信息加密管理平台,包括:获取模块,用于从金融大数据中获取用户的贷款信息,所述贷款信息包括多个用户贷款数据串,获取所述多个用户贷款数据串中任一用户贷款数据串与其他用户贷款数据串之间的相似度;拼接模块,用于根据所述相似度,从所述其他用户贷款数据串中确定与所述任一用户贷款数据串相似的相似用户贷款数据串,将所述任一用户贷款数据串与所述相似用户贷款数据串进行拼接,得到第一数据串;数据变换模块,用于获取所述第一数据串中每个数据的频数,根据所述频数对所述第一数据串中的数据进行匹配得到数据对,将所述数据对中的第一数据变换成第二数据,得到第二数据串,其中,所述第一数据的频数大于所述第二数据的频数;加密模块,用于对所述第二数据串进行置乱加密处理得到第三数据串,并确定所述第三数据串为所述任一用户贷款数据串的密文。
5.一些实施例中,所述获取所述多个用户贷款数据串中任一用户贷款数据串与其他用户贷款数据串之间的相似度,包括:确定所述任一用户贷款数据串和所述其他用户贷款数据串中的相同数据和不同数据,获取所述相同数据的第一数量和所述不同数据的第二数量;获取所述相同数据在所述任一用户贷款数据串中的第一频数以及所述相同数据在所述其他用户贷款数据串中的第二频数;提取所述任一用户贷款数据串和所述其他用户贷款数据串中的全部数据得到目标数据集,获取所述目标数据集的数据平均频数;
根据所述第一数量、所述第二数量、所述第一频数、所述第二频数、所述数据平均频数和设定权重系数,获取所述相似度。
6.一些实施例中,所述根据所述第一数量、所述第二数量、所述第一频数、所述第二频数、所述数据平均频数和设定权重系数,获取所述相似度,其计算公式包括:其中,为任一用户贷款数据串与其他用户贷款数据串之间的相似度,为任一用户贷款数据串和其他用户贷款数据串中相同数据的第一数量,为任一用户贷款数据串和其他用户贷款数据串中不同数据的第二数量,为第个相同数据在任一用户贷款数据串中的第一频数,为第个相同数据在其他用户贷款数据串中的第二频数,为目标数据集的数据平均频数,和均为权重系数,为相同数据的索引。
7.一些实施例中,所述根据所述相似度,从所述其他用户贷款数据串中确定与所述任一用户贷款数据串相似的相似用户贷款数据串,包括:从所述相似度中确定最大相似度,确定所述最大相似度对应的用户贷款数据串为所述相似用户贷款数据串。
8.一些实施例中,所述根据所述频数对所述第一数据串中的数据进行匹配得到数据对,包括:按照所述频数的大小顺序将所述第一数据串中的数据进行排序,得到数据序列;依次匹配所述数据序列两端的数据作为所述数据对。
9.一些实施例中,所述对所述第二数据串进行置乱加密处理得到第三数据串,包括:根据所述第二数据串的数据数量确定二维数据表;确定所述二维数据表的设定起始映射位置和设定映射顺序,按照所述设定映射顺序,从所述设定起始映射位置开始将所述第二数据串中的数据映射到所述二维数据表中;确定所述二维数据表的设定起始遍历位置和设定遍历顺序,按照所述设定遍历顺序,从所述设定起始遍历位置开始遍历所述二维数据表,得到所述第三数据串。
10.本发明具有如下有益效果:由于单一用户贷款数据串的统计特征通常较为明显,在进行加密时加密效果较差,为了提升加密效果本发明对用户贷款数据串进行拼接处理,以便于后续降低数据串的统计特征,并且将单一数据串的加密变换成拼接数据串的加密,也能够提高贷款信息的加密效果。将两个相似的用户贷款数据串进行拼接,能够尽可能地改变原有用户贷款数据串中每个数据的频数,从而改变原有用户贷款数串的统计特性,从而提高加密效果。通过将拼接后的用户贷款数据串中的高频数据变换成对应的低频数据,能够使得用户贷款数据串中不同数据的频数更为均衡,从而降低用户贷款数据串的统计特征,进而增强贷款信息的加密程度。通过对第二数据串进行置乱加密处理,能够进一步提高贷款信息的数据加密程度,从而保证贷款信息的安全性。
附图说明
11.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅
仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
12.图1为本发明一个实施例所提供的一种基于金融大数据的贷款信息加密管理平台的结构示意图;图2为本发明一个实施例提供的一种z字型扫描法的示意图;图3为本发明一个实施例提供的另一种z字型扫描法示意图。
具体实施方式
13.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于金融大数据的贷款信息加密管理平台,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
14.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
15.本发明技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
16.下面结合附图具体的说明本发明所提供的一种基于金融大数据的贷款信息加密管理平台的具体方案。
17.请参阅图1,其示出了本发明一个实施例提供的一种基于金融大数据的贷款信息加密管理平台的结构示意图,该贷款信息加密管理平台10包括获取模块101、拼接模块102、数据变换模块103和加密模块104。
18.获取模块101用于从金融大数据中获取用户的贷款信息,贷款信息包括多个用户贷款数据串,获取多个用户贷款数据串中任一用户贷款数据串与其他用户贷款数据串之间的相似度。
19.用户的贷款信息可以包括姓名、电话、地址、金额等信息,可以将每个用户的信息数据按照一定的顺序进行排列,然后对照ascii码表将排列好的每个数据变换成十进制编码,得到十进制编码序列作为用户贷款数据串。
20.本发明实施例中,获取多个用户贷款数据串中任一用户贷款数据串与其他用户贷款数据串之间的相似度,包括以下步骤:s101,确定任一用户贷款数据串和其他用户贷款数据串中的相同数据和不同数据,获取相同数据的第一数量和不同数据的第二数量。
21.其中,第一数量为任一用户贷款数据串与其他用户贷款数据串之间相同数据的数量,第二数量为任一用户贷款数据串与其他用户贷款数据串之间不同数据的数量。
22.s102,获取相同数据在任一用户贷款数据串中的第一频数以及相同数据在其他用户贷款数据串中的第二频数。
23.其中,第一频数为任一用户贷款数据串与其他用户贷款数据串之间的相同数据在任一用户贷款数据串中出现的次数,第二频数为任一用户贷款数据串与其他用户贷款数据串之间的不同数据在其他用户贷款数据串中出现的次数。
24.s103,提取任一用户贷款数据串和其他用户贷款数据串中的全部数据得到目标数据集,获取目标数据集的数据平均频数。
25.将任一用户贷款数据串和其他用户贷款数据串中的全部数据提取至目标数据集中,并获取目标数据集的数据类别数量和每类数据的频数,计算全部类别数据的频数的和值,将该和值与数量类别数量之间的比值作为目标数据集的数据平均频数。
26.需要说明的是,本发明实施例将目标数据集中相同的数据作为一个类别。
27.s104,根据第一数量、第二数量、第一频数、第二频数、数据平均频数和设定权重系数,获取相似度。
28.可选地,可以通过下述公式计算该相似度。
29.其中,为任一用户贷款数据串与其他用户贷款数据串之间的相似度,为任一用户贷款数据串和其他用户贷款数据串中相同数据的第一数量,为任一用户贷款数据串和其他用户贷款数据串中不同数据的第二数量,为第个相同数据在任一用户贷款数据串中的第一频数,为第个相同数据在其他用户贷款数据串中的第二频数,为目标数据集的数据平均频数,和均为设定权重系数,为相同数据的索引。
30.需要说明的是,权重系数和可以根据实际需求进行设定,此处不做任何限定,可选地,,。
31.本发明实施例中,任一用户贷款数据串与其他用户贷款数据串之间相同的数据越多,即任一用户贷款数据串和其他用户贷款数据串相同数据的第一数量越大,任一用户贷款数据串与其他用户贷款数据串之间的相似度越大,因此相似度与第一数量呈正相关关系。任一用户贷款数据串与其他用户贷款数据串之间不相同的数据越少,即任一用户贷款数据串和其他用户贷款数据串相同数据的第二数量越小,任一用户贷款数据串与其他用户贷款数据串之间的相似度越大,因此相似度与第一数量呈负相关关系。可以反映任一用户贷款数据串和其他用户贷款数据串拼接前后的数据分布差异,该差异越大,表明任一用户贷款数据串和其他用户贷款数据串之间的程度越低,即相似度越小,因此数据分布差异与相似度呈负相关关系。由此,通过考虑任一用户贷款数据串和其他用户贷款数据串中相同数据的第一数量和不同数据的第二数量,以及任一用户贷款数据串和其他用户贷款数据串拼接前后的数据分布差异,提高了任一用户贷款数据串与其他用户贷款数据串之间相似度的准确性。
32.拼接模块102,用于根据相似度,从其他用户贷款数据串中确定与任一用户贷款数据串相似的相似用户贷款数据串,将任一用户贷款数据串与相似用户贷款数据串进行拼接,得到第一数据串。
33.一些实施例中,从相似度中确定最大相似度,确定最大相似度对应的用户贷款数据串为相似用户贷款数据串。
34.具体地,在获取任一用户贷款数据串与每个其他用户贷款数据串之间的相似度
后,比较每个相似度的大小,以确定最大相似度,并确定最大相似度对应的用户贷款数据串为相似用户贷款数据串。
35.数据变换模块103,用于获取第一数据串中每个数据的频数,根据频数对第一数据串中的数据进行匹配得到数据对,将数据对中的第一数据变换成第二数据,得到第二数据串,其中,第一数据的频数大于第二数据的频数。
36.一些实施例中,按照频数的大小顺序将第一数据串中的数据进行排序,得到数据序列,依次匹配数据序列两端的数据作为数据对。
37.可以按照频数从大到小或者从小到大的顺序将第一数据串中的数据进行排序,得到数据序列,然后依次匹配数据序列两端的数据作为数据对。若按照频数从小到大的顺序排列第一数据串中的数据得到数据序列,则数据序列的左端数据为数据对中的第二数据,数据序列的右端数据为数据对中的第一数据,并将第一数据变换成第二数据;若按照频数从大到小的顺序排列第一数据串中的数据得到数据序列,则数据序列的左端数据为数据对中的第一数据,数据序列的右端数据为数据对中的第二数据,并将第一数据变换成第二数据。在将第一数据串中每个数据对中的第一数据变换成第二数据后,得到第二数据串。
38.需要说明的是,在数据序列中的数据总数为奇数时,数据序列中间的数据不进行变换处理。
39.可选地,可以采用线性变换方式将第一数据变换成第二数据,或者,也可以采用其他任意可能的方式将第一数据变换成第二数据,此处不做任何限定。
40.由于基于数据频率对数据进行加密,会出现高频数据,而高频数据的统计特征较为明显,容易根据高频数据的统计特征进行破解。本发明实施例中,通过将相似数据串进行拼接,并将拼接后的数据串中的高频数据变换成对应的低频数据,能够使得拼接后的数据串的数据频率较为均衡,从而降低用户贷款数据串的统计特征,进而提高数据的加密程度,保证数据的安全性。
41.加密模块104,用于对第二数据串进行置乱加密处理得到第三数据串,并确定第三数据串为任一用户贷款数据串的密文。
42.可选地,根据第二数据串的数据数量确定二维数据表,确定二维数据表的设定起始映射位置和设定映射顺序,按照设定映射顺序,从设定起始映射位置开始将二维数据表中的数据映射到二维数据表中,确定二维数据表的设定起始遍历位置和设定遍历顺序,按照设定遍历顺序,从设定起始遍历位置开始遍历二维数据表,得到第三数据串。
43.本发明实施例中,二维数据表为高度与宽度相等的数据表,可以通过下述公式获取二维数据表尺寸:其中,为二维数据表的高度或宽度,为第二数据串的数据数量,表示取最大整数。
44.本发明实施例中,在确定二维数据表后,可以采用z字型扫描法将第二数据串中的数据映射到二维数据表中,其中,扫描起始点包括左上扫描起始点、左下扫描起始点、右上扫描起始点和右下扫描起始点,其中,每个扫描起始点对应一个扫描顺序,左上扫描起始点对应第一扫描顺序,左下扫描起始点对应第二扫描顺序,右上扫描起始点对应第三扫描顺
序,右下扫描起始点对应第三扫描顺序。其中,第一扫描顺序与第四扫描顺序相反,第二扫描顺序与第三扫描顺序相反。
45.图2为本发明一个实施例提供的一种z字型扫描法示意图,如图2所示,以左上扫描起始点为起始点按照第一扫描顺序扫描二维数据表。需要说明的是,在以右下扫描点为起始点扫描二维数据表时,以图2所示的第一扫描顺序的相反顺序进行扫描,即以第四扫描顺序进行扫描。
46.图3为本发明一个实施例提供的另一种z字型扫描法示意图,如图3所示,以左下扫描点为起始点按照第二扫描顺序扫描二维数据表。需要说明的是,在以右上扫描点为起始点扫描二维数据表时,以图3所示的第二扫描顺序的相反顺序进行扫描,即以第三扫描顺序进行扫描。
47.本发明实施例中,设定起始映射位置为任一扫描起始点所处的位置,设定映射顺序为该任一扫描起始点对应的扫描顺序。
48.示例性的,假设设定起始映射位置为左上扫描起始点所处的位置,设定映射顺序为左上扫描起始点对应的扫描顺序,则可以按照从左向右的顺序提取第二数据串中的数据,并按照图2所示的左上扫描起始点对应的扫描顺序将提取出来的数据依次存放于二维数据表中。
49.本发明实施例中,设定起始遍历位置为任一扫描起始点所处的位置,设定遍历顺序为该任一扫描起始点对应的扫描顺序。
50.需要说明的是,设定起始映射位置与设定起始遍历位置为不同扫描起始点的位置,相应地,设定映射顺序与设定遍历顺序对应的扫描顺序不同。
51.示例性的,假设设定起始遍历位置为右下扫描起始点所处的位置,设定遍历顺序为右下扫描起始点对应的扫描顺序,则可以从右下扫描起始点开始,按照右下扫描起始点对应的扫描顺序遍历二维数据表,得到第三数据串。其中,左上扫描起始点对应的扫描顺序与右下扫描起始点对应的扫描顺序相反。
52.其中,第三数据串可以作为任一用户贷款数据串的密文,通过上述方式可以将贷款信息中的全部数据进行加密处理,得到多个密文。
53.本发明实施例中,由于设定映射顺序与设定遍历顺序不同,设定起始映射位置与设定起始遍历位置不同,在将第二数据串映射到二维数据表中,并遍历二维数据表得到第三数据串后,会将第二数据串中的数据顺序打乱,也即是说,第二数据串与第三数据串的数据顺序不同。通过将第二数据串中的数据顺序打乱,能够进一步提高数据的保密性,提高数据的加密程度。
54.进一步地,在对贷款信息中的全部数据进行加密处理后,可以获取相应的密钥,以根据密钥对相应的密文进行解密。
55.一些实施例中,获取任一用户贷款数据串的第一数据数量、该任一用户贷款信息串的相似用户贷款数据串的第二数据数量、该任一用户贷款数据串在第二数据串中的第一位置参数、该相似用户贷款数据串在第二数据串中的第二位置参数、第一数据变换成第二数据的变换参数、设定起始映射位置的第三位置参数和设定起始遍历位置的第四位置参数,根据第一数据数量、第二数据数量、第一位置参数、第二位置参数、变换参数、第三位置参数和第四位置参数,生成对应密钥。
56.若第一位置参数为0,第二位置参数为1,则表示在第二数据串中任一用户贷款信息串位于相似用户贷款数据串左侧,若第一位置参数为1,第二位置参数为0,则在第二数据串中表示任一用户贷款信息串位于相似用户贷款数据串右侧。
57.一些实施例中,在通过线性变换方式将第一数据串中数据对的第一数据变换成第二数据时,假设第二数据为,第一数据为,则可以通过下述公式分别计算变换参数和变换参数。
[0058]58.其中,为线性变换的斜率参数,为线性变换的截距参数,为第二数据,为第一数据,表示取最大整数。
[0059]
相应地,第一数据变换成第二数据的函数为:=。
[0060]
在确定上述变换参数和变换参数之后,在对进行解密时可以根据变换参数和变换参数将第二数据变换成第一数据。
[0061]
进一步地,变换参数包括变换数量和变换位置参数,其中,变换数据量为数据对的数量,变换位置参数为第一数据的位置参数,可以在将第一数据变换成第二数据时,记录第一数据的位置参数,例如第一数据在第一数据串中的位置索引,作为变换位置参数。
[0062]
本发明实施例中,在对第二数据串进行置乱加密处理时,如图2所示,扫描起始点包括左上扫描起始点、左下扫描起始点、右上扫描起始点和右下扫描起始点,可以将左上扫描起始点的位置用参数0表示,将左下扫描起始点的位置用参数1表示,将右上扫描起始点的位置用参数2表示,将右下扫描起始点的位置用参数3表示。也即是说,第三位置参数可以为0、1、2或3,第四位置参数也可以为0、1、2或3。其中,第三位置参数与第四位置参数不相同。
[0063]
具体地,在获取第一数据数量、第二数据数量、第一位置参数、第二位置参数、变换参数、第三位置参数和第四位置参数之后,可以按照设定先后顺序将第一数据数量、第二数据数量、第一位置参数、第二位置参数、变换参数、第三位置参数和第四位置参数进行拼接,得到一组数组作为密钥,并将密钥进行存储,用于密文的解密。
[0064]
其中,使用密钥的对密文的解密过程如下:(1)提取密钥中的第四位置参数,根据第四位置参数确定设定起始遍历位置和设定遍历顺序,将设定起始遍历位置为起始映射位置,将设定遍历顺序作为映射顺序,从起始映射位置开始按照映射顺序将密文中的数据依次映射到二维数据表中。提取密钥中的第三位置参数,根据第三位置参数确定设定起始映射位置和设定映射顺序,将设定起始映射位置作为起始遍历位置,将设定映射顺序作为遍历顺序,从起始遍历位置开始按照遍历顺序遍历二维数据表,得到第二数据串。
[0065]
(2)提取密钥中的变换参数,根据变换参数对第二数据串中的数据进行加密时的逆变换处理,得到第一数据串。
[0066]
(3)提取密钥中的第一数据数量、第二数据数量、第一位置参数和第二位置参数,根据第一数据数量、第二数据数量、第一位置参数和第二位置参数确定第一数据串中的两
个用户贷款数据串。
[0067]
(4)对照ascii码表,分别将第一数据串中的两个用户贷款数据串转换成原始数据,完成解密,其中,原始数据为加密前的明文。
[0068]
综上所述,本发明实施例中,由于单一用户贷款数据串的统计特征通常较为明显,在进行加密时加密效果较差,为了提升加密效果本发明对用户贷款数据串进行拼接处理,以便于后续降低数据串的统计特征,并且将单一数据串的加密变换成拼接数据串的加密,也能够提高贷款信息的加密效果。将两个相似的用户贷款数据串进行拼接,能够尽可能地改变原有用户贷款数据串中每个数据的频数,从而改变原有用户贷款数串的统计特性,从而提高加密效果。通过将拼接后的用户贷款数据串中的高频数据变换成对应的低频数据,能够使得用户贷款数据串中不同数据的频数更为均衡,从而降低用户贷款数据串的统计特征,进而增强贷款信息的加密程度。通过对第二数据串进行置乱加密处理,能够进一步提高贷款信息的数据加密程度,从而保证贷款信息的安全性。
[0069]
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0070]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1