基金相似度计算方法、平台、设备及可读存储介质与流程

文档序号:24622405发布日期:2021-04-09 20:28阅读:98来源:国知局
基金相似度计算方法、平台、设备及可读存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种基金相似度计算方法、平台、设备及可读存储介质。



背景技术:

投资基金随着证券市场的发展而诞生,随着个人投资者投资理念不断向着价值型投资、专业化投资的方向进行转变,基金市场在近年来得到长足而迅速的发展,虽然发展历史不长,但基金数量却增长迅猛。目前,爆款基金的不断涌现,经常造成个人投资者无法申购或者实际可购买量不足的现象,因此,往往需要寻找与爆款基金相似的可替代基金,以满足数量众多的个人投资者的需求。

目前,往往通过基金在一段时间内的净值变动,对证券或者基金进行相似度的计算,以筛选出与目标基金相似的可替代基金,但是,由于会受到基金在一段时间内走势的相关性的影响,造成存在多个相似度都很高的可替代基金,导致基金之间的区分度较低而难以筛选可替代基金,同时,由于仅考虑基金的净值变动,而导致筛选出的可替代基金在持仓等维度与目标基金的差别较大,造成筛选出的可替代基金并不准确。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。



技术实现要素:

本发明的主要目的在于提供一种基金相似度计算方法、平台、设备及可读存储介质,旨在解决现有通过相似度筛选的基金不准确的技术问题。

为实现上述目的,本发明提供一种基金相似度计算方法,所述基金相似度计算方法包括以下步骤:

获取目标基金所对应的分类信息以及最新持仓信息,基于所述最新持仓信息确定所述目标基金对应的最大权重行业,并基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金;

确定目标基金对应的第一持仓产品之间的第一相关度,以及各个目标备选基金对应的第二持仓产品之间的第二相关度,其中,所述第一相关度为表征所述目标基金持仓产品年度收益的关联度,所述第二相关度为目标备选基金的持仓产品年度收益的关联度;

获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树;

将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度,在各个第二最小生成中确定各个相似度中的最大相似度对应的目标最小生成树,并将目标最小生成树对应的目标备选基金作为目标基金的相似基金。

在一实施例中,所述获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树的步骤包括:

基于第一相关度确定目标基金对应的第一相关度矩阵,并基于第二相关度确定各个目标备选基金对应的第二相关度矩阵;

基于最小生成树的克鲁斯卡尔算法,将第一相关度矩阵转换成第一最小生成树,并分别将各个第二相关度矩阵转换成的第二最小生成树。

在一实施例中,所述将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度的步骤包括:

确定第一最小生成树的根节点与各个第二最小生成树的根节点之间的第一相似度,确定第一最小生成树的层数与各个第二最小生成树的层数之间的第二相似度,并确定第一最小生成树的每层节点数与各个第二最小生成树的每层节点数之间的第三相似度;

基于第一相似度、第二相似度以及第三相似度计算各个第二最小生成树对应的相似度。

在一实施例中,所述确定目标基金对应的第一持仓产品之间的第一相关度,以及各个目标备选基金对应的第二持仓产品之间的第二相关度的步骤包括:

获取各个第一持仓产品对应的第一年度收益矢量,基于各个第一年度收益矢量确定各个第一持仓产品之间的第一相关度;

获取各个目标备选基金的第二持仓产品对应的第二年度收益矢量,基于各个第二年度收益矢量确定各个目标备选基金的第二持仓产品之间的第二相关度。

在一实施例中,所述基于各个第一年度收益矢量确定各个第一持仓产品之间的第一相关度的步骤包括:

确定各个第一年度收益矢量中两两之间的夹角余弦值,并基于所述夹角余弦值确定各个第一持仓产品之间的第一相关度。

在一实施例中,所述获取目标基金所对应的分类信息以及最新持仓信息,基于所述最新持仓信息确定所述目标基金对应的最大权重行业,并基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金的步骤包括:

根据最新持仓信息获取所述第一持仓产品的持仓比;

基于所述第一持仓产品的持仓比确定所述目标基金对应的各个行业的行业持仓比,并将所述行业持仓比中的最大行业持仓比对应的行业作为所述最大权重行业;

获取与所述分类信息匹配的备选基金,并基于所述备选基金以及最大权重行业确定预设数量的目标备选基金。

在一实施例中,所述基于所述备选基金以及最大权重行业确定预设数量的目标备选基金的步骤包括:

获取各个备选基金对应的最大比例行业,确定备选基金中最大比例行业与最大权重行业一致的待筛选基金;

根据待筛选基金对应的第一持仓产品以及目标基金对应的第二持仓产品,确定各个待筛选基金与目标基金之间的各个概念暴露列表重合度,并将待筛选基金中概念暴露列表重合度最大的预设数量的基金作为目标备选基金。

此外,为实现上述目的,本发明还提供一种基金相似度计算平台,所述基金相似度计算平台包括:

第一获取模块,用于获取目标基金所对应的分类信息以及最新持仓信息,基于所述最新持仓信息确定所述目标基金对应的最大权重行业,并基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金;

第一确定模块,用于确定目标基金对应的第一持仓产品之间的第一相关度,以及各个目标备选基金对应的第二持仓产品之间的第二相关度,其中,所述第一相关度为表征所述目标基金持仓产品年度收益的关联度,所述第二相关度为目标备选基金的持仓产品年度收益的关联度;

第二获取模块,用于获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树;

第二确定模块,用于将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度,确定各个相似度中的最大相似度对应的目标最小生成树,并将目标最小生成树对应的目标备选基金作为目标基金的相似基金。

此外,为实现上述目的,本发明还提供一种基金相似度计算设备,所述基金相似度计算设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基金相似度计算程序,所述基金相似度计算程序被所述处理器执行时实现前述的基金相似度计算方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基金相似度计算程序,所述基金相似度计算程序被处理器执行时实现前述的基金相似度计算方法的步骤。

本发明通过获取目标基金所对应的分类信息以及最新持仓信息,基于所述最新持仓信息确定所述目标基金对应的最大权重行业,并基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金,接着确定目标基金对应的第一持仓产品之间的第一相关度,以及各个目标备选基金对应的第二持仓产品之间的第二相关度,而后获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树,然后将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度,确定各个相似度中的最大相似度对应的目标最小生成树,并将目标最小生成树对应的目标备选基金作为目标基金的相似基金,通过目标基金的持仓产品、最大权重行业以及目标备选基金持仓产品确定相似基金,使得相似基金与目标基金之间具有高度的行业相关性,通过基金的行业分类提高待筛选的基金之间的区分度,使得相似基金与目标基金更加接近,使得相似基金的未来走势与目标基金的未来走势更为接近,通过持仓产品之间的相关度对应的最小生成树确定相似度,提高基金之间相似度计算的准确性以及计算机的处理效率,提高了筛选相似基金的准确性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境中基金相似度计算设备的结构示意图;

图2为本发明基金相似度计算方法第一实施例的流程示意图;

图3为本发明基金相似度计算方法第二实施例中获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树的步骤的细化流程示意图;

图4为本发明基金相似度计算方法第三实施例中将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度的步骤的细化流程示意图;

图5为本发明基金相似度计算平台一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境中基金相似度计算设备的结构示意图。

本发明实施例基金相似度计算设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的基金相似度计算设备结构并不构成对基金相似度计算设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基金相似度计算程序。

在图1所示的基金相似度计算设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基金相似度计算程序,并执行以下基金相似度计算方法的各个实施例中的操作。

本发明还提供一种基金相似度计算方法,参照图2,图2为本发明基金相似度计算方法第一实施例的流程示意图。

在本实施例中,该基金相似度计算方法包括:

步骤s100,获取目标基金所对应的分类信息以及最新持仓信息,基于所述最新持仓信息确定所述目标基金对应的最大权重行业,并基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金;

本实施例中,目标基金可以为年度收益率达到第一预设收益率的基金,以便于为用户筛选出与爆款基金相似的基金,或者,目标基金还可以为一些走势较差的基金,例如年度收益率小于第二预设收益率的基金,以便于用户避开筛选出的相似基金,其中,第一预设收益率可以为30%、50%等,第二预设收益率可以为5%。

本实施例中,对于每一支目标基金,先获取该目标基金当前的分类信息以及最新持仓信息,该分类信息包括股票基金、债券基金、货币市场基金、期货基金,或者开放式基金和封闭式基金等;例如通过基金的基本信息获取该目标基金对应的分类信息,并从目标基金最新的披露信息中获取该目标基金的最新持仓信息(例如最新季度持仓)。根据最新持仓信息获取该目标基金的所有第一持仓产品,该第一持仓产品包括股票、债券、基金等,并确定各个第一持仓产品对应的行业以及目标基金中所述第一持仓产品的持仓比。然后,根据目标基金的最新持仓信息,按目标基金所持有的第一持仓产品所在行业映射到目标基金所处行业,即根据各个第一持仓产品确定该目标基金所对应的所有行业(即各个持仓产品所对应的行业),并根据所述第一持仓产品的持仓比确定各个行业对应的行业持仓比,针对每一个行业,该行业持仓比为属于该行业持仓产品的持仓比之和。而后,确定各个行业持仓比中的最大行业持仓比,并将最大行业持仓比对应的行业作为最大权重行业。

而后,基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金。例如,在所有的基金(除目标基金之外)中筛选分类信息与目标基金的分类信息一致的基金作为备选基金,在备选基金中筛选预设数量的包括该最大权重行业的基金作为目标备选基金;或者,对包括该最大权重行业的备选基金按照最大权重行业对应的持仓比由大到小进行排序,将排序中筛选最大权重行业对应的持仓比最大的预设数量的基金作为目标备选基金;或者,获取各个备选基金对应的最大比例行业,确定备选基金中最大比例行业与最大权重行业一致的待筛选基金,对待筛选基金按照最大权重行业对应的持仓比由大到小进行排序,将排序中筛选最大权重行业对应的持仓比最大的预设数量的基金作为目标备选基金;或者,获取各个备选基金对应的最大比例行业,确定备选基金中最大比例行业与最大权重行业一致的待筛选基金,计算各个待筛选基金的最大比例行业对应的行业持仓比与目标基金的最大权重行业对应的行业持仓比之间差值的绝对值,将待筛选基金中绝对值最小的预设数量的基金作为目标备选基金。

步骤s200,确定目标基金对应的第一持仓产品之间的第一相关度,以及各个目标备选基金对应的第二持仓产品之间的第二相关度,其中,所述第一相关度为表征所述目标基金持仓产品年度收益的关联度,所述第二相关度为目标备选基金的持仓产品年度收益的关联度;

本实施例中,在获取到目标备选基金之后,获取目标基金对应的第一持仓产品之间的第一相关度,获取目标基金的第一持仓产品对应的第一年度收益矢量,其中,该第一年度收益矢量为年度收益时间序列,年度收益时间序为一年的收益率时间序列,即一年内每一个交易日的收益率按照时间先后排序的序列,该年度收益时间序列对应的向量即为第一持仓产品对应的第一收益率时序矢量。而后,基于各个第一年度收益矢量确定各个第一持仓产品两两之间的第一相关度;具体地,计算各个第一年度收益矢量之间的第一夹角余弦值,对第一夹角余弦值进行归一化,以将各个第一夹角余弦值映射到(0,1)内,例如基于(0,1)的范围对第一夹角余弦值进行归一化,得到各个第一夹角余弦值的第一映射值,将各个第一映射值作为对应的第一持仓产品两两之间的第一相关度。

同理,对于各个目标备选基金,获取每一个目标备选基金的第二持仓产品,并获取各个第二持仓产品对应的第二年度收益矢量,而后,基于各个第二年度收益矢量确定各个第二持仓产品两两之间的第二相关度;具体地,计算各个第二年度收益矢量之间的第二夹角余弦值,对第二夹角余弦值进行归一化,以将各个第二夹角余弦值映射到(0,1)内,例如基于(0,1)的范围对第二夹角余弦值进行归一化,得到各个第二夹角余弦值的第二映射值,将各个第二映射值作为对应的第二持仓产品两两之间的第二相关度,进而得到目标备选基金的第二相关度。

步骤s300,获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树;

本实施例中,可通过最小生成树算法,根据第一相关度生成对应的第一最小生成树,根据各个第二相关度生成对应的第二最小生成树,其中,该最小生成树算法可以采用prim(普里姆)算法或者kruskal(克鲁斯卡尔)算法。

步骤s400,将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度,在各个第二最小生成中确定各个相似度中的最大相似度对应的目标最小生成树,并将目标最小生成树对应的目标备选基金作为目标基金的相似基金。

本实施例中,在获取到第一最小生成树以及各个第二最小生成树时,将第一最小生成树与各个第二最小生成树进行特征比对,其中进行特征比对的特征包括根节点、层数、每层节点数等,根据对比结果确定各个特征对应的特征相似度,并根据特征相似度确定第一最小生成树与各个第二最小生成树之间的相似度。

而后,在得到第一最小生成树与各个第二最小生成树之间的相似度之后,将各个相似度进行对比,得到各个相似度中的最大相似度,并在各个第二最小生成树中获取最大相似度对应的第二最小生成树最为目标最小生成树,而后将该目标最小生成树对应的目标备选基金作为目标基金的相似基金。

本实施例提出的基金相似度计算方法,通过获取目标基金所对应的分类信息以及最新持仓信息,基于所述最新持仓信息确定所述目标基金对应的最大权重行业,并基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金,接着确定目标基金对应的第一持仓产品之间的第一相关度,以及各个目标备选基金对应的第二持仓产品之间的第二相关度,而后获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树,然后将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度,确定各个相似度中的最大相似度对应的目标最小生成树,并将目标最小生成树对应的目标备选基金作为目标基金的相似基金,通过目标基金的持仓产品、最大权重行业以及目标备选基金持仓产品确定相似基金,使得相似基金与目标基金之间具有高度的行业相关性,通过基金的行业分类提高待筛选的基金之间的区分度,使得相似基金与目标基金更加接近,使得相似基金的未来走势与目标基金的未来走势更为接近,通过持仓产品之间的相关度对应的最小生成树确定相似度,提高基金之间相似度计算的准确性以及计算机的处理效率,提高了筛选相似基金的准确性。

基于第一实施例,提出本发明基金相似度计算方法的第二实施例,参照图3,在本实施例中,步骤s300包括:

步骤s310,基于第一相关度确定目标基金对应的第一相关度矩阵,并基于第二相关度确定各个目标备选基金对应的第二相关度矩阵;

步骤s320,基于最小生成树的克鲁斯卡尔算法,将第一相关度矩阵转换成第一最小生成树,并分别将各个第二相关度矩阵转换成的第二最小生成树。

本实施例中,在获取到于第一相关度以及第二相关度之后,确定第一相关度矩阵以及各个目标备选基金对应的第二相关度矩阵。具体地,采用矩阵存储第一相关度得到第一相关度矩阵,即将各个第一相关度存储至预设矩阵得到第一相关度矩阵,例如,第一相关度矩阵的各行依次为产品1对应的相关度、产品2对应的相关度……产品n对应的相关度,各列依次为产品1对应的相关度、产品2对应的相关度……产品n对应的相关度,则第一相关度矩阵的第一行的元素为产品1与产品1之间的相关度,产品1与产品2之间的相关度,产品1与产品3之间的相关度……产品1与产品n之间的相关度;同时,分别采用矩阵存储各个目标备选基金对应的第二相关度,将各个目标备选基金对应的第二相关度分别存储至预设矩阵,得到各个目标备选基金对应的第二相关度矩阵,其中,第二相关度矩阵的元素结构与第一相关度矩阵的元素结构类似。

而后,基于最小生成树的克鲁斯卡尔算法,将第一相关度矩阵转换成第一最小生成树,并分别将各个第二相关度矩阵转换成的第二最小生成树,以以通过最小生成树替代各个基金的持仓信息。具体地,将第一相关度矩阵输入克鲁斯卡尔(kruskal)算法,将kruskal算法的输出作为第一最小生成树,将第二相关度矩阵分别输入kruskal算法,将kruskal算法的输出作为第二最小生成树,例如,将第一相关度矩阵输入现有的kruskal算法对应的转换脚本,将转换脚本的输出为第一最小生成树。

本实施例提出的基金相似度计算方法,通过。基于第一相关度确定目标基金对应的第一相关度矩阵,并基于第二相关度确定各个目标备选基金对应的第二相关度矩阵;接着基于最小生成树的克鲁斯卡尔算法,将第一相关度矩阵转换成第一最小生成树,并分别将各个第二相关度矩阵转换成的第二最小生成树,通过将相关度转换为相关度矩阵并通过克鲁斯卡尔算法将相关度矩阵转换成最小生成树,以通过最小生成树替代各个基金的持仓信息,便于计算目标基金与目标备选基金之间的相似度,提高了基金相似度计算的效率以及准确性。

基于第一实施例,提出本发明基金相似度计算方法的第三实施例,参照图4,在本实施例中,步骤s400包括:

步骤s410,确定第一最小生成树的根节点与各个第二最小生成树的根节点之间的第一相似度,确定第一最小生成树的层数与各个第二最小生成树的层数之间的第二相似度,并确定第一最小生成树的每层节点数与各个第二最小生成树的每层节点数之间的第三相似度;

步骤s420,基于第一相似度、第二相似度以及第三相似度计算各个第二最小生成树对应的相似度。

本实施例中,在确定第一相似度时,可将第二最小生成树中根节点与第一最小生成树的根节点相同的生成树对应的第一相似度为第一预设值例如1,根节点不相同的生成树对应的第一相似度为第二预设值例如0,或者,计算各个第二最小生成树中根节点与第一最小生成树的根节点之间的根节点差值,将该根节点差值除以第一最小生成树的根节点,得到各个第二最小生成树对应的根节点比例,将各个根节点比例进行归一化得到各个第一相似度。

接着,确定第一最小生成树的层数与各个第二最小生成树的层数之间的第二相似度,具体地,可计算第一最小生成树的层数与各个第二最小生成树的层数之间的层数差值,将该层数差值除以第一最小生成树的层数得到层数比例,将1-层数比例作为第二相似度,该层数差值为绝对值。

而后,确定第一最小生成树的每层节点数与各个第二最小生成树的每层节点数之间的第三相似度,具体的,针对每一个第二最小生成树,先计算该第二最小生成树的各个层与对应的第一最小生成树各个层之间的节点偏差率,将各个层对应的节点偏差率的均值作为第三相似度,例如,对于每一层而言,先计算第一最小生成树中该目标层的节点数分别与第二最小生成树中该目标层的节点数之间的节点差值(绝对值),将节点差值除以该层第一最小生成树的节点数得到节点差比例,将1-节点差比例作为该目标层的节点偏差率。

最后,基于第一相似度、第二相似度以及第三相似度计算各个第二最小生成树对应的相似度,具体地,通过根节点、层数以及每层节点数对应的权重,以及第一相似度、第二相似度以及第三相似度计算各个第二最小生成树对应的相似度,例如,相似度=第一相似度*对应权重+第二相似度*对应权重+第三相似度*对应权重。

本实施例提出的基金相似度计算方法,通过确定第一最小生成树的根节点与各个第二最小生成树的根节点之间的第一相似度,确定第一最小生成树的层数与各个第二最小生成树的层数之间的第二相似度,并确定第一最小生成树的每层节点数与各个第二最小生成树的每层节点数之间的第三相似度;接着基于第一相似度、第二相似度以及第三相似度计算各个第二最小生成树对应的相似度,能够根据最小生成树准确得到目标基金与目标备选基金之间的相似度,提高了相似度计算的准确性,进而提高相似基金筛选的准确性,使得相似基金的未来走势与目标基金的未来走势更为接近。

基于第一实施例,提出本发明基金相似度计算方法的第四实施例,在本实施例中,步骤s200包括:

步骤s210,获取各个第一持仓产品对应的第一年度收益矢量,基于各个第一年度收益矢量确定各个第一持仓产品之间的第一相关度;

步骤s220,获取各个目标备选基金的第二持仓产品对应的第二年度收益矢量,基于各个第二年度收益矢量确定各个目标备选基金的第二持仓产品之间的第二相关度。

本实施例中,在获取到目标备选基金之后,获取各个第一持仓产品对应的第一年度收益矢量,基于各个第一年度收益矢量确定各个第一持仓产品之间的第一相关度,其中,该第一年度收益矢量为年度收益时间序列,年度收益时间序为一年的收益率时间序列,即一年内每一个交易日的收益率按照时间先后排序的序列,该年度收益时间序列对应的向量即为第一持仓产品对应的第一收益率时序矢量。而后,计算各个第一年度收益矢量之间的第一夹角余弦值,对第一夹角余弦值进行归一化,以将各个第一夹角余弦值映射到(0,1)内,例如基于(0,1)的范围对第一夹角余弦值进行归一化,得到各个第一夹角余弦值的第一映射值,将各个第一映射值作为对应的第一持仓产品两两之间的第一相关度。

同理,对于各个目标备选基金,获取各个目标备选基金的第二持仓产品对应的第二年度收益矢量,基于各个第二年度收益矢量确定各个目标备选基金的第二持仓产品之间的第二相关度;具体地,计算各个第二年度收益矢量之间的第二夹角余弦值,对第二夹角余弦值进行归一化,以将各个第二夹角余弦值映射到(0,1)内,例如基于(0,1)的范围对第二夹角余弦值进行归一化,得到各个第二夹角余弦值的第二映射值,将各个第二映射值作为对应的第二持仓产品两两之间的第二相关度,进而得到目标备选基金的第二相关度。

进一步地,一实施例中,步骤s220包括:确定各个第一年度收益矢量中两两之间的夹角余弦值,并基于所述夹角余弦值确定各个第一持仓产品之间的第一相关度。

本实施例提出的基金相似度计算方法,通过获取各个第一持仓产品对应的第一年度收益矢量,基于各个第一年度收益矢量确定各个第一持仓产品之间的第一相关度;接着获取各个目标备选基金的第二持仓产品对应的第二年度收益矢量,基于各个第二年度收益矢量确定各个目标备选基金的第二持仓产品之间的第二相关度,能够根据目标基金的持仓产品以及目标备选基金持仓产品准确得到第一相关度以及第二相关度,通过持仓产品使得得到的相似基金的未来走势与目标基金的未来走势更加接近,提高了筛选相似基金的准确性。

基于上述实施例,提出本发明基金相似度计算方法的第五实施例,在本实施例中,步骤s100包括:

步骤s110,根据最新持仓信息获取所述第一持仓产品的持仓比;

步骤s120,基于所述第一持仓产品的持仓比确定所述目标基金对应的各个行业的行业持仓比,并将所述行业持仓比中的最大行业持仓比对应的行业作为所述最大权重行业;

步骤s130,获取与所述分类信息匹配的备选基金,并基于所述备选基金以及最大权重行业确定预设数量的目标备选基金。

本实施例中,根据最新持仓信息获取该目标基金的所有第一持仓产品,该第一持仓产品包括股票、债券、基金等,并确定各个第一持仓产品对应的行业以及目标基金中所述第一持仓产品的持仓比。然后,根据目标基金的最新持仓信息,按目标基金所持有的第一持仓产品所在行业映射到目标基金所处行业,即根据各个第一持仓产品确定该目标基金所对应的所有行业(即各个持仓产品所对应的行业),并根据所述第一持仓产品的持仓比确定各个行业对应的行业持仓比,针对每一个行业,该行业持仓比为属于该行业持仓产品的持仓比之和。而后,确定各个行业持仓比中的最大行业持仓比,并将最大行业持仓比对应的行业作为最大权重行业。

而后,获取与所述分类信息匹配的备选基金,并基于所述备选基金以及最大权重行业确定预设数量的目标备选基金。

本实施例提出的基金相似度计算方法,通过根据最新持仓信息获取所述第一持仓产品的持仓比;接着基于所述第一持仓产品的持仓比确定所述目标基金对应的各个行业的行业持仓比,并将所述行业持仓比中的最大行业持仓比对应的行业作为所述最大权重行业;而后获取与所述分类信息匹配的备选基金,并基于所述备选基金以及最大权重行业确定预设数量的目标备选基金,通过根据目标基金的持仓产品准确筛选目标备选基金,提高目标备选基金与目标基金之间的相关性,进而提升相似基金筛选的准确性。

基于第五实施例,提出本发明基金相似度计算方法的第六实施例,在本实施例中,步骤s130包括:

步骤s131,获取各个备选基金对应的最大比例行业,确定备选基金中最大比例行业与最大权重行业一致的待筛选基金;

步骤s132,根据待筛选基金对应的第一持仓产品以及目标基金对应的第二持仓产品,确定各个待筛选基金与目标基金之间的各个概念暴露列表重合度,并将待筛选基金中概念暴露列表重合度最大的预设数量的基金作为目标备选基金。

本实施例中,获取各个备选基金对应的最大比例行业,具体地,根据各个备选基金的最新持仓信息,按备选基金所持有的第二持仓产品所在行业映射到备选基金所处行业,即根据备选基金的各个第二持仓产品确定该备选基金所对应的所有行业(即各个第二持仓产品所对应的行业),并根据所述第二持仓产品的持仓比确定备选基金的各个行业对应的行业持仓比。确定备选基金的各个行业对应的行业持仓比中的最大行业持仓比,并将备选基金的最大行业持仓比对应的行业作为最大比例行业。而后,确定备选基金中最大比例行业与最大权重行业一致的待筛选基金。

而后,根据待筛选基金对应的第一持仓产品以及目标基金对应的第二持仓产品,确定各个待筛选基金与目标基金之间的各个概念暴露列表重合度,例如,可将待筛选基金与目标基金一致的持仓产品的数量除以目标基金对应的第一持仓产品的数量得到概念暴露列表重合度,并将待筛选基金中概念暴露列表重合度最大的预设数量的基金作为目标备选基金。

本实施例提出的基金相似度计算方法,通过获取各个备选基金对应的最大比例行业,确定备选基金中最大比例行业与最大权重行业一致的待筛选基金;接着根据待筛选基金对应的第一持仓产品以及目标基金对应的第二持仓产品,确定各个待筛选基金与目标基金之间的各个概念暴露列表重合度,并将待筛选基金中概念暴露列表重合度最大的预设数量的基金作为目标备选基金,通过最大比例行业以及概念暴露列表重合度筛选目标备选基金,提高目标备选基金与目标基金之间的相关性,进而提升相似基金筛选的准确性。

参照图5,图5为本发明基金相似度计算平台一实施例的功能模块示意图。

本实施例中,基金相似度计算平台包括:

第一获取模块10,用于获取目标基金所对应的分类信息以及最新持仓信息,基于所述最新持仓信息确定所述目标基金对应的最大权重行业,并基于所述分类信息以及最大权重行业,确定预设数量的目标备选基金;

第一确定模块20,用于确定目标基金对应的第一持仓产品之间的第一相关度,以及各个目标备选基金对应的第二持仓产品之间的第二相关度,其中,所述第一相关度为表征所述目标基金持仓产品年度收益的关联度,所述第二相关度为目标备选基金的持仓产品年度收益的关联度;

第二获取模块30,用于获取第一相关度对应的第一最小生成树,以及第二相关度对应的第二最小生成树;

第二确定模块40,用于将第一最小生成树与各个第二最小生成树进行特征比对,以确定第一最小生成树与各个第二最小生成树之间的相似度,确定各个相似度中的最大相似度对应的目标最小生成树,并将目标最小生成树对应的目标备选基金作为目标基金的相似基金。

进一步地,第二获取模块30,还用于:

基于第一相关度确定目标基金对应的第一相关度矩阵,并基于第二相关度确定各个目标备选基金对应的第二相关度矩阵;

基于最小生成树的克鲁斯卡尔算法,将第一相关度矩阵转换成第一最小生成树,并分别将各个第二相关度矩阵转换成的第二最小生成树。

进一步地,第二确定模块40,还用于:

确定第一最小生成树的根节点与各个第二最小生成树的根节点之间的第一相似度,确定第一最小生成树的层数与各个第二最小生成树的层数之间的第二相似度,并确定第一最小生成树的每层节点数与各个第二最小生成树的每层节点数之间的第三相似度;

基于第一相似度、第二相似度以及第三相似度计算各个第二最小生成树对应的相似度。

进一步地,第一确定模块20,还用于:

获取各个第一持仓产品对应的第一年度收益矢量,基于各个第一年度收益矢量确定各个第一持仓产品之间的第一相关度;

获取各个目标备选基金的第二持仓产品对应的第二年度收益矢量,基于各个第二年度收益矢量确定各个目标备选基金的第二持仓产品之间的第二相关度。

进一步地,第一确定模块20,还用于:

确定各个第一年度收益矢量中两两之间的夹角余弦值,并基于所述夹角余弦值确定各个第一持仓产品之间的第一相关度。

进一步地,第一获取模块10,还用于:

根据最新持仓信息获取所述第一持仓产品的持仓比;

基于所述第一持仓产品的持仓比确定所述目标基金对应的各个行业的行业持仓比,并将所述行业持仓比中的最大行业持仓比对应的行业作为所述最大权重行业;

获取与所述分类信息匹配的备选基金,并基于所述备选基金以及最大权重行业确定预设数量的目标备选基金。

进一步地,第一获取模块10,还用于:

获取各个备选基金对应的最大比例行业,确定备选基金中最大比例行业与最大权重行业一致的待筛选基金;

根据待筛选基金对应的第一持仓产品以及目标基金对应的第二持仓产品,确定各个待筛选基金与目标基金之间的各个概念暴露列表重合度,并将待筛选基金中概念暴露列表重合度最大的预设数量的基金作为目标备选基金。

需要说明的是,基金相似度计算平台的各个实施例与上述基金相似度计算方法的各实施例基本相同,在此不再详细赘述。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基金相似度计算程序,所述基金相似度计算程序被处理器执行时实现如上述中任一项所述的基金相似度计算方法的步骤。

本发明计算机可读存储介质具体实施例与上述基金相似度计算方法的各实施例基本相同,在此不再详细赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1