本发明属于中文信息处理,特别是关于一种基于全局相关性视图的投资观点量化分析方法、装置、存储介质和计算机设备。
背景技术:
1、券商研究报告包括证券公司研究员以事实、数据、调研信息为依据,对宏观经济、特定行业和具体公司做出的投资分析和推理逻辑。个股研报是针对单只股票的研究报告,虽然国内个股研报建议的“买入/增持”存在一定水分,但依然是投资者了解投资标的价值的第一手材料,其针对单只股票的投资逻辑和分析数据是投资者重点关注的内容。整个a股市场有几千支股票,个股研报的数量足够多,使得有效发挥ai(artificial intelligence,人工智能)的大数据分析能力成为可能。
2、国内东方财富等多个研报平台,每天均会上线上百篇点评和分析个股的研报,发布各种付费脱水研报,实时推送各种投资信息,这些资料虽然丰富了投资逻辑和投资机会,但对投研人员尤其是分析师而言却增加了获取有效投研信息的难度,分析师即使阅读了很多研报,也很难找出契合自己投资观点和投资逻辑的内容。例如,投资者可能非常关注新发布的深度报告,其点评的公司长期被市场遗忘,有可能会成为市场黑马,但是这类研报的出现频率较低,很容易被淹没在大量研报之中,不易被分析师、投资者发现。
3、目前投研平台广泛应用知识图谱技术,将证券实体、高管、产品、公司、产业等关联为一个逻辑传导链条,解读这些传导因素的逻辑即投资观点以及投资依据,最简单、有效的策略依然是从研报中搜集和整理。判断一篇研报的推理逻辑是否得到了大多数分析师认可,需要全局梳理关联该投资逻辑的个股研报,如“比亚迪业绩超预期”,在近期许多研报中就能找到类似观点和合适的支撑论据,由于投资逻辑多以文字论述、数据说明等非结构化形式呈现,因此,在大量研报中识别公认可信的投资观点依然具有挑战性。bert(bidirectional encoder representation from transformers,即双向transformer的encoder)模型、gpt(generative pre-training,即生成式预训练)模型、roformer等nlp(natural language processing,即自然语言处理)预训练模型虽然能辅助识别语义相似的论述,但是不能较准确地关联投资观点和论据。
技术实现思路
1、本发明的目的在于准确地关联投资观点和论据,为此提供一种基于全局相关性视图的投资观点量化分析方法,包括以下步骤:针对投资标的构建投资观点-论据样本集;训练金融语义模型,并对金融语义模型进行评估、调优;基于投资观点向量和论据向量,构建投资观点-论据的全局相关性视图;基于全局相关性视图,计算所有投资观点的权重。
2、进一步地,针对投资标的构建投资观点-论据样本集,包括以下步骤:锁定投资标的,收集针对单只股票的个股研报;在个股研报中提取投资观点-论据样本对,构建投资观点-论据样本集。
3、进一步地,训练金融语义模型,并对金融语义模型进行评估、调优,包括以下步骤:收集财经语料,训练金融语义模型;随机抽样投资观点-论据样本集,评估金融语义模型;金融语义模型评估未通过时,对金融语义模型进行调优。
4、进一步地,基于投资观点向量和论据向量,构建投资观点-论据的全局相关性视图,包括以下步骤:基于金融语义模型,计算投资观点向量和论据向量;构建投资观点节点和论据节点,作为全局相关性视图的顶点,并以计算获得的投资观点向量和论据向量作为全局相关性视图的顶点的属性向量;对每个投资观点-论据对,使用余弦相似度计算顶点的属性向量的相关度,该相关度大于0.85时建立关联边。
5、进一步地,基于全局相关性视图,计算所有投资观点的权重,包括以下步骤:计算每个投资观点顶点的初始权重,累加每个投资观点顶点获得的权重贡献,并进行全局归一化处理。
6、进一步地,随机抽样投资观点-论据样本集,评估金融语义模型,包括以下步骤:随机从投资观点-论据样本集中抽取评估数据,抽样比例为20%;对每个抽样样本,计算投资观点向量和论据向量的余弦相似度;统计余弦相似度大于0.85的样本在所有抽样样本中的占比。
7、进一步地,投资观点顶点和论据顶点之间为多对多关系。
8、本发明还提供一种基于全局相关性视图的投资观点量化分析装置,其包括:第一构建单元,用于针对投资标的构建投资观点-论据样本集;训练和评估、调优单元,用于训练金融语义模型,并对金融语义模型进行评估、调优;第二构建单元,用于基于投资观点向量和论据向量,构建投资观点-论据的全局相关性视图;计算单元,用于基于全局相关性视图,计算所有投资观点的权重。
9、本发明进一步提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现基于全局相关性视图的投资观点量化分析方法。
10、本发明进一步提供一种计算机设备,其包括存储器、处理器和存储在存储器中的计算机程序,该计算机程序被处理器执行时实现基于全局相关性视图的投资观点量化分析方法。
11、与现有技术相比,本发明的基于全局相关性视图的投资观点量化分析方法,针对投资标的,从其个股研报获取投资观点和论据,再用训练后的金融语义模型计算投资观点向量和论据向量,进而构建投资观点-论据的全局相关性视图,并基于全局相关性视图计算所有投资观点的权重,使得不同个股研报针对投资标的提出的投资观点均能得到直观地汇聚展现,从而投研人员可根据全局相关性视图快速定位自己关注的投资观点背后的论据、投资逻辑,有助于投研人员更好地发掘投资依据。
1.一种基于全局相关性视图的投资观点量化分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于全局相关性视图的投资观点量化分析方法,其特征在于,所述针对投资标的构建投资观点-论据样本集,包括以下步骤:
3.根据权利要求1所述的基于全局相关性视图的投资观点量化分析方法,其特征在于,所述训练金融语义模型,并对金融语义模型进行评估、调优,包括以下步骤:
4.根据权利要求1所述的基于全局相关性视图的投资观点量化分析方法,其特征在于,所述基于投资观点向量和论据向量,构建投资观点-论据的全局相关性视图,包括以下步骤:
5.根据权利要求1所述的基于全局相关性视图的投资观点量化分析方法,其特征在于,所述基于全局相关性视图,计算所有投资观点的权重,包括以下步骤:计算每个所述投资观点顶点的初始权重,累加每个所述投资观点顶点获得的权重贡献,并进行全局归一化处理。
6.根据权利要求3所述的基于全局相关性视图的投资观点量化分析方法,其特征在于,所述随机抽样投资观点-论据样本集,评估金融语义模型,包括以下步骤:
7.根据权利要求4所述的基于全局相关性视图的投资观点量化分析方法,其特征在于,所述投资观点顶点和所述论据顶点之间为多对多关系。
8.一种基于全局相关性视图的投资观点量化分析装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的基于全局相关性视图的投资观点量化分析方法。
10.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器和存储在所述存储器中的计算机程序,所述计算机程序被所述处理器执行时实现权利要求1至7任一项所述的基于全局相关性视图的投资观点量化分析方法。