一种基金经理语调文本分析方法及装置与流程

文档序号:23155759发布日期:2020-12-04 13:50阅读:173来源:国知局
一种基金经理语调文本分析方法及装置与流程

本申请涉及语调与文本分析技术领域,具体而言,涉及一种基金经理语调文本分析方法及装置。



背景技术:

目前,对基金经理的语调文本进行分析在基金投资中尤为重要。基金经理语调分析与评价有助于投资者进行基金、基金经理的分析,进行具体的基金投资操作实践。

针对相关技术中未建立基金经理语调文本分析方法,造成投资人无法通过基金经理的非量化数据与信息,对基金产品进行评价分析与投资的问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请的主要目的在于提供一种基金经理语调文本分析方法及装置,以解决相关技术中未建立基金经理语调文本分析方法,造成投资人无法通过基金经理的非量化数据与信息,对基金产品进行评价分析与投资的问题。

为了实现上述目的,第一方面,本申请提供了一种基金经理语调文本分析方法,步骤包括:

在样本期内,针对某个基金经理,选择该基金经理发表过的文本作为待分析文本对象;

对待分析文本对象进行分词;

对分词后的待分析文本对象进行筛选;

对筛选后的待分析文本进行词频统计,形成各种词云图;

针对某个基金经理,构建所述基金经理语调积极性与消极性指标;

计算样本期内,所有基金经理语调积极性与消极性指标;

将样本期内所有基金经理的语调积极性与消极性指标加总求平均,得到待分析文本对象的基金经理语调总体指标;

将样本期内待分析文本对象的基金经理语调总体指标与股票指数,按照时间先后顺序绘制一幅随时间变动的趋势图。

所述对待分析文本对象使用python软件jieba模块进行分词,分词结果至少包括:动词、形容词、副词、名词、数量词、标点符号、字母、连词、代词。

所述对分词后的待分析文本对象进行筛选,包括:

根据所有文本的分词结果,滤掉不具有信息含量的累赘词汇,包括:标点符号、人称代词、连接词;

根据词性过滤,去除本文语调分析不相关的词性,包括:去除词性标注为英文、数字、标点符号、人名、地名、方位词、量词、时间词;

挑选出词性为形容词、名词、动词。

所述各种词云图包括:形容词词云图、名词词云图、动词词云图。频率越高,词云图中的字越大。

所述构建基金经理语调积极性与消极性指标,包括:

构建代表基金经理积极与消极的词汇字典;

依据所述词汇字典构建基金经理语调积极性与消极性指标,公式如下:

其中,posi,t表示在第t个样本期内第i个基金经理的正面语调的词汇计数,negi,t表示在第t个样本期内第i个基金经理的负面语调词汇计数,tonei,t表示在第t个样本期内第i个基金经理的净正面语调。

所述构建代表基金经理积极与消极的词汇字典,包括:

选择代表基金经理积极与消极的词汇构建字典,在构建字母中选择的词汇,至少在1%的待分析文本对象中出现过的词汇。所述字典包含若干积极词汇,若干消极词汇。

所述基金经理语调积极性与消极性指标取值范围在[-1,1]之间。

所述趋势图的横坐标为时间,纵坐标为基金经理语调总体指标与股票指数。

第二方面,本申请还提供了一种基金经理语调文本分析装置,采用所述的一种基金经理语调文本分析方法实现,装置包括:文本选择模块、文本分词模块、筛选模块、词云图模块、指标构建模块、计算模块、总体指标模块以及趋势图绘制模块;

所述文本选择模块、文本分词模块、筛选模块、词云图模块、指标构建模块、计算模块、总体指标模块以及趋势图绘制模块,依次顺序连接;

所述文本选择模块:用于在样本期内,针对某个基金经理,选择该基金经理发表过的文本作为待分析文本对象;

所述文本分词模块,用于对待分析文本对象进行分词;

所述筛选模块,用于对分词后的待分析文本对象进行筛选;

所述词云图模块,用于对筛选后的文本进行词频统计,形成各种词云图;

所述指标构建模块,用于针对某个基金经理,构建所述基金经理语调积极性与消极性指标;

所述计算模块,用于计算样本期内,所有基金经理语调积极性与消极性指标;

所述总体指标模块,用于将样本期内所有基金经理的语调积极性与消极性指标加总求平均,得到待分析文本对象的基金经理语调总体指标,即基金经理语调积极性指数;

所述趋势图绘制模块,用于将样本期内的待分析文本对象的基金经理语调总体指标与股票指数,按照时间先后顺序绘制一幅随时间变动的趋势图。

有益技术效果:

本申请是通过基金产品定期披露的规范化文本信息,运用文本分析技术直接定性与定量分析基金经理的心理与行为,有利于投资者对基金经理的语调积极性与消极性进行分析与评价,更好地进行基金投资决策。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例提供的一种基金经理语调文本分析方法流程图;

图2是根据本申请实施例提供的一种基金经理语调文本分析方法的趋势图;

图3是根据本申请实施例提供的动词词云图;

图4是根据本申请实施例提供的形容词词云图;

图5是根据本申请实施例提供的基金经理语调文本分析装置连接图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。

并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。

另外,术语“多个”的含义应为两个以及两个以上。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

第一方面,本申请提供了一种基金经理语调文本分析方法,如图1所示,步骤包括:

步骤s1:在样本期内,针对某个基金经理,选择该基金经理发表过的文本作为待分析文本对象;本实施例选择基金披露规范的半年报与年报中的“管理人对宏观经济、证券市场及行业走势的简要展望”内容作为文本分析的基础。所述样本期可以为一年或者半年。

步骤s2:对待分析文本对象进行分词;

步骤s3:对分词后的待分析文本对象进行筛选;

步骤s4:对筛选后的待分析文本进行词频统计,形成各种词云图;

步骤s5:针对某个基金经理,构建所述基金经理语调积极性与消极性指标;

步骤s6:计算样本期内,所有基金经理语调积极性与消极性指标;

步骤s7:将样本期内所有基金经理的语调积极性与消极性指标加总求平均,得到待分析文本对象的基金经理语调总体指标,即基金经理语调积极性指数(fundmanagertoneindex,fmti);

步骤s8:将样本期内待分析文本对象的基金经理语调总体指标与股票指数,按照时间先后顺序绘制一幅随时间变动的趋势图,如图2所示,其中横坐标代表时间,左边纵坐标代表语调指数,右边纵坐标代表股票收益率百分比。

所述对待分析文本对象使用python软件jieba模块进行分词,分词结果至少包括:动词、形容词、副词、名词、数量词、标点符号、字母、连词、代词。

所述对分词后的待分析文本对象进行筛选,包括:

根据所有文本的分词结果,滤掉不具有信息含量的累赘词汇,包括:标点符号、人称代词、连接词;

根据词性过滤,去除本文语调分析不相关的词性,包括:去除词性标注为英文、数字、标点符号、人名、地名、方位词、量词、时间词;

挑选出词性为形容词、名词、动词、短语。

所述各种词云图包括:形容词词云图、名词词云图、动词词云图。频率越高,词云图中的字越大。本实施例构建的字典词汇出现频率排名前150的词汇的词云图,如图3、图4所示。

所述构建基金经理语调积极性与消极性指标,包括:

构建代表基金经理积极与消极的词汇字典;

依据所述词汇字典构建基金经理语调积极性与消极性指标,公式如下:

其中,posi,t表示在第t个样本期内第i个基金经理的正面语调的词汇计数,negi,t表示在第t个样本期内第i个基金经理的负面语调词汇计数,tonei,t表示在第t个样本期内第i个基金经理的净正面语调。该值越大,表明基金经理对未来情势的判断越积极。所述基金经理语调积极性与消极性指标取值范围在[-1,1]之间。

所述构建代表基金经理积极与消极的词汇字典,包括:

选择代表基金经理积极与消极的词汇构建字典,在构建字母中选择的词汇,至少在1%的文本样本中出现过的词汇,避免出现由于基金经理个人风格导致的用词生僻问题。首先对这些词语进行人工阅读,按照汉语用语习惯,挑选出具有代表性的积极与消极词汇,构成字典所述字典包含若干(大于100个)积极词汇,若干(大于100个)消极词汇。

第二方面,本申请还提供了一种基金经理语调文本分析装置,采用所述的一种基金经理语调文本分析方法实现,装置包括:文本选择模块、文本分词模块、筛选模块、词云图模块、指标构建模块、计算模块、总体指标模块以及趋势图绘制模块;

所述文本选择模块、文本分词模块、筛选模块、词云图模块、指标构建模块、计算模块、总体指标模块以及趋势图绘制模块,依次顺序连接,如图5所示;

所述文本选择模块:用于在样本期内,针对某个基金经理,选择该基金经理发表过的文本作为待分析文本对象;

所述文本分词模块,用于对待分析文本对象进行分词;

所述筛选模块,用于对分词后的待分析文本对象进行筛选;

所述词云图模块,用于对筛选后的文本进行词频统计,形成各种词云图;

所述指标构建模块,用于针对某个基金经理,构建所述基金经理语调积极性与消极性指标;

所述计算模块,用于计算样本期内,所有基金经理语调积极性与消极性指标;

所述总体指标模块,用于将样本期内所有基金经理的语调积极性与消极性指标加总求平均,得到待分析文本对象的基金经理语调总体指标,即基金经理语调积极性指数;

所述趋势图绘制模块,用于将样本期内的待分析文本对象的基金经理语调总体指标与股票指数,按照时间先后顺序绘制一幅随时间变动的趋势图。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1