一种投资方的推荐方法与流程

文档序号:18744949发布日期:2019-09-21 02:13阅读:187来源:国知局
一种投资方的推荐方法与流程

本发明涉及计算机技术领域,具体涉及一种投资方的推荐方法。



背景技术:

当今互联网迅猛发展,用户进入了信息爆炸的时代,海量信息的呈现使人们很难发现有用信息、做出正确决策。

推荐系统是解决信息过载问题的有效工具。在电影、图书、音乐等商品或服务领域,推荐系统已经发挥了重要作用,为用户提供了较为准确的个性化推荐,而在金融投资领域,推荐问题却鲜有涉及。

相较于商品或服务的购买或使用数据来说,金融投资领域中的投资关系更为稀疏,现有技术提供的推荐算法通常只适用于商品或者服务的推荐,而不适用于金融投资领域中的投资推荐,因而现有技术提供的推荐模型和算法难以达到较高的推荐准确率。

而对于寻找投资的初创公司,尤其是大部分从未获得投资的公司来说,由于经验不足,往往需要花费大量时间和精力来寻找可能对其领域感兴趣的投资方。实现对这类公司的推荐在推荐系统研究中被称为冷启动问题,即在目标对象历史被投资情况未知的情况下,很难应用传统的推荐方法为其实现个性化推荐。

因此,急需针对初创公司的投资方推荐方法,以克服传统的推荐算法存在的推荐准确率低的问题。



技术实现要素:

本发明的目的在于提供一种投资方的推荐方法,用于提高针对初创公司推荐投资方的准确率。

为了达到上述目的,本发明采用这样的如下技术方案:

本发明提供一种投资方的推荐方法,包括:

从历史投资数据库中获取历史投资事件信息和标签信息,所述历史投资事件信息用于指示M个投资方中的第x个投资方和N个被投资方中的第i个被投资方之间的历史投资关系,所述标签信息包括所述N个被投资方分别对应的标签,所述N个被投资方中的每个被投资方包含至少一个标签,所述M、所述N、所述x和所述i表示正整数,且所述x小于或等于所述M,所述i小于或等于所述N;

根据所述历史投资事件信息和所述标签信息生成投资网络,所述投资网络包括:M个投资方节点、N个被投资方节点、P个标签节点、投资方节点与被投资方节点之间的第一类型连边、和投资方节点与标签节点之间的第二类型连边;其中,所述M个投资方节点与所述M个投资方一一对应,所述N个被投资方节点与所述N个被投资方一一对应,所述P个标签节点与所述N个被投资方对应的所有不相同标签一一对应,所述第一类型连边指示第x个投资方节点与第i个被投资方节点之间建立有投资关系,所述第二类型连边指示第x个投资方节点与第i个被投资方节点所包括的标签对应的标签节点之间建立有投资关系;

多次迭代执行如下的扩散过程,所述扩散过程包括:将所述投资网络中的第一类型节点在当前扩散步骤中得到的分值分配给与所述第一类型节点相连接的第一邻居节点,所述第一邻居节点将得到的分值用于下一扩散步骤中,所述投资网络中待提供推荐的目标公司所包括的所有标签对应的标签节点在所述扩散过程中具有初始分值,所述投资网络中的所述M个投资方节点、所述N个被投资方节点、所述P个标签节点除所述目标公司所包括的所有标签对应的标签节点以外的其它标签节点在所述扩散过程中不具有初始分值;其中,当所述第一类型节点为所述标签节点时,所述第一邻居节点包括:通过所述第二类型连边与所述标签节点连接的投资方节点;当所述第一类型节点为所述投资方节点时,所述第一邻居节点包括:通过所述第二类型连边与所述投资方节点连接的标签节点,以及通过所述第一类型连边与所述投资方节点连接的被投资方节点;当所述第一类型节点为所述被投资方节点和所述标签节点时,所述第一邻居节点包括:通过所述第一类型连边与所述被投资方节点连接的投资方节点,以及通过所述第二类型连边与所述标签节点连接的投资方节点;

确定所述扩散过程的已执行扩散步骤是否已经达到预先确定出的最优扩散步数,并在所述已执行扩散步骤已经达到所述最优扩散步数时,结束所述扩散过程;

获取在所述扩散过程结束时所述投资网络中的M个投资方节点分别具有的最终分值,将所述M个投资方节点按照分别具有的最终分值从大到小排序,根据排序结果向所述目标公司推荐至少一个投资方节点。

采用上述技术方案后,本发明提供的技术方案将有如下优点:

在本申请实施例中生成了投资网络,该投资网络包括:M个投资方节点、N个被投资方节点、P个标签节点、投资方节点与被投资方节点之间的第一类型连边、和投资方节点与标签节点之间的第二类型连边。本发明实施例中还可以多次迭代执行扩散过程,使得标签节点在扩散过程中具有的初始分值能够在投资网络中不断被扩散,因为投资网络中的三部分节点的连边是根据真实联系连接的,投资方节点连着投资过的被投资方节点(即被投资公司,简称公司)以及投资过的标签节点。因此,分值顺着连边扩散,就会把有间接联系的节点都扩散到。比如,初始分值在目标公司所含的标签节点上,在第一步扩散中,投资过这些标签的投资方节点都会收到一定的分值,投资过这些标签越多的投资方就会收到越多的分值。然后这些投资方节点再把分值扩散给公司节点和标签节点,获得分值的公司节点即为投资过目标公司所含标签的投资方投资过的公司,获得分值的标签节点即为投资过目标公司所含标签的投资方投资过的标签。也就是说,直接与间接和这些标签产生关系的投资方节点、公司节点、标签节点都会相继收到分值,然后这些分值会集中在投资方节点集合中。因此这种弱关系通过扩散不断加强,最终反映在投资方节点的分值中,这个分值越大,就说明该投资方与目标公司的关系越强,投资方和目标公司之间产生投资关系的可能性越大,即将分值高的投资方推荐给目标公司。因此可以提高针对初创公司推荐投资方的准确率。

附图说明

图1为本发明实施例提供一种投资方的推荐方法的流程方框示意图;

图2为本发明实施例提供的投资网络的组成结构示意图;

图3为本发明实施例提供的投资网络内的节点之间连接关系示意图;

图4a为本发明实施例提供的投资网络内的初始分值设置的示意图;

图4b为本发明实施例提供的投资网络内的第一步扩散的示意图;

图4c为本发明实施例提供的投资网络内的第二步扩散的示意图;

图4d为本发明实施例提供的投资网络内的第三步扩散的示意图。

具体实施方式

本发明实施例提供了一种投资方的推荐方法,用于提高针对初创公司推荐投资方的准确率。

以下分别进行详细说明。

本发明投资方的推荐方法的一个实施例,可应用于向初创公司推荐与该初创公司匹配度高的投资方。在本发明的后续实施例中,投资方节点可简称为投资方,被投资方节点可以简称为被投资公司(或者简称为公司),待推荐的目标被投资方节点可以简称为目标公司。本发明实施例中通过后续描述的扩散过程,可以将投资方与目标公司的关系强弱、产生投资关系的可能性大小通过投资方获得的分值体现出来,最终将分值高的投资方推荐给目标公司。因此可以提高针对初创公司推荐投资方的准确率。

请参阅图1所示,本发明提供的投资方的推荐方法,可以包括如下步骤:

10、从历史投资数据库中获取历史投资事件信息和标签信息,历史投资事件信息用于指示M个投资方中的第x个投资方和N个被投资方中的第i个被投资方之间的历史投资关系。标签信息包括N个被投资方分别对应的标签,N个被投资方中的每个被投资方包含至少一个标签,M、N、x和i表示正整数,且x小于或等于M,i小于或等于N。

本发明实施例中预先配置历史投资数据库,在该历史投资数据库中存储历史投资事件信息和标签信息,因此可以从该历史投资数据库中获取到历史投资事件信息和标签信息。本发明实施例中历史投资事件信息也可以称为历史投资关系数据,以指示M个投资方中的第x个投资方和N个被投资方中的第i个被投资方之间的历史投资关系。M和N的取值可以根据具体场景来确定。标签信息用于指示N个被投资方分别对应的标签,每个被投资方包含至少一个标签,对于标签的内容组成部分,此处不做限定。另外,不限定的是,本发明实施例中M、N、x和i都表示正整数,且x小于或等于M,i小于或等于N。

在本发明的一些实施例中,历史投资事件信息包括:第x个投资方的标识、第i个被投资方的标识、投资记录数据。

举例说明如下,获取一段时间内的历史投资关系数据,包括所有投资事件信息以及被投资公司的标签信息。其中,投资事件信息包含该事件涉及的投资方和被投资公司、投资时间、投资金额、股权占比等信息,例如格式可以为投资方ID,被投资公司ID,投资时间,投资金额,股权占比等其他投资信息,该类信息可从投资数据提供商来获取,例如可以从IT桔子、CVSource投中数据、清科数据等投资数据提供商处获取,一些投资方或公司也会公开其近期投资情况。

本发明实施例中,标签由一些关键词构成,例如标签的格式可以为公司ID:标签1,标签2,……标签n。标签反映了公司的行业领域和主营业务,公司的标签可从以上数据服务商等渠道搜索查询获得,也可以自行构建标签库,根据公司的基本介绍、产品信息、商业行为、新闻动态以及公众评价等内容提取关键信息,为其设置标签。

20、根据历史投资事件信息和标签信息生成投资网络,投资网络包括:M个投资方节点、N个被投资方节点、P个标签节点、投资方节点与被投资方节点之间的第一类型连边、和投资方节点与标签节点之间的第二类型连边。

其中,M个投资方节点与M个投资方一一对应,N个被投资方节点与N个被投资方一一对应,P个标签节点与N个被投资方对应的所有不相同标签一一对应,第一类型连边指示第x个投资方节点与第i个被投资方节点之间建立有投资关系,第二类型连边指示第x个投资方节点与第i个被投资方节点所包括的标签对应的标签节点之间建立有投资关系。

在本发明的一些实施例中,在获取到历史投资事件信息和标签信息之后,可以根据该历史投资事件信息和标签信息中记录的数据内容提取出投资方、被投资公司、标签等信息,以每个投资方对应网络中的一个节点,以每个被投资公司对应网络中的一个节点,以每个标签对应网络中的一个节点。

如图2所示,为投资网络的一种示例结构。若确定出M个投资方节点、N个被投资方节点、P个标签节点,则以M个投资方节点、N个被投资方节点、P个标签节点来生成投资网络,投资网络内除了包括上述三种节点,还包括节点之间的连接关系。具体的,M个投资方节点位于投资网络中的中间一列,N个被投资方节点、P个标签节点分别位于M个投资方节点两边。例如,N个被投资方节点位于M个投资方节点的左侧,P个标签节点位于M个投资方节点的右侧。在投资网络中除了包括上述三种节点,还包括投资方节点与被投资方节点之间的第一类型连边、和投资方节点与标签节点之间的第二类型连边,具体哪些投资方节点和哪些被投资方节点之间建立有连边,哪些投资方节点与哪些标签节点之间建立有连边,具体需要根据从历史投资数据库中提取到的数据来确定。

在本发明实施例中,图2中以虚线来示意说明本发明实施例中的两种类型连边。其中,第一类型连边指示第x个投资方节点与第i个被投资方节点之间建立有投资关系,第二类型连边指示第x个投资方节点与第i个被投资方节点所包括的标签对应的标签节点之间建立有投资关系。例如,第一类型连边指的是投资方节点和被投资方节点的投资关系,若投资方节点和被投资方节点存在投资关系,则在投资网络的两个节点之间建立第一类型连边,若投资方节点和被投资方节点不存在投资关系,则在投资网络的两个节点之间不建立第一类型连边。同理的,第二类型连边指示投资方节点与标签节点之间建立有投资关系,若投资方节点投资过含某标签的公司,则在投资网络的两个节点之间建立第二类型连边,若投资方节点没有投资过含某个标签的公司,则在投资网络的两个节点之间不建立第二类型连边。

在本申请的一些实施例中,历史投资事件信息包括:第x个投资方的标识、第i个被投资方的标识、投资记录数据;

第i个被投资方节点包括的至少一个标签用于反映第i个被投资方的行业领域和主营业务。

其中,标签反应的是相应被投资方节点的行业领域和主营业务。比如,某公司标签为:旅游,旅游综合服务,酒店,签证服务,出行票务等。

在本申请的一些实施例中,步骤20根据历史投资事件信息和标签信息生成投资网络之后,本申请实施例提供的方法还包括如下步骤:

根据投资方节点与被投资方节点之间的投资记录数据确定第一类型连边的权重;

根据投资方节点与被投资方节点之间的投资关系、被投资方节点与标签之间的所属关系、投资方节点与被投资方节点之间的投资记录数据确定第二类型连边的权重。

其中,投资记录数据可以包括投资金额,股权占比等其他投资信息,依据该投资方节点与被投资方节点之间的投资记录数据确定第一类型连边的权重,同理的,还可以建立第二类型连边的权重。当第一类型连边和第二类型连边都具有权重的情况下,在后续基于投资网络进行扩散时的分值都需要根据该权重的大小进行扩散,后续将详细的举例说明。

在本发明实施例中可以得到三种数据集合:投资方集合I,被投资公司集合C和标签集合T,以及两种数据关系:投资方-公司之间的投资关系和公司-标签之间的所属关系。在实证分析中,投资方对特定领域和标签具有明显的投资偏好,因此本发明实施例以所投资公司作为桥梁,将投资方和标签联系起来,从而在推荐中利用到这一偏好信息。

图3为本发明实施例提供的投资网络内的节点之间连接关系示意图。根据获取的数据构建公司-投资方-标签三部分图G(C,I,T),构建规则为:每个投资方、被投资公司、标签均用节点表示,投资关系用连边表示,公司和标签在三部分图的两边,他们都与相应投资方相连,但是公司和标签之间不建立连边,如果投资方Ix投资过公司Ci,则在Ix和Ci之间建立连边;若同时公司Ci包含标签Ta和Tb,则在Ix和Ta、Tb之间建立连边,集合内部的节点之间没有连边,即各公司之间没有连边,各标签之间没有连边,各投资方之间也没有连边。公司-投资方之间连边的权重由投资金额、股权占比等实际数值量化,投资方-标签之间连边的权重由投资方投资含该标签的公司个数以及每项投资的投资金额、股权占比等数值确定。

例如,如果投资方集合包含4个投资方,分别为I1,I2,I3,I4,被投资公司集合有6个公司C1~C6,标签集合包含4个标签,为T1~T4;I1投资过C2、C4,I2投资过C3、C5,I3投资过C4、C5、C6,I4投资过C5;C1的标签为T1、T2,C2的标签为T1、T2、T4,C3的标签为T1、T2、T4,C4的标签为T3、T4,C5的标签为T4,C6的标签为T4,这里本发明实施例使用一个简单的权重规则作为示例,将投资方和公司之间的连边权重都看作1,将投资方与标签之间的连边权重设置为投资方投资含该标签公司的个数,根据如上投资数据可建立其如图3所示的公司-投资方-标签三部分图,图中边上的数字代表权重大小。由于待推荐的目标公司没有任何被投资经历,所以在构建的三部分图中,它将不与任何投资方相连,如图3中的公司C1。

30、多次迭代执行如下的扩散过程,扩散过程包括:将投资网络中的第一类型节点在当前扩散步骤中得到的分值分配给与第一类型节点相连接的第一邻居节点,第一邻居节点将得到的分值用于下一扩散步骤中。

其中,投资网络中待提供推荐的目标公司所包括的所有标签对应的标签节点在扩散过程中具有初始分值,投资网络中的M个投资方节点、N个被投资方节点、P个标签节点除目标公司所包括的所有标签对应的标签节点以外的其它标签节点在扩散过程中不具有初始分值;其中,当第一类型节点为标签节点时,第一邻居节点包括:通过第二类型连边与标签节点连接的投资方节点;当第一类型节点为投资方节点时,第一邻居节点包括:通过第二类型连边与投资方节点连接的标签节点,以及通过第一类型连边与投资方节点连接的被投资方节点;当第一类型节点为被投资方节点和标签节点时,第一邻居节点包括:通过第一类型连边与被投资方节点连接的投资方节点,以及通过第二类型连边与标签节点连接的投资方节点。

在本发明实施例中,通过步骤20生成投资网络之后,可以多次迭代执行如下的扩散过程,在每个扩散过程中都包括如下两个流程:将投资网络中的第一类型节点在当前扩散步骤中得到的分值分配给与第一类型节点相连接的第一邻居节点,第一邻居节点将得到的分值用于下一扩散步骤中。即第一邻居节点得到分值之后,以该第一邻居节点作为第一类型节点重新进行扩散,即重新执行将投资网络中的第一类型节点在当前扩散步骤中得到的分值分配给与第一类型节点相连接的第一邻居节点。

需要说明的是,本发明实施例中,当第一类型节点为被投资方节点和标签节点时,第一邻居节点包括:通过第一类型连边与被投资方节点连接的投资方节点,以及通过第二类型连边与标签节点连接的投资方节点。两边都可以通过连边往中间扩散,投资方可以和左端或者右端连接,或者同时和左右两端都相连,和左边相连就能得到左边扩散来的分值,和右边相连就能得到右边扩散来的分值。

在本发明实施例中,当第一类型连边和第二类型连边都具有权重的情况下,步骤30中的将投资网络中的第一类型节点在当前扩散步骤中得到的分值分配给与第一类型节点相连接的第一邻居节点,包括:

将投资网络中的第一类型节点在当前扩散步骤中得到的分值,按照第一类型连边的权重和第二类型连边的权重,平均分配给第一邻居节点。

其中,第一类型连边和第二类型连边都具有权重的情况下,在基于投资网络进行扩散时的分值都需要根据该权重的大小进行扩散,将投资网络中的第一类型节点在当前扩散步骤中得到的分值,按照第一类型连边的权重和第二类型连边的权重,平均分配给第一邻居节点。

在本发明的一些实施例中,步骤30中的扩散过程,具体可以包括如下步骤:

步骤a:在开始扩散之前的初始步骤中,为投资网络中待提供推荐的目标公司所包括的所有标签对应的标签节点设置初始分值,为投资网络中的M个投资方节点、N个被投资方节点、P个标签节点除目标公司所包括的所有标签对应的标签节点以外的其它标签节点设置分值为0;

步骤b:当第一类型节点为标签节点时,将标签节点的初始分值通过第二类型连边按照权重平均分配给投资方节点;在步骤b执行之后,依次迭代执行如下的步骤c、步骤d,直到达到最优扩散步数时停止迭代;

步骤c:当第一类型节点为投资方节点时,将投资方节点通过步骤b得到的分值通过第二类型连边、第一类型连边按照权重平均分配给标签节点和被投资方节点;

步骤d:当第一类型节点为被投资方节点和标签节点时,将被投资方节点通过步骤c得到的分值和标签节点通过步骤c得到的分值,通过第一类型连边、第二类型连边按照权重平均分配给投资方节点,投资方节点将通过第一类型连边、第二类型连边分别得到的分值叠加在一起,使用投资方节点通过步骤d得到的分值触发执行步骤c。

其中,在前述步骤c和步骤d中,需要根据多次重复迭代执行。为了给目标公司推荐合适的投资方,在投资网络(公司-投资方-标签三部分图)上,本发明实施例赋予标签集合中的每个标签一定的初始分值,例如与目标公司相连的标签获得1单位的初始分值,其他标签初始分值设置为0。接下来,这些分值将在三部分图中通过连边进行扩散。在每步扩散中,每个含有分值的节点(投资方、公司或者标签)将其分值按照权重平均分配给相连的邻居节点,每个节点将获得的分值相加得到自己的新分值。经过奇数步扩散,分值将落在投资方集合中。每步扩散后的分值计算如下式所示:

需要说明的是,上述的扩散流程可以是双向的,每步扩散中,含有分值的节点将分值分配给相连的邻居节点,分配出去以后,自身分值清零,然后所有节点将自己新接受(从别的节点那分配到的)的分值相加设为自己的新分值。

例如,在初始阶段,初始分值在标签节点集合中,所以在第一步扩散中,含有分值的节点就只有目标公司所含的标签节点,这几个标签节点将自己的分值分配给相连的投资方节点;接下来进行第二步扩散,这时候含有分值的节点是若干投资方节点,它们将自己的分值分配给相连的公司节点,同时也会分配给相连的标签节点;然后第三步扩散,含有分值的节点是若干公司节点和标签节点,公司节点将自己的分值分配给相连的投资方节点,标签节点将自己的分值也分配给相连的投资方节点;接下来第四步扩散,这时候含有分值的节点是若干投资方节点,它们将自己的分值分配给相连的公司节点和标签节点,以此类推。所以分值从投资方节点(中间的节点集合)分配出去的时候,是同时向两边扩散的,原因是投资方节点既与公司节点相连,又与标签节点相连。而分值从公司节点或标签节点扩散出去的时候,是单向扩散的,因为公司节点只与投资方节点有连边,而标签节点也只与投资方节点有连边。

举例说明如下,f(Iy)为节点Iy经该步扩散前的分值,f′(Iy)为扩散后的分值,A为投资方-公司邻接矩阵,若投资方Iy投资过公司Cx,则A(Iy,Cx)=Wyx,Wyx根据投资金额、股权占比等实际数值量化,否则为0;A′为投资方-标签邻接矩阵,若投资方Iy投资过含标签Tz的公司,则A′(Iy,Tz)=Wyz,Wyz由投资方投资含该标签公司的个数以及每项投资的投资金额、股权占比等数值确定,否则为0;kIy→C表示投资方Iy与所有公司连边的权重之和,kIy→T投资方Iy与所有标签连边的权重之和,kCx和kTz分别表示公司Cx和标签Tz与所有投资方连边的权重之和;λ为调节参数,用于调节投资方节点向左右两边扩散的分值比例,λ可从历史数据中训练得出最优值。

如图4a所示,为本发明实施例提供的投资网络内的初始分值设置的示意图,图4b为本发明实施例提供的投资网络内的第一步扩散的示意图,图4c为本发明实施例提供的投资网络内的第二步扩散的示意图,图4d为本发明实施例提供的投资网络内的第三步扩散的示意图。

此时目标公司为C1,为C1所含标签T1和T2设置1单位的初始分值,如图4a所示,然后开始扩散过程。在第一步扩散中,每个标签根据权重将自己的分值平均分配给相连的投资方,投资方将获得的分值相加,得到自己的分值,如图4b所示;在第二步扩散中,每个投资方将自己获得的全部分值按照权重平均分给相连的公司和标签,其中向公司集合分配总分值的λ倍,向标签集合分配总分值的(1-λ)倍,此时公司和标签得到了相应的分值,如图4c所示;在第三步扩散中,每个公司和标签分别将自己获得的分值再按权重平均分配给相连的投资方,投资方将两边分配来的分值相加得到新分值,如图4d所示。根据相同规则,本发明实施例可以继续进行多步扩散,并取分值落在投资方集合的情况(即经过奇数步扩散)为扩散结束点。最优扩散步数可从历史数据中训练得出。

在本发明的一些实施例中,投资方节点的分值的λ倍用于分配给通过第一类型连边与投资方节点连接的被投资方节点,投资方节点的分值的(1-λ)倍用于分配给通过第二类型连边与投资方节点连接的标签节点,λ为大于0且小于1的数值,λ为预先确定的最优双向扩散比重。

假设每个投资方节点的值有“1份”,这“1份”分值会划分开来,分别分配向左右。比如往左边分配“0.3份”,往右边分配“0.7份”。这里不是直接平均分(左“0.5份“,右”0.5份“)的原因是考虑到,在三部分图中,往左右两边扩散的比重调整会对推荐效果有影响,因此引入参数λ。

详细的,在第一步扩散中,每个标签节点根据权重将自己的分值平均分配给相连的投资方节点,投资方节点将获得的分值相加,得到自己的分值,如图4b所示:

T1扩散给分值,T2扩散给分值;

T1扩散给分值,T2扩散给分值。

在第二步扩散中,每个投资方节点将自己获得的全部分值按照权重平均分给相连的公司节点和标签节点,其中向公司节点分配总分值的λ倍,向标签节点分配总分值的1-λ倍,此时公司节点和标签节点得到了相应的分值,如图4c所示:

I1扩散给分值;

I2扩散给分值;

I1扩散给分值;

I2扩散给分值;

I1扩散给分值,I2扩散给分值;

I1扩散给分值,I2扩散给分值;

I1扩散给分值;

I1扩散给分值,I2扩散给分值。

在第三步扩散中,每个公司节点和标签节点分别将自己获得的分值再按权重平均分配给相连的投资方,投资方节点将两边分配来的分值相加得到新分值,如图4d所示:

I1左C2扩散给分值,C4扩散给分值;

I2左:C3扩散给分值,C5扩散给分值;

I3左:C4扩散给分值,C5扩散给分值;

I4左:C5扩散给分值;

I1右:T1扩散给分值,T2扩散给分值,T3扩散给分值,T4扩散给分值。

I2右:T1扩散给分值,T2扩散给分值,T4扩散给分值。

I3右:T3扩散给分值,T4扩散给I3分值。

I4右:T4扩散给分值。

40、确定扩散过程的已执行扩散步骤是否已经达到预先确定出的最优扩散步数,并在已执行扩散步骤已经达到最优扩散步数时,结束扩散过程。

在本发明实施例中,最优扩散步数可以通过预先训练的方式来得到,例如最优扩散步数可以为1或3或5等奇数取值,在步骤30中扩散步数达到预先确定出的最优扩散步数时,结束上述扩散流程,触发执行如下的步骤50。

50、获取在扩散过程结束时投资网络中的M个投资方节点分别具有的最终分值,将M个投资方节点按照分别具有的最终分值从大到小排序,根据排序结果向目标被投资方节点推荐至少一个投资方节点。

在本发明实施例中,扩散结束后,每个投资方节点获得的分值反映出该投资方对于目标公司的推荐程度,将分值按从大到小的顺序进行排序,根据推荐个数要求,选择排名靠前的投资方为目标公司生成个性化推荐列表。因为三部分图的连边是根据真实联系连接的,投资方连着投资过的公司以及投资过的标签。因此,分值顺着连边扩散,就会把有间接联系的节点都扩散到。比如,初始分值在目标公司所含的标签节点上,在第一步扩散中,投资过这些标签的投资方节点都会收到一定的分值,投资过这些标签越多的投资方节点就会收到越多的分值。然后这些投资方节点再把分值扩散给公司节点和标签节点,获得分值的公司节点即为投资过目标公司所含标签的投资方投资过的公司,获得分值的标签节点即为投资过目标公司所含标签的投资方投资过的标签。也就是说,直接与间接和这些标签产生关系的投资方节点、公司节点、标签节点都会相继收到分值,然后这些分值会集中在投资方节点集合中,其中,奇数步可以是1、3、5等步数的扩散。也就是说,这种弱关系通过扩散不断加强,最终反映在投资方节点的分值中,这个分值越大,就说明该投资方与目标公司的关系越强,本发明实施例判断它们之间产生投资关系的可能性越大,即将分值高的投资方推荐给目标公司。

在本发明的一些实施例中,根据排序结果向目标公司推荐至少一个投资方包括:

将排序结果中的前S个投资方节点推荐给目标公司,S为小于M的正整数。

其中,S的取值可以是1,即将与待推荐的目标公司匹配度最高的投资方推荐给它,或者S的取值可以为2,或者3,或者更多值,以实现向目标公司推荐多个投资方,便于其进行后续的进一步的投资方选择。

接下来以一个实际的实现流程为例,该方法实现推荐的具体步骤为:

步骤S01、获取历史投资关系数据和相关标签信息,包括每条历史投资事件的投资方、被投资公司、投资金额、股权占比等信息和公司所含标签。

S02、通过历史投资数据进行训练得出最优步数T*和最优λ*

其中,历史投资关系数据指的是若干投资方和公司之间的投资事件,例如某投资方投资了某公司。而历史投资数据包含历史投资关系以及相应公司的标签信息。

在S02执行如下的详细扩散过程:将历史投资数据按时间顺序划分为两部分,第一部分为训练数据,第二部分为测试数据。根据训练数据和相关标签信息建立公司-投资方-标签三部分图,确定连边权重。对于每个在训练数据中没有投资关系、在测试数据中获得投资的公司,视其为测试公司,将其所含标签设置初始分值1,根据三部分图中的连边权重,计算分值经奇数步(即1、3、5、7等步)扩散后的结果,得到所有投资方的推荐分值。将投资方按推荐分值从大到小排序,根据测试数据中实际投资该测试公司的投资方排名计算排序分其中r为在测试集中实际投资该公司的投资方的排名,L为参与排序的投资方总个数。

不断改变λ和扩散步数,当所有测试公司的平均排序分最小,即准确率最高时,得到最优步数T*和λ*。排序分是推荐系统的一个常用效果评估指标,除排序分外,这里也可以使用召回率(Recall),AUC等其他准确率衡量指标。一般3步或5步就可以得到准确率较高的结果。

S03、根据所有历史投资关系数据和相关标签信息建立公司-投资方-标签三部分图,确定连边权重,为待推荐的目标公司所含标签设立初始分值,将最优参数λ*代入,计算扩散T*步后投资方的推荐分值,根据推荐分值的高低得出每个投资方对于目标用户之间的推荐程度,选择分值较高的投资方生成目标公司的推荐列表。

推荐效果的衡量也可以用排序分来评估,即利用实际投资这些目标公司的投资方衡量推荐的准确率,当然,本发明实施例也可以手动的挑出一些公司,假设投资它的公司以及在此发生之后的投资事件未知,对其进行前述的扩散过程,获得推荐结果后进行准确率的测试。

通过前述的举例说明可知,在本申请实施例中生成了投资网络,该投资网络包括:M个投资方节点、N个被投资方节点、P个标签节点、投资方节点与被投资方节点之间的第一类型连边、和投资方节点与标签节点之间的第二类型连边。本发明实施例中还可以多次迭代执行扩散过程,使得标签节点在扩散过程中具有的初始分值能够在投资网络中不断被扩散,因为投资网络中的三部分节点的连边是根据真实联系连接的,投资方连着投资过的被投资节点(即被投资公司,简称公司)以及投资过的标签。因此,分值顺着连边扩散,就会把有间接联系的节点都扩散到。比如,初始分值在目标公司所含的标签节点上,在第一步扩散中,投资过这些标签的投资方节点都会收到一定的分值,投资过这些标签越多的投资方节点就会收到越多的分值。然后这些投资方节点再把分值扩散给公司节点和标签节点,获得分值的公司节点即为投资过目标公司所含标签的投资方投资过的公司,获得分值的标签节点即为投资过目标公司所含标签的投资方投资过的标签。也就是说,直接与间接和这些标签产生关系的投资方节点、公司节点、标签节点都会相继收到分值,然后这些分值会集中在投资方节点集合中。因此这种弱关系通过扩散不断加强,最终反映在投资方节点的分值中,这个分值越大,就说明该投资方与目标公司的关系越强,投资方和目标公司之间产生投资关系的可能性越大,即将分值高的投资方推荐给目标公司。因此可以提高针对初创公司推荐投资方的准确率。

上述实施例是对本发明的举例说明,不作为对本发明的限定,基于上述实施例还可以同等变形或者替换出更多的实施例,此处不再逐一说明。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1