本发明涉及计算机技术领域,尤其涉及一种交易机器人分类模型的训练方法、电子设备和计算机存储介质。
背景技术
全世界股票、期货、外汇和黄金市场是一个资金博弈市场或资金博弈平台。博弈的决策人是操纵每个金融产品的庄家,这是极少数人。博弈策略是筹集大量的资金,利用资金优势,大量买进股票或各种金融产品,并控制了大量的筹码或金融产品,通过资金优势,任意拉抬和打压金融产品的价格,制造价格的波动,通过价格波动来赢得博弈胜利,就是赢取博弈对手的钱。
交易机器人可以基于股票信息智能的向投资者推荐投资信息,而如何训练交易机器人,使其推荐的信息更加准确成为当前研究的热点。
技术实现要素:
(一)要解决的技术问题
为了合理推荐,本发明提供一种交易机器人分类模型的训练方法、电子设备和计算机存储介质。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
一种交易机器人分类模型的训练方法,所述方法,包括:
s101,交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;
s102,分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;
s103,交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型。
可选地,所述预设时间段为一年。
可选地,所述s102的包络值通过如下公式得到:
ei(t)=a*[fi(t)-fi(t-1)]+logfi(t);
a=0.05*minfi(t)/maxfi(t);
i为参数标识,参数为成交量或开盘价格或收盘价格或最高价格或最低价格,ei(t)为t日i对应的包络值,fi(t)为t日i的值。
可选地,所述s103包括:
s103-1,对于任一股票n,将其第t日的成交量包络值、开盘价格包络值、收盘价格包络值、最高价格包络值、最低价包络值组成向量
s103-2,根据
s103-3,通过k-means算法对各样本点进行聚类,形成分类模型。
可选地,所述103-2中每一个
可选地,s103-3包括:
s103-3-1,从所有样本点中选择k个作为中心点;
s103-3-2,计算各样本点与格中心点之间的距离;
s103-3-3,将各样本点归入距离最近的中心点;
s103-3-4,重新计算中心点所在类的新中心点;
s103-3-5,重新计算各样本点与各新中心点之间的距离;
s103-3-6,将各样本点归入距离最近的新中心点;
s103-3-7,重复执行s103-3-4、s103-3-5和s103-3-6,直至新中心点与前一中心点的变化量小于预设值,形成分类模型。
可选地,所述s103-3-2中任一样本点
a(n′,n″)为股票n′所属领域与股票n″所属领域之间的关联度;
b(t′,t″)为时间差系数;
可选地,所述b(t′,t″)=t′与t″之间的时间差/250。
为了达到上述目的,本发明采用的主要技术方案还包括:
一种电子设备,所述电子设备与交易机器人有线连接或者无线连接,所述电子设备包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器控制交易机器人执行所述程序时实现如上述方法任意一项的步骤。
为了达到上述目的,本发明采用的主要技术方案还包括:
一种计算机存储介质,所述计算机存储介质与交易机器人有线连接或者无线连接,所述程序被处理器控制交易机器人执行时实现如上述方法任意一项的步骤。
(三)有益效果
本发明的有益效果是:交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型,由于包络值比真实值更平滑,因此通过包络值训练出的模型更加精确。
附图说明
图1为本发明一个实施例提供的一种交易机器人分类模型的训练方法流程图;
图2为本发明一个实施例提供的一种电子设备的结构示意图。
具体实施方式
交易机器人可以基于股票信息智能的向投资者推荐投资信息,而如何训练交易机器人,使其推荐的信息更加准确成为当前研究的热点。
本发明提供一种方法交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型,由于包络值比真实值更平滑,因此通过包络值训练出的模型更加精确。
参见图1,本实施例提供的交易机器人分类模型的训练方法实现流程如下:
s101,交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格。
其中,预设时间段可以为一年。
例如,交易机器人获取一年内各股票的交易信息,从交易信息中得到过去一年中股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格。
s102,分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值。
包络值ei(t)=a*[fi(t)-fi(t-1)]+logfi(t);
a=0.05*minfi(t)/maxfi(t);
i为参数标识,参数为成交量或开盘价格或收盘价格或最高价格或最低价格,ei(t)为t日i对应的包络值,fi(t)为t日i的值。
如,股票a在第5日的成交量为f成交量(5),其对应的包络值为:
e成交量(5)=a*[f成交量(5)-f成交量(4)]+logf成交量(5),
a为0.05*(股票a各日成交量的最小值/股票a各日成交量的最大值)。
包络值可以对s101中获得的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格进行平滑处理,平滑后的成交量、开盘价格、收盘价格、最高价格、最低价格即成交量包络值、开盘价格包络值、收盘价格包络值、最高价格包络值、最低价包络值更加贴合股票本身,将成交量包络值、开盘价格包络值、收盘价格包络值、最高价格包络值、最低价包络值作为样本进行训练,可以使得最终得到的模型更加准确。
s103,交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型。
具体的,
s103-1,对于任一股票n,将其第t日的成交量包络值、开盘价格包络值、收盘价格包络值、最高价格包络值、最低价包络值组成向量
如
s103-2,根据
如将每一个
s103-3,通过k-means算法对各样本点进行聚类,形成分类模型。
本步骤可以通过如下过程实现:
s103-3-1,从所有样本点中选择k个作为中心点。
s103-3-2,计算各样本点与格中心点之间的距离。
在计算距离时,本实施例提供一种距离计算方法,任一样本点
a(n′,n″)为股票n′所属领域与股票n″所属领域之间的关联度。在应用时,可以实现存储各领域之间的关联度,此处查找预先存储的关联度即可。
b(t′,t″)为时间差系数;b(t′,t″)=t′与t″之间的时间差/250。
本实施例在计算距离时,不仅考虑到现有技术中各特征之间的距离
s103-3-3,将各样本点归入距离最近的中心点。
s103-3-4,重新计算中心点所在类的新中心点。
s103-3-5,重新计算各样本点与各新中心点之间的距离。
s103-3-6,将各样本点归入距离最近的新中心点。
s103-3-7,重复执行s103-3-4、s103-3-5和s103-3-6,直至新中心点与前一中心点的变化量小于预设值,形成分类模型。
其中预设值可以为5%,则如果新中心点与前一中心点的变化量小于5%,则停止循环,形成分类模型。
本实施例提供的训练方法,交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型,由于包络值比真实值更平滑,因此通过包络值训练出的模型更加精确。
参见图2,本实施例提供了一种电子设备,该电子设备可以位于交易机器人内,也可以与交易机器人分离,该电子设备可以与交易机器人有线连接,也可以无线连接,只要电子设备与交易机器人通信,进而控制交易机器人即可。
该电子设备包括:存储器201、处理器202、总线203以及存储在存储器201上并可在处理器202上运行的计算机程序,所述处理器202可以控制交易机器人执行所述程序时实现如下方法:
s101,交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;
s102,分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;
s103,交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型。
可选地,预设时间段为一年。
可选地,s102的包络值通过如下公式得到:
ei(t)=a*[fi(t)-fi(t-1)]+logfi(t);
a=0.05*minfi(t)/maxfi(t);
i为参数标识,参数为成交量或开盘价格或收盘价格或最高价格或最低价格,ei(t)为t日i对应的包络值,fi(t)为t日i的值。
可选地,s103包括:
s103-1,对于任一股票n,将其第t日的成交量包络值、开盘价格包络值、收盘价格包络值、最高价格包络值、最低价包络值组成向量
s103-2,根据
s103-3,通过k-means算法对各样本点进行聚类,形成分类模型。
可选地,103-2中每一个
可选地,s103-3包括:
s103-3-1,从所有样本点中选择k个作为中心点;
s103-3-2,计算各样本点与格中心点之间的距离;
s103-3-3,将各样本点归入距离最近的中心点;
s103-3-4,重新计算中心点所在类的新中心点;
s103-3-5,重新计算各样本点与各新中心点之间的距离;
s103-3-6,将各样本点归入距离最近的新中心点;
s103-3-7,重复执行s103-3-4、s103-3-5和s103-3-6,直至新中心点与前一中心点的变化量小于预设值,形成分类模型。
可选地,s103-3-2中任一样本点
a(n′,n″)为股票n′所属领域与股票n″所属领域之间的关联度;
b(t′,t″)为时间差系数;
可选地,b(t′,t″)=t′与t″之间的时间差/250。
本实施例提供的电子设备,控制交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型,由于包络值比真实值更平滑,因此通过包络值训练出的模型更加精确。
本实施例提供了一种计算机存储介质,该计算机存储介质可以位于交易机器人内,也可以与交易机器人分离,该计算机存储介质可以与交易机器人有线连接,也可以无线连接,只要计算机存储介质与交易机器人通信,进而控制交易机器人即可。
该计算机存储介质控制交易机器人执行如下操作:
s101,交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;
s102,分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;
s103,交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型。
可选地,预设时间段为一年。
可选地,s102的包络值通过如下公式得到:
ei(t)=a*[fi(t)-fi(t-1)]+logfi(t);
a=0.05*minfi(t)/maxfi(t);
i为参数标识,参数为成交量或开盘价格或收盘价格或最高价格或最低价格,ei(t)为t日i对应的包络值,fi(t)为t日i的值。
可选地,s103包括:
s103-1,对于任一股票n,将其第t日的成交量包络值、开盘价格包络值、收盘价格包络值、最高价格包络值、最低价包络值组成向量
s103-2,根据
s103-3,通过k-means算法对各样本点进行聚类,形成分类模型。
可选地,103-2中每一个
可选地,s103-3包括:
s103-3-1,从所有样本点中选择k个作为中心点;
s103-3-2,计算各样本点与格中心点之间的距离;
s103-3-3,将各样本点归入距离最近的中心点;
s103-3-4,重新计算中心点所在类的新中心点;
s103-3-5,重新计算各样本点与各新中心点之间的距离;
s103-3-6,将各样本点归入距离最近的新中心点;
s103-3-7,重复执行s103-3-4、s103-3-5和s103-3-6,直至新中心点与前一中心点的变化量小于预设值,形成分类模型。
可选地,s103-3-2中任一样本点
a(n′,n″)为股票n′所属领域与股票n″所属领域之间的关联度;
b(t′,t″)为时间差系数;
可选地,b(t′,t″)=t′与t″之间的时间差/250。
本实施例提供的计算机存储介质,控制交易机器人获取预设时间段内的各股票每日的成交量、开盘价格、收盘价格、最高价格、最低价格;分别确定各股票每日成交量、开盘价格、收盘价格、最高价格、最低价格对应的包络值;交易机器人以包络值作为训练样本,通过k-means算法进行训练,得到分类模型,由于包络值比真实值更平滑,因此通过包络值训练出的模型更加精确。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
最后应说明的是:以上所述的各实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。