基于最大熵模型的团体比赛结果预测方法

文档序号：8922780阅读：341来源：国知局

基于最大熵模型的团体比赛结果预测方法
【技术领域】
[0001] 本发明涉及计算机数据挖掘领域，尤其涉及一种基于最大熵模型的团体比赛结果预测方法。
【背景技术】
[0002] 随着互联网的发展和人们对于各种体育竞技赛事的关注度的提高，像欧洲足球五大联赛、美国职业橄榄球联赛、美国职业篮球联赛等团体体育的竞技赛事已经不只受到当地居民的关注，这些赛事已经普及全球。各大型博彩公司、大型网站纷纷对赛事的结果进行分析与预测，比赛关注者根据自己的主观偏好和网站给出的分析对一场比赛的输赢预测。但是由于影响团体实力的因素众多，而且每一个因素影响的程度又不尽相同，因此预测的正确率非常低。处于大数据时代的今天，我们更应该根据已有的历史比赛数据来进行科学的合理的推导，而不能仅仅靠我们的情感和少量的数据对一场比赛的输赢预测。
[0003] "熵"是信息量的度量方法，它表示某一事件出现的消息越多，事件发生的可能性就越小，数学上就是概率越小。最大熵原理指出，当我们需要对一个随机事件的概率分布进行预测时，我们的预测应当满足全部已知的条件，而对未知的情况不要做任何主观假设。在这种情况下，概率分布最均匀，预测的风险最小，因为这时概率分布的信息熵最大，所以人们称这种模型叫〃最大熵模型〃。我们知道，决定比赛最终结果的因素可能有几十甚至上百种，我们对体育竞技中已经比赛过的赛事作为已知的数据进行统计分析，然后通过利用最大熵方法找到一个同时满足成千上万种不同条件的最优模型，从而对比赛最终结果进行预测。

【发明内容】

[0004] 本鉴于此，本发明的主要目在于提供了一种基于最大熵模型的团体比赛结果预测方法。
[0005] 为了得到上述的目的，本发明的技术方案实现的步骤： S1获取各团体历史赛季中每场比赛参赛双方的特征数据。
[0006] S2根据最大熵原理，构造最大熵模型。将训练数据集T，代入最大熵模型中，获取最佳的模型。
[0007] S3获取参赛双方最近n场的各个特征数据的期望代入最优模型
，计算主场参赛团体最终比赛结果的分布概率
[0008] 进一步，作为一种优选方案，步骤S1所述的特征数据包括两种： 1、影响比赛最终结果的内在因素的数据和外在因素的数据，内在因素是指团体自身内部的因素，例如，团体主教练的战术体系。外在因素是指非团体自身内部的因素。2、主场团体最终比赛结果的数据，将特征数据的总体作为训练数据集T。
[0009] 进一步，作为一种优选方案，步骤S2中所述的构造最大熵模型，并求解获得最佳模型的具体方法：将每场历史比赛参赛的两个团体，主场团体的最终比赛结果作为随机事件Y，两个团体各自的内在数据和外在数据特征作为随机事件X，构造条件概率分布
。条件概率_
的熵为
根据最大熵原理，将训练数据集T代入模型，求出最优的模型
[0010] 本发明所提供了一种基于最大熵模型的团体比赛结果预测方法具有一下优点：本发明主要利用比赛的历史数据，通过最大熵原理求出影响团体比赛结果的内在因素和外在因素的比重。建立符合团体比赛的最优条件概率模型，然后综合比赛团体双方最近的竞技状态，将最近的特征数据代入到利用最大熵模型解出的最优模型中，计算出参赛团体获胜的概率。给赛事关注者一个科学比赛预测。
【附图说明】
[0011] 图1为本发明的流程图； 101S1获取各团体历史赛季中每场比赛参赛双方的特征数据。
[0012] 102S2根据最大熵原理，构造最大熵模型。将训练数据集T，代入最大熵模型中，获取最佳的t吴型。
[0013] 103S3获取参赛双方最近n场的各个特征数据的期望代入最优模型
，计算主场参赛团体最终比赛结果的分布概率

【具体实施方式】
[0014] 为了使上述目的的特征和优点能够更加明显易懂，下面结合附图和具体实施方案给发明做出进一步详细的说明。
[0015] 如图1所示，本发明所提供了一种基于最大熵模型的比赛结果预测方法，其特征在于如下步骤： S1获取各团体历史赛季中每场比赛参赛双方的特征数据。
[0016] S2根据最大熵原理，构造最大熵模型。将训练数据集T，代入最大熵模型中，获取最佳的模型。
[0017] S3获取参赛双方最近n场的各个特征数据的期望代入最优模型.
，计算主场参赛团体最终比赛结果的分布概率
[0018] 在步骤S1中团体竞赛选取美国男子篮球职业联赛（NBA),其中的历史赛季为在 NBA官网上获取2000-2014赛季的30个球队整个常规赛的比赛数据。其中的特征数据：包括每场比赛参赛球队A、B各自的内在因素两分球、三分球、助攻、篮板、盖帽、抢断、球员伤病、主教练，外在因素：球队两场比赛之间休息的天数、天气状况，和最终主场的胜负。
[0019] 在步骤S2中X=(A两分球、A三分球、A助攻、A篮板、A盖帽、A抢断、A球员伤病、A主教练、A球队两场比赛之间休息的天数、A天气状况、B两分球、B三分球、B助攻、B篮板、B盖帽、B抢断、B球员伤病、B主教练、 B球队两场比赛之间休息的天数、B天气状况），Y=(胜、负）；构成训练集
。则条件概率分布
的条件熵为
；将训练集代入模型，经过训练得出最优的模型，
[0020] 在步骤S3中提取即将比赛的参赛双方A、B最近6场比赛的两分球、三分球、助攻、篮板、盖帽、抢断、球员伤病、主教练、球队两场比赛之间休息的天数、天气状况等特征数据的期望代入最优的模型
。由于篮球比赛只有胜负之分，所以只需要计算即将比赛中主场球队的胜率.
【主权项】
1. 基于最大熵模型的团体比赛结果预测方法，其特征在于，该方法包括以下步骤： Si获取各团体历史赛季中每场比赛参赛双方的特征数据； S2根据最大熵原理，构造最大熵模型；将训练数据集T，代入最大熵模型中，获取最佳的模型； S3获取参赛双方最近η场的各个特征数据的期望代入最优模型P 1又：>,计算主场参赛团体最终比赛结果的分布概率ρ ?Ζ2. 根据权利要求1的方法，其中所述步骤SI所述的特征数据，其特征在于，特征数据包括两种：1、影响比赛最终结果的内在因素的数据和外在因素的数据，内在因素是指团体自身内部的因素，例如，团体主教练的战术体系，外在因素是指非团体自身内部的因素，2、主场团体最终比赛结果的数据，将特征数据的总体作为训练数据集T。3. 根据权利要求1或2的方法，其中所述步骤S2中所述的构造最大熵模型并求解获得最佳模型，其特征在于，将每场历史比赛参赛的两个团体，主场团体的最终比赛结果作为随机事件Y，两个团体各自的内在数据和外在数据特征作为随机事件X，构造条件概率分布丨Λ7 ；);条件概率P G7丨尤）的熵为：:根据最大熵原理，将训练数据集T代入模型，求出最优的模型p 丨尤）。
【专利摘要】本发明涉及计算机数据挖掘领域，尤其涉及一种基于最大熵模型的团体比赛结果预测方法。该方法的具体步骤如下：S1获取各团体历史赛季中每场比赛参赛双方的特征数据。S2根据最大熵原理，构造最大熵模型。将训练数据集T，代入最大熵模型中，获取最佳的模型。S3获取参赛双方最近n场的各个特征数据的期望代入最优模型，计算主场参赛团体最终比赛结果的分布概率。本发明技术方案给赛事关注者提供一个科学的比赛结果预测。
【IPC分类】G06F19/00
【公开号】CN104899413
【申请号】CN201510174490
【发明人】程戈, 张振宇, 李强, 李聪, 张云, 何春辉
【申请人】湘潭大学
【公开日】2015年9月9日
【申请日】2015年4月14日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程戈;张振宇;李强;李聪;张云;何春辉;
技术所有人：湘潭大学;
我是此专利的发明人

上一篇：一种电-气互联能源系统可用输电能力计算方法
上一篇：一种铝合金铸件力学性能预测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。