在球队运动中进行交互的、可说明的且改进的比赛和球员表现预测的方法和系统与流程

文档序号:23726245发布日期:2021-01-26 16:45阅读:77来源:国知局
在球队运动中进行交互的、可说明的且改进的比赛和球员表现预测的方法和系统与流程
在球队运动中进行交互的、可说明的且改进的比赛和球员表现预测的方法和系统
[0001]
相关申请的交叉引用
[0002]
本申请要求对2018年1月21日提交的美国临时申请系列no.62/619,894的引用,其全部内容通过引用而并入于此。
技术领域
[0003]
本公开总体上涉及生成预测模型的系统和方法,更具体地,涉及对赛前和赛中结果进行预测的系统和方法。


背景技术:

[0004]
体育迷和数据分析人员已经越来越多地深深扎根于体育分析,特别是在比赛开始之前和比赛进行期间对比赛的结果进行预测。例如,作为一场大赛的先导,体育网络持续主办辩论节目,其中多方争论哪支球队将赢得即将来临的比赛。然而,这种分析到比赛结束也不会停下来。典型的“monday morning quarterback”体育节目主持人例如对如果教练对一个或更多个球员进行调整则比赛的结果将如何改变进行辩论。因此,对于开发能够更准确地预测体育赛事的结果的系统存在持续的竞争。


技术实现要素:

[0005]
本文所公开的实施方式总体上涉及生成体育赛事的结果的系统、方法以及计算机可读介质。计算系统从数据存储部取回赛事数据。所述赛事数据包括跨多个赛季的多场赛事的详细报道信息。该计算系统使用深度神经网络生成预测模型。该深度神经网络中的一个或更多个神经网络基于赛事数据生成包括球队特定信息和队员(agent)特定信息的一个或更多个嵌入。该计算系统从赛事数据中选择与体育赛事的当前背景有关的一个或更多个特征。该计算系统通过所述深度神经网络,至少基于球队特定嵌入、队员特定嵌入以及所述体育赛事的当前背景,学习一场或更多场体育赛事的一个或更多个可能结果。该计算系统接收体育赛事的赛前阵容。所述赛前阵容包括主队的多个队员和客队的多个队员。该计算系统经由预测模型,基于主队的各个队员的历史信息、客队的各个队员的历史信息以及球队特定特征,生成体育赛事的可能结果。
[0006]
在另一实施方式中,提供了一种生成体育赛事的结果的系统、方法以及计算机可读介质。计算系统从数据存储部取回赛事数据。所述赛事数据包括跨多个赛季的多场赛事的详细报道信息。该计算系统使用深度神经网络生成预测模型。只要有足够的时间,基于各个球队的阵容特征、各个赛事在各个时间t的当前状态以及各个时间t的当前得分记录表(box score),神经网络学习在各个时间t时很可能出现在各个赛事中的一个或更多个球员。该计算系统生成数据集,该数据集包括在各个时间t很可能出现在各个赛事中的所述一个或更多个球员。混合密度网络基于各个球队的阵容特征、各个赛事在时间t的当前状态、各个时间t的当前得分记录表以及包括在各个时间t很可能出现在各个赛事中的所述一个
或更多个球员的数据集,学习各个时间t的得分差异。该计算系统接收在当前时间t生成体育赛事的预测结果的指示。该计算系统经由预测模型,基于各个球队针对体育赛事的阵容特征、该体育赛事在时间t的当前状态、时间t的当前得分记录表以及在在时间t时该体育赛事中的当前阵容,生成该体育赛事的最终得分差异。
附图说明
[0007]
按照可以详细理解本公开的上述特征的方式,上面简要概述的本公开的更具体描述可以参照实施方式进行,其中一些实施方式在附图中进行了例示。然而,要注意,附图仅例示了本公开的典型实施方式,并由此,不应被视为对本公开范围的限制,对于本公开来说,可以允许其它等效实施方式。
[0008]
图1是例示根据示例实施方式的计算环境的框图。
[0009]
图2是例示根据示例实施方式的图1的计算环境的组件的框图。
[0010]
图3a是例示根据示例实施方式的神经网络架构的框图。
[0011]
图3b是例示根据示例实施方式的神经网络架构的框图。
[0012]
图3c是例示根据示例实施方式的神经网络架构的框图。
[0013]
图3d是例示根据示例实施方式的神经网络架构的框图。
[0014]
图4是例示根据示例实施方式的对深度神经网络模型进行训练的方法的流程图。
[0015]
图5a是例示根据示例实施方式的图形用户界面的框图。
[0016]
图5b是例示根据示例实施方式的图形用户界面的框图。
[0017]
图6是例示根据示例实施方式的对赛前结果进行预测的方法的流程图。
[0018]
图7a是根据示例实施方式的神经网络模型的结构的框图。
[0019]
图7b是例示根据示例实施方式的混合密度网络的结构的框图。
[0020]
图8是例示根据示例实施方式的对深度神经网络模型进行训练的方法的流程图。
[0021]
图9是例示根据示例实施方式的示例性图形用户界面的框图。
[0022]
图10是例示根据示例实施方式的生成运体育赛事的赛中预测的方法的流程图。
[0023]
图11a是例示根据示例实施方式的计算装置的框图。
[0024]
图11b是例示根据示例实施方式的计算装置的框图。
[0025]
为了易于理解,在可能的情况下,使用了相同的标号来指定图中共用的相同要素。设想的是,在一个实施方式中公开的要素可以在没有具体讲述的情况下有益地利用在其它实施方式上。
具体实施方式
[0026]
本文所公开的一种或更多种技术总体上涉及生成体育赛事(例如,“比赛”)的预测结果的系统和方法。例如,本文所公开的一种或更多种技术致力于在比赛开始之前和在比赛进行期间对比赛的结果进行预测。
[0027]
在一些实施方式中,本文所公开的一种或更多种技术在比赛开始之前,利用个性化预测的能力来生成预测模型,以捕获球队内的球员表现之间存在的低级非线性,从而生成预测结果。例如,这种方法背后的基本原理是队员和球队可能具有不同水平的才能,但是他们可以展示的才能水平可能与该领域的其他球员以及他们的对手有着内在的联系。尽管
这种方法可能是由直觉得到的,但是已经证明在实践中做到这一点非常具有挑战性,这是由于球队内的球员之间以及球队之间存在大量的排列组合。然而,本文所描述的一种或更多种技术能够利用捕获这些相同的交互的低维嵌入。
[0028]
本文所描述的一种或更多种技术利用深度神经网络(即,多个隐藏层)的能力来标识这些嵌入。这些嵌入的标识允许(1)比常规技术更准确的比赛预测;(2)数据驱动的球员影响力排名;以及(3)交互式“假设分析”,可以利用输入特征空间的可解释性来比较特定情形下的球员。
[0029]
本文所描述的一种或更多种技术与当前的比赛预测模型完全不同。例如,本文所描述的一种或更多种技术在特征表示中明确地编码球队阵容信息。这种技术与大多数其它比赛预测模型形成了鲜明对比,大多数其它比赛预测模型要么利用对进攻和防守能力进行建模的变量,经由泊松分布来预测正在计分的得分数,要么就直接估计获胜、平局或失败。常规方法还专注于“球员评分”,以估计球员可以预期的进球得分/分数,但是常规的系统没有明确地预测比赛的结果,而这最终是可用于关联球员表现的上乘标签。
[0030]
此外,在一些实施方式中,本文所公开的一种或更多种技术涉及赛中的比赛预测(即,比赛已经开始之后)。此类技术可使本文所描述的系统在比赛期间的任何时间动态生成比赛预测。如以下示例所示,常规的系统无法在比赛过程中准确地预测比赛结果。
[0031]
在2017年金州勇士队(golden state warriors)与圣安东尼奥马刺队(san antonio spurs)之间的西部联盟决赛的第一场比赛中,在第三节还剩下7分53秒钟并且马刺队以78比55领先的情况下,kawhi leonard在进行跳投时左脚踝再次受伤。在leonard离开比赛后,勇士队连续取得了18比0的得分,最终赢得了比赛。
[0032]
直觉指出,随着leonard的离场,马刺变得不太可能获胜。然而,常规的方法无法解释失去leonard的严重性以及勇士队在过去几个赛季的优势表现。获胜概率模型应当响应赛中的背景特征,诸如受伤和犯规。另外,获胜概率模型应当并入球队身份,即,球队实力。常规的系统无法解释勇士队在前几个赛季的优势,并且应当通过模型来捕获举例说明的在类似情形下重获胜利的能力。
[0033]
此外,在给定比赛场景的情况下,常规的获胜概率模型在预测单个二元结果的可能性方面受到限制。事实上,任何一种结果都有很多途径,并且该模型应当突出这种复杂性。这样的问题在获胜概率估计中很常见的事实突出了最后一个问题。更进一步地,根本没有可供研究人员和分析人员用来比较信息的公开可用的数据集或模型。
[0034]
本文所描述的一种或更多种技术通过提供这样的系统来直接解决常规系统的一个或更多个局限性,即,该系统通过对得分差异分布(例如,最终得分差异)的显式预测进行阵容编码来解决背景和不确定性的问题。例如,通过使用利用阵容编码的混合密度网络,本文所描述的一种或更多种技术达到了常规的方法所无法获得的准确度水平。
[0035]
图1是例示根据示例实施方式的计算环境100的框图。计算环境100可以包括经由网络105进行通信的跟踪系统102、组织计算系统104以及一个或更多个客户端装置108。
[0036]
网络105可以是任何合适的类型,包括经由互联网(诸如蜂窝网络或wi-fi网络)的各个连接。在一些实施方式中,网络105可以使用直接连接(诸如射频标识(rfid)、近场通信(nfc)、bluetooth
tm
、低能耗bluetooth
tm
(ble)、wi-fi
tm
、zigbee
tm
、环境背向散射通信(abc)协议、usb、wan或lan)来连接终端、服务以及移动装置。由于发送的信息可能是个人信息或
机密信息,因此,安全问题可能要求对这些类型的连接中的一种或更多种进行加密或者以其它方式加以保护。然而,在一些实施方式中,发送的信息可能不那么私密,因此为了方便而非安全,可以选择网络连接。
[0037]
网络105可以包括被用于交换数据或信息的任何类型的计算机连网布置。例如,网络105可以是互联网、专用数据网络、使用公共网络的虚拟专用网络和/或其它合适的连接,该连接使计算环境100中的组件能够在环境100的组件之间发送和接收信息。
[0038]
跟踪系统102可以位于比赛地点106。例如,可以将比赛地点106构造成主办包括一个或更多个队员112的体育赛事。可以将跟踪系统102配置成记录比赛场地上所有队员(即,球员)的运动,以及一个或更多个其它相关对象(例如,球、裁判员等)的运动。在一些实施方式中,跟踪系统102可以是例如使用多个固定摄像机的基于光学的系统。例如,可以使用具有六个固定的经校准的摄像机的系统,这些摄像机可以将球员和球的三维位置投影到赛场的二维俯视图上。在一些实施方式中,跟踪系统102可以是基于无线电的系统,该系统例如使用由球员佩戴或嵌入在要跟踪的对象中的射频标识(rfid)标签。通常,可以将跟踪系统102配置成以高帧速率(例如,25hz)进行采样和记录。可以将跟踪系统102配置成,针对比赛文件110中的各个帧,至少存储比赛场地上所有队员和对象的球员身份和位置信息(例如,(x,y)位置)。
[0039]
比赛文件110可以利用与赛事数据相对应的其它赛事信息来扩充,诸如但不限于,比赛赛事信息(传球、投篮、失误等)以及背景信息(当前得分、剩余时间等)。
[0040]
可以将跟踪系统102配置成经由网络105与组织计算系统104进行通信。可以将组织计算系统104配置成,对跟踪系统102所捕获的数据进行管理和分析。组织计算系统104可以至少包括网络(web)客户端应用服务器114、预处理引擎116、数据存储部118以及比赛预测代理120。预处理引擎116和比赛预测引擎120中的每一者可以包括一个或更多个软件模块。所述一个或更多个软件模块可以是存储在介质(例如,组织计算系统104的存储器)上的代码或指令的集合,所述代码或指令的集合表示实现一个或更多个算法步骤的一系列机器指令(例如,程序代码)。这样的机器指令可以是组织计算系统104的处理器解释以实现该指令的实际计算机代码,或者另选地,可以是解释以获得实际计算机代码的指令的高级编码。所述一个或更多个软件模块还可以包括一个或更多个硬件组件。示例算法的一个或更多个方面可以由硬件组件(例如,电路)本身来执行,而不是作为指令的结果。
[0041]
可以将比赛预测代理120配置成针对给定比赛的结果生成“个性化预测”。在一些实施方式中,可以将比赛预测代理120配置成,在给定比赛开始之前(即,比赛尚未开始)生成该比赛的预测结果。因此,比赛预测代理120可以基于各个球队的推断的首发阵容来生成预测结果。在一些实施方式中,可以将比赛预测代理120配置成,在给定比赛开始之后(即,比赛已经开始)生成该比赛的预测结果。因此,可以将比赛预测代理120配置成动态地预测比赛期间的任何时间t的比赛结果。比赛预测代理120可以利用经训练的深度学习框架来学习各种球队特定属性、球员特定属性以及比赛背景属性,以生成预测结果。
[0042]
可以将数据存储部118配置成存储一个或更多个比赛文件124。各个比赛文件124可以包括空间赛事数据和非空间赛事数据。例如,空间赛事数据可以对应于由跟踪系统102从特定比赛或赛事捕获的原始数据。非空间赛事数据可以对应于一个或更多个变量,这些变量描述了在没有关联的空间信息的情况下在特定比赛中发生的事件。例如,非空间赛事
数据可以对应于特定比赛中的详细报道事件。在一些实施方式中,非空间赛事数据可以从空间赛事数据导出。例如,可以将预处理引擎116配置成对空间赛事数据进行解析以导出详细报道信息。在一些实施方式中,非空间赛事数据可以独立于空间赛事数据导出。例如,与组织计算系统相关联的管理员或实体可以分析各个比赛以生成这种非空间赛事数据。因此,出于本申请的目的,赛事数据可以对应于空间赛事数据和非空间赛事数据。
[0043]
在一些实施方式中,各个比赛文件124还可以包括主队得分记录表和客队得分记录表。例如,主队和客队的得分记录表可以包括在比赛进行期间各个时间t的球队助攻、犯规、篮板球(例如,进攻、防守、总计)、抢断以及失误的数量。在一些实施方式中,各个比赛文件124还可以包括球员得分记录表。例如,球员得分记录表可以包括球员助攻、犯规、篮板球、投篮、分数、罚球、罚球命中、封盖、失误的数量、上场时间、加/减度量、比赛已开始时间(game started)等。尽管上述度量是针对篮球进行讨论的,但是本领域技术人员容易理解,特定的度量可以基于运动而进行改变。例如,在英式足球中,主队和客队的得分记录表可以包括射门尝试、助攻、横传(cross)、射门等。
[0044]
可以将预处理代理116配置成处理从数据存储部118取回的数据。例如,可以将预处理代理116配置成生成可以被用于对与赛前模块202和/或赛中模块204相关联的一个或更多个神经网络进行训练的一个或更多个信息集合。预处理代理116可以扫描存储在数据存储部118中的一个或更多个比赛文件中的各个比赛文件,以标识与各个指定的数据集相对应的一个或更多个统计,并相应地生成各个数据集。例如,预处理代理116可以扫描数据存储部118中的所述一个或更多个比赛文件中的各个比赛文件,以标识各个球队的阵容以及与该阵容中的各个球员相关联的统计。
[0045]
客户端装置108可以经由网络105与组织计算系统104进行通信。客户端装置108可以由用户操作。例如,客户端装置108可以是移动装置、平板计算机、台式计算机、或者具有本文所描述的能力的任何计算系统。用户可以包括但不限于,个人,举例来说,诸如订户、客户端、潜在客户端、或者与组织计算系统104相关联的客户(诸如已从与组织计算系统104相关联的实体获得、将获得或者可能获得产品、服务或咨询的个人)。
[0046]
客户端装置108至少可以包括应用126。应用126可以表示允许访问网站或独立应用的web浏览器。客户端装置108可以访问应用126以访问组织计算系统104的一个或更多个功能。客户端装置108可以通过网络105进行通信,以例如从组织计算系统104的web客户端应用服务器114请求网页。例如,可以将客户端装置108配置成执行应用126,以访问由web客户端应用服务器114管理的内容。可以将显示给客户端装置108的内容从web客户端应用服务器114发送至客户端装置108,并随后由应用126进行处理,以通过客户端装置108的图形用户界面(gui)显示。
[0047]
图2根据示例实施方式更详细地例示了比赛预测代理120。比赛预测代理120可以包括:赛前模块202、赛中模块204以及接口模块206。
[0048]
可以将赛前模块202配置成,在比赛开始之前对比赛的结果进行预测。在高水平下,可以将赛前模块202配置成,例如基于比赛的提议首发阵容来对比赛的结果进行预测。更具体地,可以将赛前模块202配置成,至少基于球队特定嵌入、队员特定嵌入以及比赛背景来对比赛的结果进行预测。赛前模块202可以包括至少一个或更多个神经网络210以及一个或更多个完全训练的模型212。可以将各个神经网络210配置成学习特定的嵌入。例如,赛
前模块202可以包括:学习球队历史嵌入的第一神经网络、学习队员嵌入的第二神经网络以及学习最近队员嵌入的第三神经网络。可以将这样的嵌入作为输入提供给第四神经网络,该第四神经网络学习如何例如基于球队特定信息、球员特定信息以及比赛背景来对比赛结果进行预测。作为训练处理的结果,可以经由一个或更多个神经网络210生成一个或更多个完全训练的模型212。例如,作为训练处理的结果,可以将一个或更多个完全训练的模型212用于对比赛结果进行预测并执行“假设分析”。
[0049]
可以将赛中模块204配置成,在比赛开始之后对比赛的结果进行预测。例如,可以将赛中模块204配置成预测比赛期间的任何时间的结果。赛中模块204能够例如基于当前比赛背景、球队历史以及队员历史,来对比赛的结果进行预测。赛中模块204可以包括:神经网络模块220、随机森林分类器222、混合密度网络模块224以及一个或更多个完全训练的模型226。
[0050]
可以将神经网络模块220配置成,预测在给定时间哪些队员在赛事中(例如,在赛场上)。例如,可以将神经网络模块220配置成,学习如何基于球队特定信息、球员特定信息以及当前比赛状态来预测哪些队员在赛事中。赛中模块204可以利用来自数据存储部118的一个或更多个数据集,来对神经网络模块220进行训练。
[0051]
可以将随机森林分类器222配置成辅助对神经网络模块202进行训练。例如,赛中模块204可以训练随机森林分类器模型的集合,所述随机森林分类器模块使用阵容编码来报告模型的内部和外部性能。可以使用决策树分类器的集成(ensemble)来构建随机森林分类器。可以将决策树配置成基于传入的观察值来学习进行拆分(即,推断规则),以便标识目标变量的值。
[0052]
可以将混合密度网络模块224配置成基于来自神经网络模块202的预测出的阵容来生成比赛预测。例如,可以将混合密度网络配置成学习如何基于当前预测出的阵容、队员特定信息、球队特定信息以及当前比赛状态来对比赛结果进行预测。赛中模块204可以利用来自数据存储部118的一个或更多个数据集,来对混合密度网络模块224进行训练。
[0053]
作为训练处理的结果,可以经由一个或更多个神经网络220以及混合密度网络224来生成一个或更多个完全训练的模型212。例如,可以将一个或更多个完全训练的模型212用于对比赛期间的任何时间的比赛结果进行预测。
[0054]
赛前预测
[0055]
图3a是例示根据示例实施方式的神经网络架构300的框图。如图3a所示,可以利用神经网络架构来实现多种类型的输入特征:球队背景输入特征302、完整队员表现输入304、最近球员表现输入306以及比赛背景输入308。
[0056]
对于两个球队,可以基于对当前比赛之前的先前表现的详细细分来生成球队背景输入。例如,对于数据存储部118中的每一场比赛,赛前模块202可以选择以下最新比赛子集:由两个球队中的各个球队进行的、按日期排序的、成对排列的(例如,球队a的最新比赛与球队b的最新比赛、球队a的第二最新比赛与球队b的第二最新比赛等)以及由一个或更多个特征表征的最新比赛子集(例如,最近二十场比赛)。这样的特征可以包括但不限于两个:
[0057]
·
athomea、athomeb:二元变量,指示球队在先前的固定比赛是否在主场进行比赛。
[0058]
·
dataa、datab:从该前一比赛到待预测比赛之间的天数。
[0059]
·
rankaopp、promotedaopp、relegatedaopp、rankbopp、promotedbopp、relegatedbopp:
[0060]
在该最新比赛子集中,各个球队(球队a和球队b)所面对的球队的排名、上升以及下降指示。
[0061]
·
strengthdiffa、strengthdiffb:在该最新比赛子集中,球队与其以前的对手之间的联赛实力差异。
[0062]
·
wina、drawa、lossa、winb、drawb、lossb:在该最新比赛子集中,每场比赛中各个球队的结果。
[0063]
·
scorea、scoreaopp、egva、egvaopp、scoreb、scorebopp、egvb、egvbopp:在该最新比赛子集中,各个球队及其对手的进球数(实际得分和预期得分)。
[0064]
·
castylea、ststylea、hpstylea、ftstylea、dpstylea、crstylea、castyleb、ststyleb、hpstyleb、ftstyleb、dpstyleb、crstyleb:在该最新比赛子集中,各个球队及其对手的比赛风格。
[0065]
在一些实施方式中,这些特征可以从单独的stats框架(例如,英式足球的比赛风格分析工具)的输出中得出。可以将各个输出定义为:
[0066]
·
castylea:在该最新比赛子集中,主队打了多少次反攻(ca:counterattack)的指标。
[0067]
·
ststylea:在该最新比赛子集中,主队打了多少次持续威胁(st:sustainedthreat)的指标。
[0068]
·
pstylea:在该最新比赛子集中,主队打了多少次紧逼(hp:high press)的指标。
[0069]
·
ftstylea:在该最新比赛子集中,主队打了多少次快节奏(ft:fast tempo))的指示器。
[0070]
·
dpstylea:在该最新比赛子集中,主队打了多少次直接打(dp:directplay)的指标。
[0071]
·
crstylea:在该最新比赛子集中,主队打了多少次横传(cr:crossing)的指标。
[0072]
·
castyleb、ststyleb等,是客队的上述各个输出的对应物。
[0073]
·
反攻、持续威胁、紧逼、快节奏、直接打以及横传是可以进行测量的示例性比赛风格。
[0074]
可以基于一个或更多个特征来生成球员背景输入,所述特征描述了待预测比赛中所涉及的各个球队的首发阵容。阵容中的各个队员都可以使用他们在以前的出场中的表现来进行表征,其中各个队员皆可以使用以下指标进行衡量:
[0075]
·
minutesplayed:上场时间。
[0076]
·
射门、进球、egv:射门和进球的数量以及生成的egv数。
[0077]
·
obmp+、obmp-、dbmp、dbmp-:生成的球分布(进攻)和球破坏(防守)得分。
[0078]
·
passesmade、passescompleted、passpct、crossesmade、crossescompleted、crosspct:进行和完成的传球和横传次数、以及完成百分比。
[0079]
·
passesdefended、crossdefended、shotsblocked:防守的传球、横传以及射门的次数。
[0080]
·
foulsmade、foulsreceived:进行犯规的次数和被犯规次数。
[0081]
·
saves、esvfaced:(仅限守门员)救球次数、实际救球次数和预期救球次数。
[0082]
·
on-pitchshotsopp、on-pitchgoalsopp、on-pitchegvopp:由队员的对手在球场上生成的射门次数、进球数以及egv。
[0083]
最近球员表现输入可以表示球员表现输入的子集。例如,可以基于最近球员比赛子集(例如,最近五场比赛)来生成最近球员表现输入。
[0084]
可以基于捕获待预测比赛时的高级背景的一个或更多个特征来生成比赛背景输入,从而提供最近(例如,最近五场比赛)和更久远(例如,上赛季)的球队统计的一般概述。例如,比赛背景输入可以包括:
[0085]
·
strengthdiff:两个球队的国内联赛的实力之间的差异。例如,该值在国际竞赛中可以为非零,而在国内竞赛中可以为零。
[0086]
·
ranka、rankb:球队在国内联赛的前一赛季的最终排位。
[0087]
·
promoteda、promotedb、relegateda、relegatedb:指示各个球队在当前赛季是升级还是降级的二元变量。
[0088]
·
aggpointsa、aggscorea、aggscoreaopp、aggpointsb、aggscoreb、aggscorebopp:获胜的平均分、进球数以及失球数。在一些实施方式中,该度量可能仅限于最近球队统计(例如,最近五场比赛)。
[0089]
上述输入特征的组可以表示要使用数千个示例进行训练的模型的高维空间(例如,大约900个输入)。为了简化学习处理,赛前模块202可以生成一个或更多个嵌入,该嵌入具有比单独输入低的维。可以使用单独的完全连接的神经网络来生成各个嵌入,下面,对其中各个嵌入进行描述。例如,如图所示,可以经由神经网络302生成球队背景嵌入,可以经由神经网络304生成队员嵌入,以及可以经由神经网络306生成最近队员嵌入。图3b至图3d在下面更详细地例示了各个神经网络。
[0090]
图3b是例示根据示例实施方式的神经网络架构330的框图。可以将神经网络架构330用于生成球队历史嵌入。如图所示,神经网络结构330可以包括:输入数据332、数据预处理模块334、神经网络336以及输出340。
[0091]
输入数据332可以包括一个或更多个球队历史信息集合。例如,输入数据332可以包括一个或更多个球队历史信息集合,该球队历史信息集合包括以上结合图3a讨论的球队背景输入数据。如图所示,输入数据332可以包括针对主队和客队两者的球队历史信息。这样的信息可以包括各个球队的预定量的比赛。例如,输入数据332中所示的数据可以包括来自各个球队的20场先前表现的数据。
[0092]
可以将数据预处理模块330配置成,在输入至神经网络336之前对输入数据332进行处理。例如,可以将数据预处理模块330配置成使输入数据332归一化。在一些实施方式中,还可以将数据预处理模块330配置成使输入数据332变平。
[0093]
然后,赛前模块202可以经由经预处理的球队历史信息来对神经网络336进行训练。神经网络336可以包括一个或更多个层338
1-3384。一个或更多个层可以包括三个隐藏层338
1-3383。层3381可以包括200个节点;层3382可以包括40个节点;以及层3383可以包括15个节点。各个层338
1-3383可以包括整流线性单元作为激活函数。层3384(即,神经网络336中的最后一层)可以是线性层。
[0094]
可以使用均方误差和adam优化的组合来对神经网络336进行训练。来自神经网络
336的输出可以是针对球队历史的嵌入集合。
[0095]
图3c是例示根据示例实施方式的神经网络架构350的框图。可以将神经网络架构350用于生成队员嵌入。如图所示,神经网络架构350可以包括输入数据352、354、数据求和模块356、358、数据预处理模块364、神经网络366以及输出370。
[0096]
输入数据352可以包括主队的各个队员的一个或更多个队员信息集合。例如,输入数据352可以包括一个或更多个队员信息集合,所述队员信息集合包括以上结合图3a讨论的队员背景输入数据。这样的信息可以反映各个球员的所有表现。例如,输入数据352可以包括各个主队队员1-11的所有表现的总和。
[0097]
输入数据354可以包括客队的各个队员的一个或更多个队员信息集合。例如,输入数据354可以包括一个或更多个队员信息集合,所述队员信息集合包括以上结合图3a讨论的队员背景输入数据。这样的信息可以反映各个球员的所有表现。例如,输入数据354可以包括各个客队队员1-11的所有表现的总和。
[0098]
可以将求和模块356配置成对输入数据352中的各个主队队员的所有值求和(或合计)。例如,可以将求和模块356配置成将各个主队球员的所有值加在一起,从而生成表示主队所有队员的单一数据集。因此,求和模块356可以输出表示主队的一个或更多个队员的主队阵容特征360的集合。
[0099]
可以将求和模块358配置成对输入数据354中的各个客队队员的所有值求和(或合计)。例如,可以将求和模块358配置成将各个客队球员的所有值加在一起,从而生成表示客队所有队员的单一数据集。因此,求和模块358可以输出表示客队的一个或更多个队员的客队阵容特征360的集合。
[0100]
可以将数据预处理模块364配置成在向神经网络366输入主队阵容特征360和客队阵容特征362之前对主队阵容特征360和客队阵容特征362进行处理。例如,可以将数据预处理模块360配置成使与主队阵容特征360和客队阵容特征362相对应的数据集归一化。
[0101]
然后,赛前模块202可以经由经预处理的主队阵容特征360和客队阵容特征362来对神经网络366进行训练。神经网络366可以包括一个或更多个层368
1-3684。一个或更多个层可以包括三个隐藏层368
1-3683。层3681可以包括200个节点;层3682可以包括40个节点;以及层3683可以包括15个节点。各个层368
1-3683可以包括修正线性单元作为激活函数。层3684(即,神经网络366中的最后一层)可以是线性层。
[0102]
可以使用均方误差和adam优化的组合来对神经网络366进行训练。adam优化算法是一种对限定神经网络的参数进行调谐的方法,并且是随机梯度下降法的扩展。优化算法迭代地调整神经网络的参数,以便生成与所提供的示例最匹配的预测。adam优化与经典梯度随机梯度下降法的不同之处在于,adam针对各个网络参数调整学习速率,而不是使用固定速率。adam优化在机器学习社区中被广泛采用,因为它已经证明可以快速取得良好的结果。来自神经网络366的输出可以是针对所述一个或更多个队员的嵌入集合(即370)。
[0103]
图3d是例示根据示例实施方式的神经网络架构380的框图。可以将神经网络架构380用于生成近来队员嵌入。如图所示,神经网络架构380可以包括输入数据382、384、数据求和模块386、388、数据预处理模块394、神经网络396以及输出399。
[0104]
输入数据382可以包括主队的各个队员的一个或更多个队员信息集合。例如,输入数据382可以包括一个或更多个队员信息集合,所述队员信息集合包括以上结合图3a讨论
的队员背景输入数据。这样的信息可以反映主队的各个球员的最近表现的子集。例如,输入数据382可以包括最近五场比赛中各个主队队员1-11的所有表现的总和。
[0105]
输入数据384可以包括客队的各个队员的一个或更多个队员信息集合。例如,输入数据384可以包括一个或更多个队员信息集合,所述队员信息集合包括以上结合图3a讨论的队员背景输入数据。这样的信息可以反映客队的各个球员的最近表现的子集。例如,输入数据384可以包括最近五场比赛中各个客队队员1-11的所有表现的总和。
[0106]
可以将求和模块386配置成对输入数据382中的各个主队队员的所有值求和(或合计)。例如,可以将求和模块386配置成将各个主队球员的所有值加在一起,从而生成表示主队所有队员的单一数据集。因此,求和模块386可以输出表示主队的一个或更多个队员的主队阵容特征390的集合。
[0107]
可以将求和模块388配置成,对输入数据384中的各个客队队员的所有值求和(或合计)。例如,可以将求和模块388配置成将各个客队球员的所有值加在一起,从而生成表示客队所有队员的单一数据集。因此,求和模块388可以输出表示客队的一个或更多个队员的客队阵容特征390的集合。
[0108]
可以将数据预处理模块394配置成在向神经网络396输入主队阵容特征390和客队阵容特征392之前对主队阵容特征390和客队阵容特征392进行处理。例如,可以将数据预处理模块390配置成使与主队阵容特征390和客队阵容特征392相对应的数据集归一化。
[0109]
然后,赛前模块202可以经由预处理的主队阵容特征390和客队阵容特征392来对神经网络396进行训练。神经网络396可以包括一个或更多个层398
1-3984。一个或更多个层可以包括三个隐藏层398
1-3983。层3981可以包括200个节点;层3982可以包括40个节点;以及层3983可以包括15个节点。各个层398
1-3983可以包括修正线性单元作为激活函数。层3984(即,神经网络396中的最后一层)可以是线性层。
[0110]
可以使用均方误差和adam优化的组合来对神经网络396进行训练。来自神经网络396的输出可以是针对所述一个或更多个队员的最近表现的嵌入集合(即,399)。
[0111]
所述一个或更多个嵌入能够执行输入的非线性降维,但根据外部目标进行监督,以确保可以根据相关标准将输入的组合引导到关注的任务。
[0112]
返回参照图3a,如图所示,可以将球队嵌入340、队员嵌入370、最近队员嵌入399以及比赛背景308用作神经网络310的输入。神经网络310可以是完全连接的神经网络。神经网络310可以包括两个隐藏层3121和3122,然后是softmax函数3123。隐藏层3121的大小可以为30;隐藏层3122的大小可以为10。隐藏层3121、3122中的各个隐藏层可以使用修正线性单元函数作为其激活函数。最后一层3123可以具有三个输出,每个可能的比赛结果(主队获胜、平局、客队获胜)有一个输出,以及通过使训练数据集的平均交叉熵损失最小化来计算的一个或更多个权重。输出314可以是对给定比赛的预测(例如,主队获胜、平局、客队获胜)。
[0113]
图4是例示根据示例实施方式的生成对赛前结果进行预测的预测模型的方法400的流程图。方法400可以以步骤402开始。
[0114]
在步骤402,赛前模块202可以从数据存储部118接收一个或更多个信息集合。数据存储部118可以包括:捕获每次触球的、具有xy坐标和时间戳的空间赛事数据;以及非空间赛事数据,即,对在没有关联的空间信息的情况下发生的赛事进行描述的一个或更多个变量。因此,赛前模块202能够在空间和时间上重建比赛,并因此,能够构建验证复杂性的性能
指标。此类性能指标可以包括:
[0115]
·
传统统计:传球、横传和射门的计数,以及它们的结果(完成/丢球、救球/得分等)。
[0116]
·
比赛风格:球队在拥有球权时如何进行比赛。这可以与多种预定义的风格一起进行评估,诸如但不限于:直接打、反攻、加强、快节奏以及紧逼。
[0117]
·
预期度量:给定射门基于其特性而被计分的概率。例如,为了生成预期进球值(egv),可以将射门的位置、射门的类型以及射门之前的比赛特征用于获得其(egv)。
[0118]
·
球移动点:从球分布和球破坏的角度来看球员表现的指标。可以对每个球员的控球(例如,开始位置、结束位置以及结果)进行分析,然后可以指派对该控球对他们的球队的价值进行估计的值。在一些实施方式中,该值对于有益的贡献可以为正,或者对于成功的贡献可能为负,并且在进攻方面(obmp)和防守方面(dbmp)都会对其进行评估。
[0119]
在步骤404,赛前模块202可以为各个神经网络架构构建一个或更多个数据集。赛前模块202可以解析接收到的一个或更多个信息集合,以构建针对神经网络336的球队历史特征的第一数据集。赛前模块202可以解析接收到的一个或更多个信息集合,以构建针对神经网络366的队员表现特征的第二数据集。赛前模块202可以解析接收到的一个或更多个信息集合,以构建针对神经网络396的队员表现特征的第三数据集。
[0120]
在步骤406,赛前模块202可以基于球队历史特征来生成一个或更多个球队历史嵌入。例如,赛前模块202可以实现神经网络336以生成所述一个或更多个球队历史嵌入。神经网络336可以取与球队历史特征相关的一个或更多个度量作为输入。此类指标可以包括但不限于,在预定义数量的赛事中主队表现以及在预定义数量的赛事中客队表现。可以将这样的信息用于对神经网络336进行训练,以生成所述一个或更多个球队历史嵌入。
[0121]
在步骤408,赛前模块202可以基于队员表现特征来生成一个或更多个球队队员嵌入。例如,赛前模块202可以实现神经网络366以生成所述一个或更多个队员嵌入。神经网络366可以跨各个球队的各个队员的所有以前比赛,取与队员表现相关的一个或更多个度量作为输入。可以将这样的信息用于对神经网络366进行训练,以生成所述一个或更多个球队历史嵌入。
[0122]
在步骤410,赛前模块202可以基于最近队员表现特征来生成一个或更多个球队最近队员嵌入。例如,赛前模块202可以实现神经网络396以生成所述一个或更多个队员嵌入。神经网络396可以跨各个球队的各个队员的最新比赛的子集,取与最近队员表现相关的一个或更多个度量作为输入。例如,神经网络396可以取与最近五场比赛中的队员表现相关的一个或更多个度量作为输入。可以将这样的信息用于对神经网络396进行训练,以生成所述一个或更多个最近球队历史嵌入。
[0123]
在步骤412,赛前模块202可以生成与比赛背景特征相关的第四数据集。例如,赛前模块202可以解析所接收的一个或更多个信息集合,以构建以标识与比赛背景相关的一个或更多个特征以与神经网络310一起使用。这样的功能可以包括围绕各个待预测比赛的高级背景,从而提供最近(例如,最近五场比赛)和更久远(例如,上赛季)表现的一般观点。
[0124]
在步骤414,赛前模块202可以学习如何基于球队历史嵌入、队员历史嵌入、最近队员嵌入以及比赛背景来对比赛的结果进行预测。例如,可以使用球队历史嵌入、球员嵌入、最近球员嵌入以及比赛背景的组合作为输入,来对神经网络310进行训练。神经网络310的
权重可以例如通过减少(例如,最小化)数据集上的平均交叉熵损失来计算。
[0125]
在步骤416,赛前模块202可以将各个比赛的预测结果与各个比赛的实际结果进行比较。例如,轨迹代理120可以利用交叉熵损失和adam优化器,来使所推断出的结果(即,来自神经网络310的输出)与实际结果(例如,来自数据存储部118)之间的误差最小化。
[0126]
图5a是例示根据示例实施方式的图形用户界面(gui)500的框图。可以由接口模块206生成gui 500。在一些实施方式中,可通过应用126使一个或更多个最终用户可以使用gui 500。在一些实施方式中,比赛预测代理120可以经由应用126将gui 500发送至一个或更多个客户端装置106,以使各个客户端装置106可以渲染和显示gui 500。
[0127]
gui 500可以包括用于比赛的球队的当前首发阵容501的可视表示。如图所示,gui 500可以包括当前首发阵容中的各个队员502
1-502
11
(通常为“队员502”)的可视表示,以及基于该当前首发阵容的即将到来比赛的预测结果504。经由gui 500,最终用户可以替换当前首发阵容中的队员以生成提议的首发阵容。例如,如图所示,最终用户可以用新的队员506替换队员5021。
[0128]
图5b是例示根据示例实施方式的图形用户界面(gui)550的框图。在用户利用新的队员替换图5a中的队员502之后,可以由接口模块206生成gui 550。在一些实施方式中,可通过应用126使一个或更多个最终用户可以使用gui 550。在一些实施方式中,比赛预测代理120可以经由应用126将gui 550发送至一个或更多个客户端装置106,以使各个客户端装置106可以渲染和显示gui 550。
[0129]
当用户利用新的队员506替换队员5021时,比赛预测代理120可以基于调整后的首发阵容551来生成新的预测结果。例如,比赛预测代理120可以解析接收到的输入,并且可以基于调整后的首发阵容来生成新的赛前结果预测554。因此,接口代理156可以生成更新后的gui 530,该更新后的gui 530用更新后的预测结果来反映调整后的首发阵容与。
[0130]
图6是例示根据示例实施方式的生成赛前预测的方法600的流程图。方法600可以以步骤602开始。
[0131]
在步骤602,比赛预测代理120可以生成图形用户界面,该图形用户界面包括给定比赛的球队的当前阵容。例如,接口模块206可以生成gui 500,该gui 500例示了特定比赛的当前首发阵容。当前首发阵容可以包括被选择来开始该特定比赛的一个或更多个队员。
[0132]
在步骤604,比赛预测代理120可以将gui 500发送至客户端装置106。例如,比赛预测代理120可以经由在客户端装置106上执行的应用126将gui 500发送至该客户端装置。客户端装置106可以接收gui 500、渲染gui 500以及为一个或更多个最终用户显示gui 500。
[0133]
在步骤606,比赛预测代理120可以经由gui 500接收将当前阵容中的第一队员更改为第二队员的指示。例如,比赛输入代理可以接收用队员5021替换队员506的指示。
[0134]
在步骤608,响应于接收到该指示,比赛预测代理120可以基于调整后的首发阵容来生成比赛的预测结果。例如,赛前模块202可以利用预测模型来生成赛事的预测结果。在一些实施方式中,赛前模块202可以收集球队特定信息、队员特定信息以及比赛背景,并且将这样的信息提供给由神经网络架构300表示的神经网络。
[0135]
在步骤610,比赛预测代理120可以更新gui 500以包括所生成的预测结果。例如,接口模块206可以生成gui 550,该gui包括调整后的阵容和新的预测结果的图形表示。
[0136]
赛中预测
[0137]
如上所述,在比赛进行期间,可以将赛中模块204配置成针对给定比赛的结果生成个性化预测。例如,可以将赛中模块204配置成基于当前比赛背景、球队背景(主队和客队两者)、队员背景(主队和客队两者)以及比赛中的当前队员的组合,来对比赛的结果进行预测。
[0138]
图7a是例示根据示例实施方式的神经网络220的神经网络架构700的框图。可以将神经网络架构700用于对当前正在比赛中的各个球队的阵容进行预测。
[0139]
为了训练神经网络220,可以生成数据集。所述数据集可以包括来自多个赛季期间超过800万场篮球比赛的详细报道事件的数据。各个详细报道事件p
t
可以用比赛时间、控球权以及得分差异来进行描述,从而表示基本特征集。在一些实施方式中,可以通过包含主队身份和客队身份以及赛事代码来增强基本特征集((即,)。
[0140]
如图7a所示,可以将p
t
、x
t
以及l
t
用作神经网络220的输入。x
t
可以表示主队和客队各自的得分记录表。例如,x
t
可以表示各个球队在比赛中直到时间t所合计的得分记录表。这样的信息可以包括但不限于,球队助攻、球队封盖、球队犯规、球队篮板球(例如,进攻、防守以及总计)、球队抢断、球队失误等。
[0141]
l
t
可以表示各场比赛的各个球队的赛前阵容。例如,可以为各个球队(i)的各个球员(j)构建各个比赛的阵容向量并且该阵容向量包括:球员身份、首发球员和可用性标志、赛季迄今上场的比赛、比赛首发、上场时间、加分-减分、每场比赛分钟数、每场比赛加分-减分、每场比赛犯规数等。球队阵容可以由n个这样的向量的并集形成,其中,对于少于n个球员的花名册,使用空白向量(例如零)填充。l
t
可以是主队阵容和客队阵容的连接。
[0142]
神经网络220可以设定有以下任务:在给定阵容特征l
t
、当前比赛状态p
t
以及得分记录表x
t
的情况下,对在每个比赛时间t哪些球员在场上进行预测(o
t
)。
[0143]
神经网络220可以包括具有relu激活的四个完全连接的编码层。例如,神经网络220可以包括:具有256个单元的第一层702、具有256个单元的第二层704、具有128个单元的第三层706以及具有10个单元的第四层708。尽管未示出,但是神经网络220可以包括在各个层704-708之后的防过拟合(dropout)层。最后的编码层(即,第四层708)可以给出要由其它模型使用的编码特征e
t
。可以将随机森林分类器222训练成使用编码特征e
t
,并且报告这些模型的内部和外部性能。
[0144]
为了预测o
t
,神经网络220可以分别利用具有15个单元和relu激活的完全连接层(即,层210)以及具有30个单元和sigmoid激活的完全连接层(例如,层212)这两者来对编码数据进行解码。为了训练神经网络220,赛中模块204可以使用adam优化经由反向传播来减小(例如,最小化)交叉熵。
[0145]
在一些实施方式中(例如,篮球),由于只有十个有效的场上标志,因此赛中模块可以对交叉熵进行加权,以避免场下的所有队员的平凡解。
[0146]
图7b是例示根据示例实施方式的混合密度网络224的混合密度网络架构750的框图。可以对混合密度网络224进行训练,以对给定比赛中的得分差异分布(例如,最终得分差异分布)进行预测。混合密度网络224的使用允许使用神经网络架构与反向传播的组合来找到最优的混合参数集合。
[0147]
如图所示,混合密度网络224可以接收l
t
、x
t
、o
t
以及p
t
作为输入。混合密度网络224可以包括:完全连接层752、批量归一化层756、密集层758以及输出层760。完全连接层752可以具有tanh激活函数和128个单元。批量归一化层756可以位于完全连接层752的输出处。赛中模块204可以经由密集层758将p
t
重新注入混合密度网络。密集层758可以位于批量归一化层756的输出处。密集层758可以包括tanh激活函数和64个单元。在密集层758之后可以是输出层760。输出层760可以包括一个或更多个线性激活。
[0148]
来自混合密度网络224的输出可以是n=10个高斯分布的混合的参数,使得比赛结束时得分差异可以具有以下分布:
[0149][0150]
其中,π
i
可以是第i
th
分布的权重,并且μ
i
和σ
i
可以分别是第i
th
高斯的均值和标准偏差,并且s=主队得分-客队得分。在训练期间,赛中模块204可以降低(例如,最小化)负对数可能性以找到最优的混合参数集合{π
i
,μ
i
,σ
i
},i∈[0,n]。
[0151]
因此,不是生成提供主队获胜、平局、客队获胜的结果的输出,而是可以将混合密度网络224配置成生成客队与主队之间的推测得分差异。通过预测得分差异分布,赛中模块204可以允许各种结果的可能性以及对不确定性的量度。换句话说,赛中模块204可以将结果预测的任务表述为一(比赛状态)对多(可能的得分差异)的问题。
[0152]
图8是例示根据示例实施方式的生成对赛中结果进行预测的预测模型的方法800的流程图。方法800可以以步骤802开始。
[0153]
在步骤802,赛中模块204可以从数据存储部118接收一个或更多个信息集合。数据存储部118可以包括:捕获每次触球的、具有xy坐标和时间戳的空间赛事数据;以及非空间赛事数据,该非空间赛事数据捕获对在没有关联的空间信息的情况下发生的赛事进行描述的一个或更多个变量。例如,赛中模块204可以标识对赛中预测模型进行训练的数据集。例如,赛中模块204可以对以下数据集进行编译:该数据集包括来自2002-2003到2016-2017赛季超过870万场篮球比赛的详细报道事件。
[0154]
在步骤804,赛中模块204可以构建表示球队特定统计的第一向量。赛中模块204可以通过对从数据存储部118接收到的所述一个或更多个信息集合进行解析来生成第一向量,并且标识针对球队度量的那些信息集合。例如,赛中模块204可以构建包括各个球队的得分记录表的第一向量x
t
。各个球队的得分记录表可以被合计直到时间t,并且包括:球队助攻、球队犯规、球队篮板球(例如,进攻、防守以及总计)、球队抢断以及球队失误。
[0155]
在步骤806,赛中模块204可以构建表示队员特定统计的第二向量。赛中模块204可以通过对从数据存储部118接收到的所述一个或更多个信息集合进行解析来生成第二向量,并且标识针对单独队员度量的那些信息集合。赛中模块204可以构建第二向量l
t
,该第二向量可以表示各场比赛的各个球队的赛中阵容。例如,可以为各个球队(i)的各个球员(j)构建各个比赛的阵容向量并且该阵容向量包括:球员身份、首发球员和可用性标志、赛季迄今上场的比赛、比赛首发、上场时间、加分-减分、每场比赛分钟数、每场比赛加分-减分、每场比赛犯规数等。球队阵容可以由n个这样的向量的连接形成,其中,对于少
于n个球员的花名册,使用空白向量(例如零)填充。l
t
可以是主队阵容和客队阵容的连接。
[0156]
在步骤808,赛中模块204可以构建第三向量,该第三向量表示所述一个或更多个信息集合中的跨所有比赛的一个或更多个详细报道事件。例如,赛中模块204可以生成第三向量p
t
,该第三向量包括一个或更多个详细报道事件,该详细报道事件可以用比赛时间、控球权以及得分差异来进行描述,从而表示基本特征集。在一些实施方式中,可以通过包含主队身份和客队身份以及赛事代码来增强基本特征集(即,)。
[0157]
在步骤810,赛中模块204可以预测各个时间t时当前在比赛中(例如,在赛场上)的一个或更多个球员。赛中模块204可以对神经网络220进行训练,以对当前在比赛中的所述一个或更多个球员进行预测。例如,神经网络220可以设定有以下任务:在给定阵容特征l
t
、当前比赛状态p
t
以及得分记录表x
t
的情况下,对在每个比赛时间t哪些球员在场上进行预测(o
t
)。为了训练神经网络220,赛中模块204可以使用adam优化经由反向传播来减小(例如,最小化)交叉熵。因此,来自神经网络220的输出可以是表示在各个时间t两个球队的在比赛中的所述一个或更多个队员的向量o
t

[0158]
在步骤812,赛中模块204可以生成各个时间t时各个比赛的预测最终得分。赛中模块204可以对混合密度网络224进行训练,以对给定比赛中的得分差异分布进行预测。混合密度网络224的使用允许使用神经网络架构与反向传播的组合来找到最优的混合参数集合。混合密度网络224可以接收l
t
、x
t
、o
t
以及p
t
作为输入。因此,来自混合密度网络224的输出可以是每场比赛在各个时间t期间的一个或更多个得分差异集合。
[0159]
在步骤814,赛中模块204可以减少(或最小化)找到最优集合的可能性。来自混合密度网络224的输出可以是n=10个高斯分布的混合的参数,使得比赛结束时的得分差异可以具有以下分布:
[0160][0161]
其中,π
i
可以是第i
th
分布的权重,并且μ
i
和σ
i
可以分别是第i
th
高斯的均值和标准偏差,并且s=主队得分-客队得分。在训练期间,赛中模块204可以减少(例如,最小化)负对数可能性以找到最优的混合参数集合{π
i
,μ
i
,σ
i
},i∈[0,n]。
[0162]
图9是例示根据示例实施方式的图形用户界面(gui)900的框图。可以由接口模块206生成gui 900。在一些实施方式中,可通过应用126使一个或更多个最终用户可以使用gui 900。在一些实施方式中,比赛预测代理120可以经由应用126将gui 900发送至一个或更多个客户端装置106,以使各个客户端装置106可以渲染和显示gui 900。
[0163]
gui 900可以包括图形902。图形902可以描绘十二个不同比赛时间t的标绘图如图所示,可以沿着y轴标绘t,并且可以沿着x轴标绘预测得分差异。如图所示,由赛中模块204生成的预测可以是多模态的,从而反映比赛可能有的无数可能结果。如图所示,初始预测可能是比赛特定的。如进一步所示,随着比赛的进行和比赛状态的改变(即,一个或更多个线条904),模型分布同样可以演变,通常会显示状态切换和均值随时间位移。这样,的演变可能是背景和比赛特定的。随着得分差异的波动,所述一个
或更多个预测可能会在两个初始状态之间波动。实际得分可以由实线906表示。
[0164]
如图所示,所述分布可能不会随时间而崩溃或变窄。分布方差对比赛时间的明显不敏感性可以是当前预测架构的markovian性质的函数。由赛中模块204实现的所述一个或更多个模型可能对比赛中剩余多少时间没有感觉,而仅对已经过去的某一时间量有感觉。
[0165]
图10是例示根据示例实施方式的,使用图8中生成的预测模型来生成比赛的赛中预测得分的方法1000的流程图。方法1000可以以步骤1002开始。
[0166]
在步骤1002,赛中模块204可以接收赛事数据。例如,赛中模块204可以从跟踪系统102实时地、接近实时地或者定期地接收当前进行中的比赛的一个或更多个赛事数据集合。作为另一示例,赛中模块204可以从一个或更多个计算系统实时地、接近实时地或者定期地从与组织计算系统104相关联的实体导出的一个或更多个赛事数据集合。这样的赛事数据可以包括比赛活动(matchplay)的一个或更多个特征(例如,详细报道事件)。尽管方法1000讨论了实况(或近实况)数据的使用,但是本领域技术人员理解可以利用历史数据执行这样的操作。
[0167]
在步骤1004,赛中模块204可以从客户端装置106接收请求,以生成比赛在特定时间t的预测得分,诸如但不限于,对比赛期间的各个时间t的比赛最终得分进行预测。例如,赛中模块204可以经由在该客户端装置106中执行的应用126来接收来自该客户端装置的请求。尽管方法1000包括操作1004,但是本领域技术人员可以理解,赛中模块204不需要等待来自最终用户的显式请求来生成比赛的预测得分;相反,随着比赛的进行,赛中模块204可以按需动态地生成一个或更多个预测得分。
[0168]
在步骤1006,赛中模块204可以构建表示球队特定统计的第一向量。赛中模块204可以通过解析赛事数据来生成第一向量,并且标识针对球队度量的那些信息集合。例如,赛中模块204可以构建包括各个球队的直到时间t的得分记录表的第一向量x
t
。各个球队的得分记录表可以包括但不限于:球队助攻、球队犯规、球队篮板球(例如,进攻、防守以及总计)、球队抢断以及球队失误。
[0169]
在步骤1008,赛中模块204可以构建表示球员特定统计的第二向量。赛中模块204可以通过解析接收到的赛事数据以标识各个球队的阵容中的一个或更多个队员来生成第二向量。赛中模块204可以从数据存储部118取回与各个队员相关联的一个或更多个队员特定统计。赛中模块204可以构建第二向量l
t
,该第二向量可以表示各场比赛的各个球队的赛前阵容。例如,可以为各个球队(i)的各个球员(j)构建各个比赛的阵容向量并且阵容向量包括:球员身份、首发球员和可用性标志、赛季迄今上场的比赛、首发上场的比赛、上场时间、加分-减分、每场比赛分钟数、每场比赛加分-减分、每场比赛犯规数等。球队阵容可以由n个这样的向量的并集形成,其中,对于少于n个球员的花名册,使用空白向量(例如零)填充。l
t
可以是主队阵容和客队阵容的连接。
[0170]
在步骤1010,赛中模块204可以构建第三向量,该第三向量表示直到时间t的所有详细报道事件。例如,赛中模块204可以生成第三向量p
t
,该第三向量包括一个或更多个详细报道事件,该详细报道事件可以用比赛时间、控球权以及得分差异来进行描述,从而表示基本特征集。在一些实施方式中,可以通过包含主队身份和客队身份以及赛事代码来增强基本特征集((即,)。
[0171]
在步骤1012,赛中模块204可以标识当前在比赛中的一个或更多个队员(例如,当前在赛场上的一个或更多个队员)。在一些实施方式中,赛中模块204可以通过对直到时间t的详细报道赛事进行解析,来标识当前在比赛中的一个或更多个队员。在一些实施方式中,赛中模块204可以利用经训练的神经网络220来预测哪些队员当前正在比赛中,以预测当前在比赛中的所述一个或更多个球员。例如,在给定阵容特征l
t
、当前比赛状态p
t
以及得分记录表x
t
的情况下,神经网络220可以按时间t对哪些球员在场上进行预测(o
t
)。来自神经网络220的输出可以是表示在各个时间t时两个球队的比赛中的所述一个或更多个队员的向量o
t

[0172]
在步骤1014,赛中模块204可以生成比赛的预测结果。例如,赛中模块204可以基于在时间t生成的信息来生成预测最终得分。赛中模块204可以向经训练的混合密度网络224提供l
t
、x
t
、o
t
以及p
t
作为输入。来自混合密度网络224的输出可以是每场比赛在各个时间t期间的一个或更多个得分差异集合。
[0173]
图11a例示了根据示例实施方式的系统总线计算系统架构1100。系统1100可以表示组织计算系统104的至少一部分。系统1100的一个或更多个组件可以使用总线1105彼此电连通。系统1100可以包括处理单元(cpu或处理器)1110和系统总线1105,系统总线将包括诸如只读存储器(rom)1120和随机存取存储器(ram)1125的系统存储器1115的各种系统组件联接至处理器1110。系统1100可以包括与处理器1110直接连接、紧靠着该处理器或者集成为该处理器的一部分的高速存储器的高速缓存。系统1100可以将数据从存储器1115和/或存储装置1130复制到高速缓存1112,以供处理器1110快速访问。以这种方式,高速缓存1112可以提供性能提升,从而避免了处理器1110在等待数据时的延迟。这些和其它模块可以控制或者被配置成控制处理器1110以执行各种动作。其它系统存储器1115同样可以获取以供使用。存储器1115可以包括具有不同性能特征的多种不同类型的存储器。处理器1110可以包括任何通用处理器以及硬件模块或软件模块(诸如存储在存储装置1130中的服务11132、服务21134以及服务31136),硬件模块或软件模块被配置成控制处理器1110以及将软件指令并入到实际处理器设计中的专用处理器。处理器1110本质上可以完全自含计算系统,包含多个核心或处理器、总线、存储区控制器、高速缓存等。多核心处理器可以是对称或不对称的。
[0174]
为了使得用户能够与计算装置1100进行交互,输入装置1145可以表示任何数量的输入机构,诸如用于语音的麦克风、用于手势或图形输入的触敏屏、键盘、鼠标器、运动输入、语音等等。输出装置1135还可以是本领域技术人员已知的许多输出机构中的一种或更多种。在一些情况下,多模态系统可以使得用户能够提供多种类型的输入,以与计算装置1100进行通信。通信接口1140可以总体上支配并管理用户输入和系统输出。在针对任何特定硬件排布结构的操作方面不存在限制,因此,这里的基本特征可以随着对它们的开发而用改进的硬件或固件排布结构来替换。
[0175]
存储装置1130可以是非易失性存储器,并且可以是硬盘或者可以存储可由计算机访问的数据的其它类型的计算机可读介质,诸如磁带、闪存卡、固态存储器装置、数字通用盘、盒式磁带、随机存取存储器(ram)1125、只读存储器(rom)1120以及这些的混合。
[0176]
存储装置1130可以包括对处理器1110进行控制的服务1132、1134及1136。预期了其它硬件或软件模块。可以将存储装置1130连接至系统总线1105。在一个方面,执行特定功
能的硬件模块可以包括执行所述功能的软件组件,该软件组件存储在与必需的硬件组件(诸如处理器1110、总线1105、显示器1135等)相连接的计算机可读介质中。
[0177]
图11b例示了具有芯片组架构的计算机系统1150,该芯片组架构可以表示组织计算系统104的至少一部分。计算机系统1150可以是可以被用于实现所公开技术的计算机硬件、软件以及固件的示例。系统1150可以包括处理器1155,处理器1155代表任何数量的物理上和/或逻辑上不同的资源,所述资源能够执行被配置成执行所标识的计算的软件、固件以及硬件。处理器1155可以与芯片组1160进行通信,该芯片组可以控制处理器1155的输入以及来自处理器1155的输出。在该示例中,芯片组1160将信息输出至诸如显示器的输出端1165,并且可以读取信息并将信息写入至存储装置1170,该存储装置例如可以包括磁性介质和固态介质。芯片组1160还可以从ram 1175读取数据并且将数据写入ram 1175。可以提供用于与多种用户接口组件1185进行接口连接的桥接部1180,以与芯片组1160进行接口连接。这样的用户接口组件1185可以包括:键盘、麦克风、触摸检测和处理电路、指点装置(诸如鼠标)等。一般而言,系统1150的输入可能来自多种机器生成和/或人工生成的来源中的任一种。
[0178]
芯片组1160还可与可能具有不同的物理接口的一个或更多个通信接口1190进行接口连接。这样的通信接口可以包括用于有线和无线局域网的接口、用于宽带无线网络的接口以及用于个人区域网络的接口。生成、显示及使用本文所公开的gui的方法的一些应用可以包括通过物理接口接收排序的数据集,或者通过处理器1155对存储在存储部1170或1175中的数据进行分析来由机器本身生成。此外,该机器可以通过用户接口组件1185从用户接收输入,并通过使用处理器1155对这些输入进行解释来执行恰当的功能,诸如浏览功能。
[0179]
可以理解,示例系统1100和1150可以具有超过一个处理器1110,或者可以是连网在一起以提供更大处理能力的计算装置组或集群的一部分。
[0180]
虽然前述致力于本文所公开的实施方式,但是可以在不脱离本公开的基本范围的情况下,设想其它和进一步的实施方式。例如,可以采用硬件或软件或者硬件和软件的组合来实现本公开的各方面。可以将本文所描述的一个实施方式实现为供与计算机系统一起使用的程序产品。该程序产品中的程序限定了所述实施方式(包括本文所描述的方法)的功能并且可以被包含在多种计算机可读存储介质上。例示性计算机可读存储介质包括但不限于:(i)永久性存储信息的不可写存储介质(例如,计算机内的只读存储器装置,诸如可通过cd-rom驱动器读取的cd-rom盘、闪速存储器、rom芯片或者任何类型的固态非易失性存储器);以及(ii)存储可更改信息的可写存储介质(例如,磁盘驱动器内的软盘或硬盘驱动器或者任何类型的固态随机存取存储器)。这种计算机可读存储介质在执行引导所公开的实施方式的功能的计算机可读指令时是本公开的实施方式。
[0181]
本领域技术人员将意识到,前述示例是示例性的而非限制性的。意图是,对于本领域技术人员而言,通过阅读本说明书和研究附图,所有的置换、增强、等同物以及改进都是显而易见的,并且均被包括在本公开的真实精神和范围内。因此,意图是附权利要求包括落入这些教导的真实精神和范围内的所有这样的修改、置换和等同物。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1