通过无监督学习在体育运动中生成角色的制作方法

文档序号:31408884发布日期:2022-09-03 08:12阅读:102来源:国知局
通过无监督学习在体育运动中生成角色的制作方法
通过无监督学习在体育运动中生成角色
1.相关申请的交叉引用
2.本技术要求于2020年2月5日提交的美国临时申请序列no.62/970,234的优先权,该申请通过引用整体并入本文。
技术领域
3.本公开总体上涉及一种通过无监督学习在体育运动中生成数据驱动角色的系统和方法。


背景技术:

4.当评估你的团队的运动员或评估要被添加到你的团队的运动员时,球探通常依赖于位置标签来识别符合特定标准集的那些运动员。然而,随着体育运动的发展,与位置的传统或经典定义相关联的特征也在发展。例如,在篮球领域,2000年代已经看到团队从中锋位置的经典定义转变为对中锋位置的现代定义,这需要比以往任何时候更大的投篮范围和更大的机动性。


技术实现要素:

5.在一些实施例中,一种用于生成与一个或更多个运动员相关联的角色概要的方法。计算系统检索针对多个赛事的多个团队的赛事信息。赛事信息包括与每个赛事期间的球的移动相关联的信息。计算系统基于赛事信息,生成描述一个或更多个运动员中的每个运动员的空间输出。计算系统基于赛事信息,识别与多个团队中的每个团队相关联的比赛风格。计算系统基于赛事信息,识别运动员或团队在场上的两个区之间采取的路径子集。计算系统基于赛事信息和运动员或团队在场上的两个区之间采取的路径子集,识别每个运动员参与团队的过程。计算系统基于赛事信息,生成与运动员参与给定比赛相对应的值。计算系统基于赛事信息,生成与每个运动员的传球能力相关联的分数。计算系统基于赛事信息,确定每个运动员的射门风格。计算系统基于空间输出、比赛风格、路径子集、每个运动员参与他们的团队的过程、与运动员参与给定比赛相关联的值相对应的值、与每个运动员的传球能力相关联的分数、以及每个运动员的射门风格,识别与每个运动员相关联的角色。
6.在一些实施例中,本文公开了一种非暂时性计算机可读介质。非暂时性计算机可读介质包括:一个或更多个指令序列,一个或更多个指令序列在由一个或更多个处理器执行时,使计算系统执行操作。操作包括:由计算系统检索针对多个赛事的多个团队的赛事信息。赛事信息包括与每个赛事期间的球的移动相关联的信息。该操作进一步包括:由计算系统基于赛事信息,生成描述一个或更多个运动员中的每个运动员的空间输出。该操作进一步包括:由计算系统基于赛事信息,识别与多个团队中的每个团队相关联的比赛风格。该操作进一步包括:由计算系统基于赛事信息,识别运动员或团队在场上的两个区之间采取的路径子集。该操作进一步包括:由计算系统,基于赛事信息和运动员或团队在场上的两个区之间采取的路径子集,识别每个运动员参与团队的过程。该操作进一步包括:由计算系统基
于赛事信息,生成与运动员参与给定比赛的值相对应的分数。该操作进一步包括:由计算系统基于赛事信息,生成与每个运动员的传球能力相关联的分数。该操作进一步包括:由计算系统基于赛事信息,确定每个运动员的射门风格。该操作进一步包括:基于空间输出、比赛风格、路径子集、每个运动员参与他们的团队的过程、与运动员参与给定比赛的值相对应的分数、与每个运动员的传球能力相关联的分数、以及每个运动员的射门风格,识别与每个运动员相关联的角色。
7.在一些实施例中,本文公开了一种系统。该系统包括:一个或更多个处理器;以及存储器。存储器上存储有编程指令,编程指令在由一个或更多个处理器执行时,使系统执行操作。该操作包括:检索针对多个赛事的多个团队的赛事信息。赛事信息包括与每个赛事期间的球的移动相关联的信息。该操作进一步包括:基于赛事信息,生成描述一个或更多个运动员中的每个运动员的空间输出。该操作进一步包括:基于赛事信息,识别与多个团队中的每个团队相关联的比赛风格。该操作进一步包括:基于赛事信息,识别运动员或团队在场上的两个区之间采取的路径子集。该操作进一步包括:基于赛事信息和运动员或团队在场上的两个区之间采取的路径子集,识别每个运动员参与团队的过程。该操作进一步包括:基于赛事信息,生成与运动员参与给定比赛的值相对应的分数。该操作进一步包括:基于赛事信息,生成与每个运动员的传球能力相关联的分数。该操作进一步包括:基于赛事信息,确定每个运动员的射门风格。该操作进一步包括:基于空间输出、比赛风格、路径子集、每个运动员参与他们的团队的过程、与运动员参与给定比赛的值相对应的分数、与每个运动员的传球能力相关联的分数、以及每个运动员的射门风格,识别与每个运动员相关联的角色。
附图说明
8.为了能够详细理解本公开的上述特征,可以参考实施例对以上简要概述的本公开进行更具体的描述,其中一些实施例在附图中示出。然而,应注意,附图仅示出了本公开的典型实施例,因此不应被视为对本公开范围的限制,因为本公开可以允许其他等效实施例。
9.图1是示出根据示例实施例的计算环境的框图。
10.图2是示出根据示例实施例的角色预测平台的框图。
11.图3示出了根据示例实施例的示例性传球起点和传球目的地热图。
12.图4示出了根据示例实施例的主成分分析(pca)绘图。
13.图5是示出根据示例实施例的比赛风格图的框图。
14.图6a是示出根据示例实施例的传球开始区模板的框图。
15.图6b是示出根据示例实施例的传球结束区模板的框图。
16.图7示出了根据示例实施例的团队中的各种运动员的控球值(pv+)的图。
17.图8a是示出根据示例实施例的传球风险奖励简档的图。
18.图8b是示出根据示例实施例的预期传球完成率的图。
19.图9是示出根据示例实施例的运动员分组的散点图。
20.图10是示出根据示例实施例的生成运动员的角色概要的方法的流程图。
21.图11a是示出根据示例实施例的计算设备的框图。
22.图11b是示出根据示例实施例的计算设备的框图。
23.为了便于理解,在可能的情况下,使用相同的附图标记来表示附图中共有的相同
元件。可以预期,在一个实施例中公开的元件可以有益地用于其他实施例而无需具体叙述。
具体实施方式
24.随着体育运动的发展,团队评估运动员和他们的团队需要的方式也发展。例如,以足球运动为例。后卫经典地将运动员定义为在球场或场的宽广区中的防守员。然而,多年来,足球比赛已经发展,现在后卫对他们进攻和创造进球的能力更加重视,而不是对他们防守和赢得控球的能力更加重视。虽然这对于体育运动可能是积极的发展,但是这对于试图找到价值不足的运动员和满足一定标准集的运动员的招聘部门产生了问题。尽管标签“后卫”可能有助于减少观察的运动员的数量,但是由于位置的定义不断变化,在经典意义上标签后卫的运动员可能被当今的标准误标签。换言之,标签可能无法描述运动员执行的当前角色。
25.本文所描述的一种或更多种技术利用机器学习模型的集合,来测量团队的不同方面和团队内的运动员功能。例如,该过程可以帮助动态学习运动员的“角色”,而不是依赖于各种角色的经典定义。例如,本文描述的一种或更多种技术允许团队将运动员分解为三个核心元素:(a)通过预期传球和控球值测量的质量;(b)他们的空间占有率;以及(c)他们通过远离聚集计数移动到顺序建模而参与过程。更进一步,本文描述的一种或更多种技术可以使用机器学习模型来学习运动员所落入的角色的分布。系统不仅可以使用这些特征来描述运动员,还可以描述团队。这允许团队或俱乐部能够快速识别具有他们最有价值的特征的运动员,理解角色对团队的价值,以及识别扮演类似风格以从中募集的那些团队。
26.尽管以下讨论是针对足球的体育运动,但本领域技术人员认识到,这些操作和技术也可以应用于其他体育运动(例如,棒球、篮球、足球、曲棍球、橄榄球等)。
27.图1是示出根据示例实施例的计算环境100的框图。计算环境100可以包括经由网络105通信的跟踪系统102、组织计算系统104以及一个或更多个客户端设备108。
28.网络105可以是任何合适的类型,包括经由因特网的各个连接,诸如蜂窝或wi-fi网络。在一些实施例中,网络105可以使用直接连接来连接终端、服务和移动设备,直接连接诸如射频识别(rfid)、近场通信(nfc)、蓝牙
tm
、低功耗蓝牙
tm
(ble)、wi-fi
tm
、zigbee
tm
、环境反向散射通信(abc)协议、usb、wan或lan。由于所传输的信息可能是个人的或机密的,出于安全考虑可以指示这些类型的连接中的一个或更多个被加密或以其他方式保护。然而,在一些实施例中,被传输的信息可能不太个人化,因此,为了方便而不是安全,可以选择网络连接。
29.网络105可以包括用于交换数据或信息的任何类型的计算机网络布置。例如,网络105可以是因特网、专用数据网络、使用公共网络和/或使计算环境100中的组件能够在环境100的组件之间发送和接收信息的其它合适的连接的虚拟专用网络。
30.跟踪系统102可以位于地点106中。例如,地点106可以被配置为举办包括一个或更多个主体(agent)112的体育赛事。跟踪系统102可以被配置为捕捉比赛台面上的所有主体(即,运动员)的运动以及一个或更多个其他相关对象(例如,球、裁判等)。在一些实施例中,跟踪系统102可以是使用例如多个固定摄像机的基于光学的系统。例如,可以使用六个固定的、校准的摄像机的系统,该系统将运动员和球的三维位置投影到球场的二维俯视图上。在另一示例中,可以使用固定的和非固定的摄像机的混合来捕捉比赛台面上的所有主体的运
动以及一个或更多个对象或相关性。如所属领域的技术人员了解的,使用此跟踪系统(例如,跟踪系统102)可能导致球场的许多不同摄像机视图(例如,高球场边线(sideline)视图、罚球线视图、聚拢听取指示的一群队员(huddle)视图、开球(face-off)视图、结束区(end zone)视图等)。在一些实施例中,跟踪系统102可用于给定比赛的广播馈送。
31.比赛文件110可以表示与特定比赛相关联的数据。例如,比赛文件110可以包括诸如所有主体和球(或冰球)的捕捉运动以及一个或更多个其他相关对象的信息。在一些实施例中,比赛文件110可进一步包括赛事级类型信息(下文中,“赛事数据”)。例如,赛事数据可以被定义为运动员在控球时执行的动作。例如,传球、射门、铲球等。在一些实施例中,赛事数据可以捕捉信息,诸如但不限于球的x-、y-、z-坐标、运动员的名字和标识符(例如,运动员id)、团队的名字和id(例如,团队id)、时间戳和其他元数据,其他元数据诸如比赛标识符(例如,比赛id)、球被触摸时的比赛日期等。在一些实施例中,比赛文件110还可以包括比赛情境信息(当前分数、剩余时间等)。用来为以下参考模型提供动力的数据可以包括当运动员拥有球时球的xyz位置数据、团队id、运动员id、赛事id、时间戳、时段id、描述更详细的赛事的子限定符(诸如传球类型、决对类型、设置比赛类型等)。该数据可以表示随后馈送到数据处理层中的原始特征,该数据处理层创建新特征集,诸如顺序、赛事位置的热图、球场的区中的赛事类型的分组、球移动的速度等。
32.跟踪系统102可以被配置成经由网络105与组织计算系统104通信。组织计算系统104可以被配置成生成针对与运动员相关联的角色范围的一个或更多个度量。组织计算系统104可以至少包括web客户端应用服务器114、数据存储118和角色预测平台120。
33.角色预测平台120可以包括一个或更多个软件模块。一个或更多个软件模块可以是存储在介质(例如,组织计算系统104的存储器)上的代码或指令的集合,该代码或指令的集合表示实施一个或更多个算法步骤的一系列机器指令(例如,程序代码)。这样的机器指令可以是组织计算系统104的处理器解释以实施指令的实际计算机代码,或者可替代地,这样的机器指令可以是被解释以获得实际计算机代码的指令的更高级别的编码。一个或更多个软件模块还可以包括一个或更多个硬件组件。示例算法的一个或更多个方面可以由硬件组件(例如,电路)本身执行,而不是作为指令的结果。
34.数据存储118可以被配置成用于存储一个或更多个比赛文件124。每个比赛文件124可以至少包括给定比赛的赛事数据。在一些实施例中,每个比赛文件124可以进一步包括给定比赛的视频数据(例如,广播数据)。例如,视频数据可以表示由跟踪系统102捕捉的多个视频帧。在另一示例中,视频数据可以表示来自相应比赛的广播视频馈送的多个视频帧。在一些实施例中,每个比赛文件124可以进一步包括与该赛事相关联的跟踪数据。示例性跟踪数据可以包括例如场上的每个单独运动员的x-和y-坐标。
35.角色预测平台120可以被配置成预测团队的各种不同方面和团队内的运动员功能。例如,角色预测平台120可以利用模型集合,该模型的集合可以协同工作来学习与给定运动员相关联的角色。在一些实施例中,角色预测平台120可以利用赛事数据来做出这样的确定。与角色预测平台120相关联的架构在下文中结合图2更详细地讨论。
36.客户端设备108可以经由网络105与组织计算系统104通信。客户端设备108可以由用户操作。例如,客户端设备108可以是移动设备、平板电脑、台式计算机或具有本文描述的能力的任何计算系统。用户可以包括但不限于诸如与组织计算系统104相关联的实体的订
阅者、客户、预期客户或顾客的个人,诸如已从与组织计算系统104相关联的实体获得产品、服务或咨询的个人,将从与组织计算系统104相关联的实体获得产品、服务或咨询的个人,或可从与组织计算系统104相关联的实体获得产品、服务或咨询的个人。
37.客户端设备108可以至少包括应用126。应用126可以表示允许访问网站的web浏览器或独立应用。客户端设备108可以访问应用126以访问组织计算系统104的一个或更多个功能。客户端设备108可以通过网络105通信以例如从组织计算系统104的web客户端应用服务器114请求网页。例如,客户端设备108可以被配置为执行应用126以访问由web客户端应用服务器114管理的内容。显示给客户端设备108的内容可以从web客户端应用服务器114传输到客户端设备108,并且随后由应用126处理以通过客户端设备108的图形用户界面(gui)显示。
38.图2是示出根据示例实施例的角色预测平台120的框图200。角色预测平台120可以包括空间特征模块202、比赛风格模块204、运动员链模块208、移动链模块210、控球值模块212、传球/传中风险模块214、射门特征模块216和角色预测模块218。空间特征模块202、比赛风格模块204、运动员链模块208、移动链模块210、控球值模块212、传球/传中风险模块214、射门特征模块216和角色预测模块218中的每个可以包括一个或更多个软件模块。一个或更多个软件模块可以是存储在介质(例如,组织计算系统104的存储器)上的代码或指令的集合,该代码或指令的集合表示实施一个或更多个算法步骤的一系列机器指令(例如,程序代码)。这样的机器指令可以是组织计算系统104的处理器解释以实施指令的实际计算机代码,或者可替代地,这样的机器指令可以是解释以获得实际计算机代码的指令的更高级别的编码。一个或更多个软件模块还可以包括一个或更多个硬件组件。示例算法的一个或更多个方面可以由硬件组件(例如,电路)本身执行,而不是作为指令的结果。
39.空间特征模块202可以被配置为学习场上的各个位置对给定运动员的重要性。例如,空间特征模块202可以接收运动员在哪里传球以及传球去哪里的x-、y-坐标。给定这些x-、y-坐标,空间特征模块202可以生成热图,该热图示出由给定运动员发起的每次传球的传球起点和传球目的地。然后,空间特征模块202可以将热图传递给机器学习模块220。在一些实施例中,机器学习模块220可以包括非负矩阵分解(nmf)算法,该非负矩阵分解(nmf)算法被配置为学习不同球场(或场)区的表示作为因素并为每个因素分配权重,该权重可以表示那些对运动员或多或少重要的球场区。在一些实施例中,可以训练机器学习模块220以识别要创建的“最佳”因素集。例如,机器学习模块220可以实施肘部方法,以确定要从热图中识别的因素的最佳数量。在一些实施例中,贝叶斯信息准则(bic)可用于确定集群的最佳数量。bic在整个数据集中应用了许多高斯分布。然后,空间特征模块202可以应用期望最大化(em)算法来近似分布的均值和方差。为了选择最佳数量,bic分数可能会增加,直到对增加复杂性并开始适应噪声的大量集群应用惩罚。随着buc分数开始下降,这一点可以被认为是拐点。使用特定示例,机器学习模块220可以被训练以识别用于传球起点的16个因素和用于传球目的地的16个因素。因此,空间特征模块202可以被配置为输出描述给定运动员的空间分布的不同因素(传球开始和传球目的地)的总数。例如,给定两名运动员的空间分布,无论他们的位置或角色如何,团队可以识别两名运动员的类似程度。
40.图3示出了根据示例实施例的示例性热图。如图所示,图3包括热图302-308。热图302可以示出与第一因素相关联的传球起点热图。热图304可以示出与第二因素相关联的传
球目的地热图。热图306可以示出与第三因素相关联的传球起点热图。热图308可以示出与第四因素相关联的传球目的地。
41.图4示出了根据示例实施例的主成分分析(pca)绘图400。如以上所提供的,空间特征模块202可能有助于识别两个运动员基于他们的空间分布有多类似。如图所示,pca绘图400示出了运动员firmino(菲尔米诺)和giroud(吉鲁)具有基于例如他们在pca绘图400中的接近度的类似的空间分布。类似地,pca绘图400示出了运动员van dijk(范戴克)和dunk(邓克)具有基于例如他们在pca绘图400中的接近度的类似的空间分布。
42.返回参见图2,比赛风格模块204可以被配置成识别与特定团队相关联的比赛风格。识别团队的比赛风格可能有助于为运动员的空间分布提供情境。为了检测团队在每次触摸球时的比赛风格,比赛风格模块204可以使用手动制作的特征集,来创建描述团队控球的战术情境的成员值。例如,比赛风格可以被划分为8种类型:维持(即,在本方半场控球)、积累(即,从中线到对方半场控球(例如,对方18码罚球区))、持续威胁(即,将球保持在进攻场的三分之一处)、快节奏(即,将球移动到某一阈值速度以上(例如,大于4m/s))、反击(即,在恢复控球之后,将球向前移动的速度超过某一阈值(例如,7m/s))、传中(即,团队是否传中球)、直接比赛(即,向前传球大于阈值距离(例如,20米))和高压(即,在失去控球之后,迅速在攻击半场中赢得控球)。
43.为了做出这种确定,可以训练机器学习模块224以将比赛的赛事数据划分成一次或更多次控球。每次控球可以包括一次或更多次触摸。对于每次触摸,机器学习模块224可以被训练成向该触摸分配表示8类触摸之一的值。一旦将所有触摸分类,比赛风格模块204可以聚集这些值以生成每个运动员的加权计数。然后,比赛风格模块204可以基于运动员对团队总数的贡献来归一化这些值。作为输出,比赛风格模块204可以生成8向量输出。
44.图5是示出根据示例实施例的比赛风格图500的框图。例如,可以基于由比赛风格模块204为给定团队识别的比赛风格的类型,来生成比赛风格图500。如图所示,比赛风格图500可以表示与切尔西(chelsea)相关联的比赛风格。从比赛风格图500中,团队可以看到多个切尔西的控球与维持比赛风格相关,并且切尔西执行最少次数的反击比赛风格。
45.返回参见图2,移动链模块210可以被配置成识别运动员或团队在场上的两个区之间采取的最常见路径。移动链模块210可以包括基序生成器230、模板232和机器学习模块234。基序生成器230可以被配置为生成一个或更多个控球基序,一个或更多个控球基序将运动员组合的序列分解成来自同一链的x个连续运动员控球(例如,四个连续运动员控球)链。例如,如果链中涉及四个唯一运动员,则基序生成器230可以将其分类为abcd,其中每个字母表示链中的运动员。通过生成控球基序,角色预测平台120能够找到使用类似的基序模式的团队。在一些实施例中,角色预测平台120可以利用控球基序来识别涉及类似基序的那些运动员。
46.虽然控球基序在识别使用类似模式或基序的团队以及涉及类似基序的运动员中是有用的,但是单独的控球基序不能考虑基序在球场上的哪个位置出现以及如何创建基序的空间语义。例如,可以预期边锋具有指示给和出以及重叠的组合类型,诸如abab或abcb。然而,中后卫也将具有非常类似的简档,因为这通常是当团队从后面构建时看到的传球组合。
47.考虑到这个限制,模板232和机器学习模块234被用于考虑该基序的空间分量。模
板232可以包括传球开始区模板和传球结束区模板。传球开始区模板可以表示被划分成一个或更多个区的球场,其中传球被开始或发起。传球结束区模板可以表示被划分成一个或更多个区的球场,其中传球被指定或完成。
48.图6a是示出根据示例实施例的传球开始区模板602的框图。图6b是示出根据示例实施例的传球结束区模板604的框图。可以将传球开始区模板602划分成多个区域0-8。传球结束区模板604可以被划分成多个区-1、0、1、2、4、5、7和8。比赛的方向在每个模板602、604中从左到右。
49.返回参见图2,移动链模块210可以使用模板232为由基序生成器230生成的控球基序提供情境。例如,移动链模块210可以用来自模板232的区信息补充控球基序。由此,移动链模块210可以基于传球开始区模板602标记传球开始,并且基于传球结束区模板604标记传球结束,而不是仅仅知道例如给定控球的abcd。
50.机器学习模块234可以被配置成通过采取经由k均值聚类在开始区之一开始并在结束区之一结束的所有移动链,来学习空间词典。例如,移动链模块210可以聚集从一个区(例如,区1)开始并且在第二区(例如,区5)结束的所有链,以在区1与区5之间生成控球的“超级组”。机器学习模块234可以接收链的超级组作为输入,并且使用k均值聚类识别在两个区之间采用的最常见路径。在一些实施例中,移动链模块210可以使用拐点方法来确定k的最佳数。
51.运动员链模块208可以被配置成学习运动员参与团队的过程。运动员链模块208可以包括预处理模块226和神经网络228。预处理模块226可以被配置为基于移动链模块210创建的标签和控球基序,来创建情境变量。例如,为了创建情境特征,预处理模块226可以连接从控球基序、移动链的超级组以及在超级组内采取的最常见路径(例如,开始区1、结束区8、abcd、集群1)创建的标签。预处理模块226可以识别运动员标识符(例如,运动员id)以创建目标特征。
52.为了学习文本“语料库”,预处理模块226可以识别唯一目标和情境标签并且将他们编码为一个热表示。这些一个热表示特征现在可以表示对神经网络228的输入。
53.神经网络228可以表示1层神经网络,该1层神经网络被配置成基于运动员在运动链和基序两者中的参与来编码运动员标识符。为了训练神经网络228,预处理模块226可以被配置成创建真训练模式和假训练模式。例如,预处理模块226可以学习流行目标和情境对(真标签)的加权,并找到很少发生或根本不发生的示例。这些新的对可以被标记为假。然后,神经网络228可以接收用于训练的最终真配对和假配对作为输入。神经网络228可以例如使用400个时期以每批64个进行训练。然后,可以从最终特征向量提取n个运动员的16个神经元的最终嵌入层,来表示运动员参与团队的控球过程。在一些实施例中,神经网络228可以使用目标变量(例如,运动员名字)来预测被称为情境(例如,战术情境)的相邻词。神经网络228的最终预测层可以提供情境词实际上是通常与目标运动员相关联的情境词的概率。在一些实施例中,可以通过将16个神经元作为来自神经网络228的输出,来创建嵌入以表示运动员。
54.控制值模块212可以被配置成测量运动员参与比赛的“危险”。换言之,控球值模块212可以被配置为评估运动员对于给定比赛的值。控球值模块212可以包括机器学习模块236。机器学习模块236可以被配置为学习如何基于例如移动链中的赛事来预测进球得分的
概率。在一些实施例中,机器学习模块236可以从赛事数据接收四个赛事的序列作为输入。例如,赛事序列可以包括来自1号运动员的传球、来自2号运动员的触摸和运球、来自2号运动员的传球、以及然后来自3号运动员的第一次传中。基于该连续赛事序列,机器学习模块236可以预测进球得分的可能性。该信息可以允许团队评估运动员是否正在增加或减少团队得分的机会。在一些实施例中,机器学习模块236可以表示为xgboost模型。
55.为了生成这种预测,可以使用x个赛事(例如,四个赛事)序列来训练机器学习模块236。机器学习模块236可以使用例如在传球开始区模板和传球结束区模板中定义的区来对运动员赛事进行分类,并测量他们增加或减少得分机会的平均值。该值随后可以被标准化为百分位数,以表示运动员产生最危险的球场上的区。在一些实施例中,来自机器学习模块236的输出可以是每个区的每次传球控球值。
56.图7示出了根据示例实施例的图700,该图700示出了团队中的各个运动员的控球值(pv+)。如图所示,图700可以示出在2018赛季期间利物浦队的各个运动员的pv+。可以使用由控球值模块212生成的控球值来生成图700。
57.传球/传中风险模块214可以被配置成测量运动员传球能力的技能。传球/传中风险模块214可以包括机器学习模块238。机器学习模块238可以被训练,以在给定其当前情境下预测运动员完成传球或传中的概率。在一些实施例中,机器学习模块238可以接收赛事序列作为输入。机器学习模块238可以将运动员赛事分类,并测量完成传球的平均风险。机器学习模块238可以在给定该赛事序列的情况下估计完成传球的概率。输出可以是0-1之间的概率,其中1是完成传球的100%机会。该值可以被标准化为表示运动员产生最大危险或具有最大值的球场的区的百分位数。在一些实施例中,机器学习模块238可以表示为xgboost模型。
58.图8a是示出根据示例实施例的传球风险奖励简档的图800。图8b是示出根据示例实施例的预期传球完成率的图802。如图所示,给定由传球/传中风险模块214生成的传球/传中风险值,团队可能能够可视化给定运动员是否是好传球手、安全传球手等。
59.返回参见图2,射门特征模块216可以被配置为确定运动员的射门风格。例如,射门特征模块216可以被配置为将球场划分成一个或更多个区(例如,6个区),并计数运动员已经从每个区进行了多少次射门。然后,射门特征模块216可以基于运动员的总射门次数,来标准化这些值。然后,射门特征模块216可以连接用左脚和右脚以及从他们的头部进行的射门次数。输出可以是示出运动员在每个区中射门的百分比的标准化热图。在一些实施例中,射门的计数可以基于运动员射门总次数被标准化。进一步地,在一些实施例中,射门特征模块216可以计算用左脚、右脚和头部射门的百分比。
60.角色预测模块218可以被配置成识别与各种运动员相关联的角色。角色预测模块218可以包括高斯混合模型(gmm)242。gmm 242可以被配置成识别可以被分配给每个运动员的一个或更多个角色。为了生成预测,gmm 242可以接收由空间特征模块202、比赛风格模块204、运动员链模块208、移动链模块210、控球值模块212、传球/传中风险模块214和射门特征模块216中的每一个为一个或更多个运动员生成的特征向量作为输入。例如,向量可以包括信息,该信息涉及运动员id、联赛(league)id、反击属性、直接比赛属性、快节奏属性、持续威胁属性、高压属性、积累属性、维持属性、来自每个区的控球值(pv)、来自每个区的预期传球(xp)完成率、运动员嵌入、在每个区中开始传球的百分比、在每个区中结束传球的百分
比、运动员在每个区中射门的百分比、运动员用他或她的右脚射门的百分比、运动员用他或她的左脚射门的百分比、运动员用他或她的头部射门的百分比中的一个或更多个。在一些实施例中,该列表可能不是详尽的,并且可能包括以上生成的附加度量。给定该输入,gmm242可以被配置成生成一个或更多个运动员集群。每个集群可以与唯一的运动员角色相对应。
61.为了将含义添加到集群,角色预测模块218可以使用采用落入第75百分位数内的特征的数据驱动方法。角色预测模块218可以使用这些特征来填充文本模板,以允许对这些运动员的主要角色的简单概要。例如,角色预测模块218可以生成:
[0062][0063]
图9是示出根据示例实施例的由gmm 242生成的运动员分组的散点图900。如图所示,gmm 242可以已经将运动员分组成25个唯一集群,其中每个集群与唯一的角色相对应。
[0064]
图10是示出根据示例实施例的生成运动员的角色概要的方法1000的流程图。方法1000可以从步骤1002开始。
[0065]
在步骤1002,组织计算系统104可以从数据存储118中检索赛事信息。
[0066]
在步骤1004,组织计算系统104可以生成描述赛事信息中的一个或更多个运动员中的每个运动员的空间输出。例如,空间特征模块202可以接收运动员在哪里传球以及传球去哪里的x-、y-坐标。给定这些x-、y-坐标,空间特征模块202可以生成热图,该热图示出由给定运动员发起的每次传球的传球起点和传球目的地。然后,空间特征模块202可以将热图传递到机器学习模块220,以针对在赛事信息中识别的每个运动员来识别传球起点的一个或更多个因素(例如,16个)和传球目的地的一个或更多个因素(例如,16个)。因而,空间特征模块202可以被配置为输出描述给定运动员的空间分布的不同因素(传球开始和传球目的地)的总数。
[0067]
在步骤1006,组织计算系统104可以识别与特定团队相关联的比赛风格。识别团队的比赛风格可以帮助向运动员的空间分布提供情境。为了生成比赛风格,机器学习模块224可以接收被划分成一次或更多次控球的各种比赛的赛事数据。每次控球可以包括一次或更多次触摸。对于每次触摸,机器学习模块224可以向该触摸分配表示8类触摸之一的值。一旦将所有触摸分类,比赛风格模块204可以聚集这些值以生成每个运动员的加权计数。然后,比赛风格模块204可以基于运动员对团队总数的贡献来归一化这些值。作为输出,比赛风格模块204可以生成描述团队的比赛结构的向量输出。
[0068]
在步骤1008,组织计算系统104可以识别运动员或团队在场上的两个区之间采取的最常见路径。例如,移动链模块210可以生成一个或更多个控球基序,一个或更多个控球基序将运动员组合的序列分解成来自同一链的x个连续的运动员控球(例如,四个连续的运动员控球)链。移动链模块210可以用来自模板232的区信息,补充控球基序。然后,移动链模块210可以生成两个区之间的超级控球组,并且使用k均值聚类识别两个区之间的最常见路径(或集群)。
[0069]
在步骤1010,组织计算系统104可以识别每个运动员参与团队的过程。例如,运动员链模块208可以基于由移动链模块210创建的标签和控球基序,来创建情境变量。例如,为了创建情境特征,预处理模块226可以连接从控球基序、移动链的超级组和在超级组内采取的最常见路径(例如,开始区1、结束区8、abcd、集群1)创建的标签。预处理模块226可以识别运动员标识符(例如,运动员id),以创建目标特征。预处理模块226可以识别唯一目标和情境标签,且将唯一目标和情境标签编码为一个热表示。这些一个热表示特征现在可以表示对神经网络228的输入。神经网络228可以基于运动员参与运动链和基序两者,来生成最终特征向量以表示运动员参与团队的控球。
[0070]
在步骤1012,组织计算系统104可以在参与一个或更多个比赛时生成与运动员的值(例如,危险值)相对应的分数。例如,控球值模块212可以使用机器学习模块236,以基于移动链中的赛事来预测进球得分的概率。该信息可以允许团队评估运动员是否正在增加或减少团队得分的机会。控球值模块212可以测量运动员增加或减少团队得分机会的平均值。该值随后可以被标准化为百分位数,以表示运动员产生最危险或生成最值的球场上的区。
[0071]
在步骤1014,组织计算系统104可以生成与每个运动员的传球能力相关联的分数。例如,传球/传中风险模块214可以在给定比赛的当前情境下,预测运动员完成传球或传中的概率。
[0072]
在步骤1016,组织计算系统104可以确定每个运动员的射门风格。例如,射门特征模块216可以通过将球场划分成一个或更多个区并且计数运动员已经从每个区获得多少射门,来确定每个运动员的射门风格。在一些实施例中,射门特征模块216可以考虑射门是用运动员的右脚、左脚还是头部进行的。
[0073]
在步骤1018,组织计算系统104可以识别与各种运动员相关联的角色。例如,角色预测模块218可以实现gmm 242,以识别可以被分配给每个运动员的一个或更多个角色。为了生成预测,gmm 242可以接收由空间特征模块202、比赛风格模块204、运动员链模块208、移动链模块210、控球值模块212、传球/传中风险模块214以及射门特征模块216中的每个,为一个或更多个运动员生成的特征向量作为输入。给定该输入,gmm 242可以被配置成生成一个或更多个运动员集群。每个集群可以与唯一的运动员角色相对应。
[0074]
图11a示出了根据示例实施例的计算系统1100(“系统1100”)的架构。系统1100可以表示组织计算系统104的至少一部分。系统1100的一个或更多个组件可以使用总线1105彼此电通信。系统1100可以包括处理单元(cpu或处理器)1110和系统总线1105,系统总线1105将包括系统存储器1115(诸如只读存储器(rom)1120和随机存取存储器(ram)1125)的各种系统组件耦接至处理器1110。系统1100可以包括高速存储器的高速缓存,高速存储器的高速缓存直接与处理器1110连接、与处理器1110紧密接近或者集成为处理器1110的一部分。系统1100可以将数据从存储器1115和/或存储设备1130复制到高速缓存1112,以供处理
器1110快速访问。这样,高速缓存1112可以提供性能提升,该性能提升避免了处理器1110在等待数据时的延迟。这些和其他模块可以控制或被配置为控制处理器1110,以执行各种动作。也可以使用其他系统存储器1115。存储器1115可以包括具有不同性能特性的多种不同类型的存储器。处理器1110可以包括任何通用处理器和硬件模块或软件模块,例如存储在存储设备1130中的服务11132、服务21134和服务31136,硬件模块或软件模块被配置为控制处理器1110以及专用处理器,其中,软件指令被并入到实际处理器设计中。处理器1110本质上可以是完全独立的计算系统,包含多个核或处理器、总线、存储器控制器、高速缓存等。多核处理器可以是对称的或非对称的。
[0075]
为了使用户能够与系统1100交互,输入设备1145可以表示任何数量的输入机构,诸如用于语音的麦克风、用于手势或图形输入的触敏屏幕、键盘、鼠标、运动输入、语音等。输出设备1135(例如,显示器)还可以是本领域技术人员已知的多种输出机制中的一种或更多种。在一些实例中,多模态系统可以使得用户能够提供多种类型的输入,以与系统1100通信。通信接口1140通常可以支配和管理用户输入和系统输出。在任何特定硬件装置上操作没有限制,因此这里的基本特征可以容易地替换为开发的改进的硬件或固件装置。
[0076]
存储设备1130可以是非易失性存储器,并且可以是硬盘或可以存储可由计算机访问的数据的其他类型的计算机可读介质,诸如磁带盒、闪存卡、固态存储器设备、数字多功能盘、盒式磁带、随机存取存储器(ram)1125、只读存储器(rom)1120、以及它们的混合。
[0077]
存储设备1130可以包括用于控制处理器1110的服务1132、1134和1136。可以考虑其他硬件或软件模块。存储设备1130可以连接到系统总线1105。在一个方面,执行特定功能的硬件模块可以包括存储在计算机可读介质中的软件组件,该软件组件与必要硬件组件(诸如,处理器1110、总线1105、输出设备1135等)连接,以执行该功能。
[0078]
图11b示出了具有芯片组架构的计算机系统1150,该芯片组架构可以表示组织计算系统104的至少一部分。计算机系统1150可以是可用于实现所公开的技术的计算机硬件、软件和固件的示例。系统1150可以包括处理器1155,其表示能够执行被配置为执行所识别的计算指令的软件、固件和硬件的任何数量的物理上和/或逻辑上不同的资源。处理器1155可以与芯片组1160通信,芯片组1160可以控制到处理器1155的输入以及来自处理器1155的输出。在该示例中,芯片组1160将信息输出到输出1165(例如,显示器),并且可以将信息读取和写入到存储设备1170,存储设备1170可以包括例如磁介质和固态介质。芯片组1160还可以从存储设备1175(例如,ram)读取数据并向存储设备1175写入数据。可以提供用于与各种用户接口组件1185接口连接的桥1180,以用于与芯片组1160接口连接。这样的用户接口组件1185可以包括键盘、麦克风、触摸检测和处理电路、诸如鼠标之类的指示设备等。通常,到系统1150的输入可以来自机器生成和/或人为生成的各种源中的任何一种。
[0079]
芯片组1160还可以与一个或更多个通信接口1190接口连接,一个或更多个通信接口1190可以具有不同物理接口。这样的通信接口可以包括用于有线和无线局域网、用于宽带无线网络以及个人局域网的接口。用于生成、显示和使用本文公开的gui的方法的一些应用可以包括:通过物理接口接收有序数据集,或者通过处理器1155分析存储在存储设备1170或1175中的数据而由机器本身生成。进一步地,机器可以通过用户接口组件1185接收来自用户的输入,并通过使用处理器1155解释这些输入来执行适当的功能,诸如浏览功能。
[0080]
可以理解,示例系统1100和1150可以具有多于一个的处理器1110,或者可以是联
网在一起以提供更大处理能力的一组或一集群计算设备的一部分。
[0081]
虽然前述内容是针对本文所述的实施例,但在不脱离本文的基本范围的情况下,可以设计出其他和另外的实施例。例如,本公开的各方面可以用硬件或软件或硬件和软件的组合来实现。本文描述的一个实施例可以被实现为与计算机系统一起使用的程序产品。程序产品的程序定义了实施例(包括本文描述的方法)的功能,并且可以包含在各种计算机可读存储介质上。示例性计算机可读存储介质包括但不限于:(i)在其上永久地存储信息的不可写存储介质(例如,计算机内的只读存储器(rom)设备,诸如可由cd-rom驱动器读取的cd-rom盘、闪存、rom芯片或任何类型的固态非易失性存储器);以及(ii)在其上存储有可改变的信息的可写存储介质(例如,硬盘驱动器内的软盘或硬盘驱动器或任何类型的固态随机存取存储器)。当承载指导所公开的实施例的功能的计算机可读指令时,这样的计算机可读存储介质是本公开的实施例。
[0082]
本领域技术人员将理解,前述示例是示例性的而非限制性的。在阅读说明书和研究附图之后,旨在对本领域技术人员显而易见的所有置换、增强、等同物和改进都降包括在本公开的真实精神和范围内。因此,所附权利要求旨在包括落入这些教导的真实精神和范围内的所有这些修改、置换和等同物。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1