官方的PSV衬衫与Brainport Eindhoven担任合作伙伴

ASML的数据分析团队有助于提高足球音高

与PSV的合作关系将大数据分析提升到一个新的水平

7分钟阅读 -桑德·霍夫曼(Sander Hofman),2021年6月11日

传奇的巴西球员贝利将足球描述为“美丽的比赛”。就像游戏本身一样,动态前锋是流畅的,不可预测的和幸运的。尽管运气在足球比赛的结果中发挥了重要作用,但球场上的动作肯定是可量化的。那么,认真的数字进攻能否使自己有利吗?asml和足球俱乐部PSV联合起来以提高球场的表现 - 撇开运气,也就是说。


大多数专业运动队都使用大量统计数据来评估他们的游戏和玩家。特别是自迈克尔·刘易斯(Michael Lewis)2003年的书(后来的电影)出版以来Moneyball,数据在体育中的作用对团队的愿望至关重要。但Moneyball是关于棒球的,这是一个离散事件的游戏:简短,定义明确的和自节奏的动作,具有清晰的开始和结束。足球是不同的。这是一个更加连续的游戏,玩家必须不断适应球场上不断变化的情况,这使其成为数据驱动分析的候选人。


PSV足球俱乐部体育科学与分析主管Ruud Van Elk说:“实际上,季节结果的31%是基于运气的。”“我们的工作是尝试控制其他69%。”


测量,分析,改善

性能的控制始于数据。荷兰的职业足球俱乐部与两个关键数据集合作:事件数据和跟踪数据。事件数据是球在球场上的顺序活动的手动日志,简单地说,球员A将球传递给球员B,通常会导致每足球比赛约2,000行数据。跟踪数据是每个球员和球在球场上的位置的自动日志,每秒25次,这意味着它比事件数据更丰富,上下文。体育场中的专门摄像机每场比赛捕获了惊人的400万行数据。


鲁德说:“我们分别与两种类型的数据合作。”“它使我们能够拉起基本的东西,例如每位球员的总距离,每个球员的传球,进球。正确地做到这一点。这就是为什么我们向Brainport合作伙伴寻求支持的原因。”


输入ASML。

或更具体地说,ASML的大数据分析部门。有300多人支持ASML的研发和公司职能使用有关光刻机器数据,操作数据和公司数据的高级分析。


ASML公司分析集团负责人Rob Beeren回忆起有关PSV的野心的首次学习。“ ASML是PSV的Brainport合作伙伴关系。在2020年的知识共享活动中,PSV介绍了他们对俱乐部的未来愿景。通过数据分析提高性能是该愿景的关键部分。我们意识到,我们可以通过在PSV的高性能运动环境中应用ASML的分析专业知识来提供帮助和学习。”

Rob Beeren负责ASML公司分析小组。

罗布(Rob)有一个特殊的团队来完成这项工作:创新实验室,这是ASML大数据分析部门的六个数据科学家组成的专业小组,重点是实验,快速学习和快速原型制作。在Diederick Edel的带领下,该团队被要求与PSV坐下,看看合作的机会在哪里。


Diederick说:“首先,PSV的工作人员有些担心。”“他们不确定与ASML这样的高科技公司的联合原型制作会是什么样,以及它是否真的会产生他们想要的结果。但是,我们将'少说话,更多的话!万博苹果手机客户端工作哲学。ASML-PSV团队共同勾勒出了野心和到达那里的方式。”

DiDerick Edel Heads ASML的大数据分析创新实验室

结合新见解的数据

合作的第一步是尝试将所有可用的数据集融合在一起。这一挑战与创新实验室的数据科学家Maud Diepstraten陷入了困境。

“对于任何数据项目,真正了解数据并熟悉所拥有或没有的内容至关重要。不知何故,”莫德说。


将球场上手动播放的事件与自动跟踪数据完美匹配也是一个挑战。莫德:“例如,通行证的时间戳没有正确排队。当球以1.5秒的时间范围与球员最接近时,我们通过与时间戳匹配来解决。”


作为具有数据科学管理学位的应用数学毕业生,Maud喜欢从庞大的数据集中有意义。但是这个特殊的项目提供了一个特殊的个人观点,因为莫德还是当地足球俱乐部贝尔斯男孩的中场球员。


“使用这些数据对我来说有点偏离规范。我通常使用来自于我的抽象数据ASML的机器。但是有了足球数据,我实际上可以想象22名球员在球场上发生了什么。”

Maud将多个文件与各种格式相结合,为PSV首选数据分析平台Tableau的视觉分析奠定了基础。团队看到了快速的结果。


关于冲刺的冲刺

鲁德说:“我们决定通过查看游戏的特定方面来测试我们的新数据集:冲刺。”“以前,我们只有在游戏过程中的所有玩家的开始和所有冲刺的终点。但是冲刺还有更多。有方向,加速度,速度,转弯。”


该团队以快速的Scrum周期迭代,根据汇总数据集提供图形可视化,从而获得了Ruud的反馈并进行调整。在两周内,PSV的表演培训师手中的冲刺可视化。

ASML创新实验室的数据科学家Maud Diepstraten

鲁德(Ruud):“能够使所有这些可视化,了解我们应该如何为个人玩家训练冲刺非常重要。”


ASML-PSV团队证明了他们与Sprint Analytics合作的价值,并获得了赌注。

莫德:“真正的乐趣始于您在数据中增加复杂性和粒度时。我们共同决定创建一个高级算法模型,该模型可以帮助PSV了解团队在整个比赛中如何控制球场。”


为PSV建模音高控制

团队使用原始跟踪数据作为模型的基础,通过了解每个玩家在特定的时间戳,前进的位置以及他们移动的速度来计算音高控制。“我们将音高控制定义为哪个球员在任何时候都控制着球场的哪一部分。因此,通过在球场上投射一个网格,我们可以计算哪个玩家将最快或最初到达特定的单元格。” Maud解释说。“计算每个网格单元,我们可以可视化团队的整体音高控制。”

以每秒25帧的速度计算所有网格电池的计算俯仰控制需要一些重型计算能力。ASML团队与PSV合作,在后端基础架构上,这是Azure,Microsoft的云计算平台ASML和Tableau的强大组合。


Diederick:“我们在一天之内重建了PSV的分析环境,以对Azure进行计算。我们将音高控制计算卸载到Azure Databricks的庞大计算能力上。”


为了反馈对Tableau的计算能力,团队通过Azure Synapse连接了环境。这使PSV性能培训师能够分析他们已经熟悉的平台中数千万行的数据。

鲁德说:“使用这种音高控制模型对于荷兰足球来说是非常独特的。”“这是我们希望在培训中利用的东西,但是我们也看到了增加更多价值的可能性。例如,我们试图将音高控制与某些事件联系起来,以了解通行证如何影响音高控制。”


跑步开始后准备更多

在反思这项合作时,ASML-PSV团队感到自豪。罗布赞扬了跨组织项目的敏捷性和速度。“我们推动自己和PSV真正致力于独特的事情 - 并在它上取得快速的进步。我们的最终团队也很高兴与PSV合作,许多同事也是粉丝。这意味着四处精力!”

正如鲁德确认的那样,PSV对迅速的进步印象深刻。“整个项目和所有可交付成果都只花了三个月。在如此短的时间内获得这些结果为我们的PSV未来做出了贡献。”


该团队已经准备好了,并希望将已经存在的内容进行工业化,以便PSV的表演培训师每场比赛后都会收到自动报告。该团队还积极调查与PSV野心相匹配的新用例。


Diederick还寄予厚望:“在ASML,我们知道数据科学领域正在迅速发展。潜力几乎是无穷无尽的,我们必须做出明智的选择,以获得最佳的结果和最大的影响。如果您问我,我们才刚刚开始。”

关于作者

  • 桑德·霍夫曼
  • 媒体关系经理
  • 桑德(Sander)喜欢在ASML的数字渠道万博manbetx官网登录上将技术,故事和媒体融合在一起。他白天是一个沟通的家伙,晚上有抱负的编剧,也是一个怪胎。