索尔马兹:我怎样建立莱斯特城数据分析部门

\n

索尔马兹 是 777 Partners 的足球分析总监,这是一家多俱乐部所有权集团,其投资组合包括热那亚、标准列日、达伽马和墨尔本胜利。

\n

索尔马兹在担任了莱斯特城首席数据分析师三年后,与2022年6月离开了球队,转投了777 partners。 在去年 12 月 TGG 的大数据网络研讨会上,索尔马兹发表了题为“多俱乐部模型中的数据分析”演讲,这里解释了他是如何着手建立莱斯特城的数据部门。

\n\n

担任不同的角色

\n

每个人都有一条通往足球分析的道路或旅程,以及他们如何处理它。 我认为拥有一个分析框架有四个关键组成部分:

\n

衡量:决定衡量什么数据指标是重要的,以及赋予不同信息多少权重。 可以衡量一切,但你必须磨练。

\n

策略:实施足球分析的策略是什么? 把有限的资源他们集中在哪里? 这是每个从业者都必须回答的问题。

\n

行动:有些时候你只是一个信息的搬运工,有些时候你则是触发俱乐部变革行动的引线之一, 分析总是伴随着一定目的,需要融入策略并融入具体的行动计划和流程。

\n

协同:我们如何将数据分析方面的知识与足球中的知识进行交互,使两者不仅仅是各自部分的总和? 有些信息可以更好地了解我们试图回答的问题。

\n

在莱斯特城,我们拥有来自各家数据公司的各种数据源。 该过程总是以原始格式获取数据,将其导入某种数据库,然后让不同的从业者将其存储在云存储桶、SQL 关系数据库或简单地存储在 Dropbox 中文件夹。

\n\n

最后一步也是最关键的一步是,“我们如何以更具交互性的方式理解数据并进行数据分析?”

\n

在我看来,构建数据分析的技术是数据分析部门更容易的工作。 我很早就在莱斯特意识到,我与其他工作的职工要进行的互动更为重要。

\n

起初,我是分析部门唯一的联系人,通常一周或一个月必须与教练、足球总监、表现分析师、球探主管、球探、运动科学家等交谈。 每一个人都有自己不同的观点,这就是工作中人际交往能力方面的用武之地。重要的是要意识到他们都有不同程度的背景知识,不同程度的舒适度和数据经验。 足球总监不会有和表现分析师分析师一样的深度。

\n

我在莱斯特工作六个月后,召开了一次名为 Tactical Insights 2020 的会议,副标题是“弥合差距”。 我从来没有见过一个会议室里挤满了既有专业背景的人,也有数据头脑的从业者。 我们想举办一场活动,让很多教练、表现分析师、医疗部门员工和数据科学家聚集在一个会议室里讨论。

\n

这次会议给我们带来很多不同的想法。 我们考虑了如何进行数据分析以及如何在俱乐部内部进行沟通的各种挑战问题,因此数据部门不仅仅是只是提供数字。

\n

一个哪怕只有一两个人的小型分析部门也需要分担其他职务。

\n

其中之一是后端工程师。 当你自己创办一个部门时,这是你工作的一部分。 你同时也是数据科学家和分析师,因此您必须能够独立进行数据建模和扩充。

\n

以及前端工程师,做基本的 UI 设计并将这些高级统计数据转化为帮助人们或加快工作流程的用例。 最后,需要将这些统计数据交付给高级球探和表现分析师。

\n

因此,您必须弄清楚报告中的各项原始数据是怎么与主教练或其他职工提供的资料相关联,比如会议中的视频报告。 

\n

总是期望在报告中体现出所有事情意味着将无法充分发挥潜力。 尽管如此,仍必须找到有用的方法来为数据报告增加价值。

\n

最重要的一步是使用一些高级统计数据以改善球员表现或通过帮助球探发现潜在引援球员的价值。

\n

这是数据科学家和教练/球探/表现分析师之间需要进行所有沟通和联系的地方。 即使你所在的俱乐部缺乏资源,你仍然可以用分析给球队带来正面帮助。

\n

如果您所在的俱乐部没有数据科学家或资金来发展数据科学,那么更应该从项目管理上去考虑。 下面是我建议的概念性步骤:

\n

1.召开初次会议,决定新项目以及优先级。

\n

2.建立一个来自表现分析师建议框架的粗略的总览图。 确定关键数据指标以及它们代表的意义。

\n

3.创建项目 - 编写代码形成项目解决方案,并获得有关调整和更改的反馈。

\n

4.将项目结果上传到各终端,允许分析师通过不同类型的软件直接访问,例如 R Shiny。 

\n

5.寻求改进和迭代的方法。

\n

赛后流程

\n

我们为莱斯特一线队所做的事情是创建一个赛后分析流程来加速分析。 比赛终场哨响后不久,我们就会得到为我们准备好包含所有比赛统计数据的文件。 然后进行预处理、可视化并手动注释需要说明的内容。

\n

在终场哨响后的 30 分钟到一个小时内,我们会通过 WhatsApp 将 分析结果PDF 发送给工作人员,这是比赛统计数据的基本摘要。

\n

两到三个小时后,我们将从英超联赛获得的跟踪代码的 API 拉取,我们将立即更新整个比赛回合,包括 Stats Perform 和 Second Spectrum 数据。

\n

通常最需要数据的部门是运动科学部门,因为他们要统筹赛后第二天的恢复工作。

\n

终场哨响后 12 小时,我们将提取 Statsbomb 摘取的比赛内容,进行质量检查并将其上传到数据库。

\n

14 到 24 小时后,将根据 Statsbomb 数据向教练组发送完整的赛后报告。 我们还将使用球探部门使用的代码来整理数据,并同时更新数据库。

\n

这是很多单独的小步骤,但从外面看,您看到的只是一页或 12 页的报告!

\n

每周流程

\n\n\n

我们制定的另一个时间表是支持一线队团队的理想每周流程,这是我们在我离开之前制定的。

\n

在距离比赛还有五天的时候,我们会为一位表现分析师提交对手的赛前报告。比赛日之后,立刻将对手的报告发送给另一位表现分析师,这样他们就可以早点开始准备工作。 他们一周剩下的时间将主要用于寻找视频和剪辑视频。

\n

如您所见,这一天,我们在莱斯特城称之为赛前负五日, 这时要确保每个人根据职务所要求的细节的颗粒度拿到他们所需要的数据报告。

\n

赛前负4 3 2 1日,主要参与数据质量保证工作、会议、数据部门流程总结、临时和长期数据整理工作。

\n

然后在比赛日当天,将有一页即时的赛后统计报告以及赛后第一第二天恢复工作所需要的运动科学部门的数据。 然后在赛后第二天,会有需要尽早交付的更详细的赛后总结报告和反思,以便为下一场比赛日提供赛前工作。

\n

除了常规流程外,其他流程在进行,例如球探部门、临时报告、与不同数据供应商的会议和职员技能提升, 还有赛季总体走势报告。 

\n

主要经验

\n

关键是要建立一个可以让所有人参与的流程。 建立一个只有你能执行的流程是没有用的。

\n

我在 777 parnters的当前职务中学到了其他重要经验:

\n

向一些人寻求帮助。 我刚开始建立数据分析部门时,只有我一个人。 随着时间的推移,一线队数据分析师安德鲁·彼得斯和表现分析师迈克尔·戴维斯给我提供了很大的帮助。

\n

自动化是关键。 任何有空闲时间来自动化你知道你将再次需要的过程的地方都必须被无情地使用。 我相信8/2经验法则 - 每周 80% 的人向你提出的请求都是相同的,而 20% 可能是新的。 这80%的任务就最好自动化实现以充分解约每个人的时间。

\n

花额外的时间来注释你的报告,尤其是新作品。 即使你已经建立了一个非常好的分析流程模式,当你展示新工作时你有时会自满,有时它并没有变得有效,因为你没有花时间解释它并且已经假定的知识。

\n

考虑不同的数据展示模式。 数据可视化不是唯一的方法,尽管它在 Twitter 和博客中占主导地位,但一旦进入俱乐部工作,有些人喜欢开短会议,有些人喜欢列出要点,有些人希望在视频中展示球员。

\n

在社交活动中与其他职员建立联系。 这似乎与分析无关,但足球俱乐部是一种社交事物,您可能不会在日常工作中看到所有员工。 任何参与更广泛事物的机会都有助于建立关系并让你更容易接近。

\n

你会发现关键的经验是人际关系,而不是技术水平。当你从无到有建立一个部门时,以人为本是最重要的元素。

\n

TAG标签

回到顶部