ЧТО ВАМ НУЖНО ЗНАТЬ, ЧТОБЫ СТАТЬ ФУТБОЛЬНЫМ АНАЛИТИКОМ?
Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).
Самый частый вопрос, который я слышу, это какие навыки необходимы, чтобы стать специалистом по анализу данных в футбольном клубе? Для многих профессия спортивного аналитика представляется работой мечты. Если вы фанат футбола и обожаете статистику, то нет ничего лучше, чем превратить свои увлечения в профессию. Исходя из этого, возникает вопрос: какие навыки необходимо развивать, чтобы получить место в клубе?
Чтобы на него ответить, давайте, для начала, обратимся к имеющимся данным. Десять лет назад клубы ограничивались сбором общей статистики по голам, броскам, количеству угловых, владению мячом и т.д. Но эти данные не представляли большой ценности для тренерского состава. Конечно, знание о том, что команда пропускает много мячей или часто теряет контроль над игрой, дают повод задуматься, но мало чем помогают в разработке стратеги. Типичная статистика, которую мы видим на экране телевизора, как таковая, не помогает команде выиграть матч.
Вторая волна футбольной аналитики наступила с началом сбора и анализа данных о перемещениях мяча на поле. Британская компания Opta, крупнейший поставщик футбольной статистики, предоставляет графики с координатами каждого паса мяча, каждого действия защиты и каждого удара. В настоящее время, Opta, Statsbomb, Wyscout и еще ряд букмекерских компаний являются основными поставщиками такого рода данных.
Событийные данные оказались полезны для многих клубов. В частности, при поиске новых игроков. Самый известный в этом плане показатель – модель ожидаемых голов. В ее основе лежит число ударов по воротам, на основе которого можно оценить, сколько голов мог бы забить игрок, если учесть, сколько атак он инициировал. Другие, более продвинутые показатели, включают ожидаемые голевые передачи, их эффективность в продвижении мяча, степень владения мячом, показывающая, сколько игроков было последовательно задействовано в передаче. Эта статистика, наряду с более традиционными показателями, вроде количества голевых ударов, перехватов и завершения передач, представлена в виде радара игрока. Радар показывает, как действует каждый отдельный игрок в сравнении с другими участниками той же лиги.
По собственному опыту знаю, что многие футбольные скауты любят эти диаграммы. К счастью или к несчастью, эти данные дают им возможность подтвердить свои догадки насчет игрока или оценить способности юного дарования.
Чтобы обрабатывать и анализировать событийные данные, также необходимо знать программирование. Желательно уметь работать с Python или R, а также необходимо изучить основы статистического моделирования. Ожидаемые голы - это модель логистической регрессии. В моделях прогнозирования паса используется либо логистическая регрессия, либо базовые нейронные сети. Это темы, которые входят в базовую программу бакалавриата и магистерских курсах статистики. Но их также можно освоить на онлайн-курсах.
Несмотря на то, что важно знать вышеописанные методики сбора данных «с поля», будущее футбольной аналитики, вполне возможно, кроется в чем-то другом. Я встретился с Раулем Пелаэсом Бланко, руководителем отдела Анализа Инновационных Спортивных Технологий ФК «Барселона», и спросил его о данных, на которые сейчас ориентируется команда.
Он прямо заявил: «Мы не полагаемся на событийные данные при оценке игроков. Мы считаем, что гораздо важнее понимать, как игроки действуют в разном контексте. Например, если мы смотрим на нападающего, который очень хорошо владеет мячом в контратаках, то задаемся вопросом, как он будет вести себя при хорошо организованной защите соперника. Данные статистики не дадут вам ответа на этот вопрос»
Прежде чем подписать контракт с игроком, мы должны выяснить, как он реагирует на ситуации, с которым столкнется в контексте игры в Барселоне», - делится Рауль. «Стало популярным классифицировать игроков, используя данные статистики. Но они не принимают во внимание контекст. А это сильно искажает реальное положение вещей».
Однако было бы неверно полагать, что Рауль выступает против использования данных. Как раз наоборот. Но для него вопрос заключается в использовании правильных данных. Как считает Рауль, - проблема с событийными данными заключается в том, что их вырывают из контекста. При таком подходе мы не знаем, например, где находятся другие игроки в момент передачи. Вместо этого, в нашем клубе применяется анализ данных сразу обо всех 22 игроках и мяче. Это помогает тренеру сделать выводы и подобрать подходящую тактику. Данные о 22 игроках – третья волна футбольного анализа, намного более полно отражающая реальную картину. Как следует из названия, этот анализ содержит координаты всех игроков на поле, а также положение мяча. Это важно для понимания контекста. Во время типичного матча Луис Суарес за 90 с лишним минут игрового времени владеет мячом не более 90 секунд. То, что Суарес или любой другой игрок привносит в игру - прессинг, бег, чтобы освободить пространство, тактическое расположение, - нельзя просто измерить статистикой ударов. Для Рауля и его команды первым шагом к использованию этих данных была автоматизация работы видеоаналитиков. «Несколько лет назад видеоаналитики тратили большую часть времени на запись игр и маркировку матчей и тренировок», - рассказывает Рауль. «Теперь компьютеры могут делать это самостоятельно, а у видеоаналитиков появилась возможность сосредоточиться на получении информации». Выполнение этих задач требует навыка машинного обучения и компьютерного зрения. Необходимо уметь создавать алгоритмы для правильного определения позиций игроков в режиме реального времени. Также программа должна суметь отличить, является ли ситуация контратакой или нападением. Эта проблема до сих пор до конца не решена. Алгоритмы допускают ошибки. Даже в высших лигах, где для съемки матча используются сразу несколько камер и разных ракурсов, данные по-прежнему не отражают действительность на 100%. Возможно, это шанс для амбициозного молодого ученого-информатика?
Несмотря на ограничения, данные отслеживания 22 игроков уже достаточно надежны, чтобы начать делать выводы. Например, физик Уильям Спирман, сейчас работающий в ФК «Ливерпуль», разработал модель пасов, которая показывает, какие передачи возможны, а какие будут перехвачены. В прошлом году одна из моих студенток в области вычислительной техники, Фрэн Перальта Альгуасил, создала модель, аналогичную модели Спирмена, чтобы отследить процесс принятия решений игроком. Она смогла продемонстрировать, как «прорывные пробежки» игроков «Барселоны» открывают пространство для их товарищей по команде. В проекте активно применялись ее знания в области физики для имитации движения игрока и динамики мяча. Без надлежащей научной базы, Фрэн не смогла бы имитировать движение мяча. Также важно знать, как применить код на вычислительных системах с возможностью параллельной обработки данных, чтобы сразу видеть результаты. «Члены профессиональных команд будут стремиться использовать данные для принятия решений в режиме реального времени. Компьютеры предложат тренерам дополнительный вариант. А те смогут вносить изменения прямо во время матча », - комментирует Рауль.
Для меня вывод беседы с Раулем заключается в том, что любой, кто хочет заняться футбольной аналитикой, должен мыслить шире. Знания даталогии и статистика важны, но здесь также открываются возможности для тех, кто хорошо разбирается в физике, компьютерном зрении или параллельных вычислениях. Тренерам и спортивным ученым также придется развивать свои навыки, чтобы максимально эффективно использовать новый аналитический подход. Им придется научиться понимать, что сообщают математические модели, и знать, каким результатам можно доверять, а когда стоит положиться на собственную интуицию.
Еще одно. Очень важно быть командным игроком. Рауль сделал отсылку к Хавьеру Фернандесу, о котором мы рассказывали в предыдущей статье: «Хавьер - щедрый человек. Он делится всем, чему учится, - рассказывает Рауль. – Такова и философия «Барсы». Это не снижает нашей конкурентоспособности, потому что истинная ценность в обучении. Конечная формула - это лишь заключительный аккорд. Но самая красивая часть - это пройденный путь». Подводя итоги, какой бы путь вы ни выбрали в области анализа данных, убедитесь, что вы подходите к делу открыто. Общайтесь, учитесь, делитесь своими знаниями. Это то, что приведет к созданию футбольной аналитики будущего.