29 мин.

Лучшие футболисты Европы по эффективности продвижений мяча. Работа с метрикой xT на основе данных от opta

Для того чтобы оценивать эффективность атакующих действий футболистов во владении (в стадии buildup) сегодня используются три основных типа метрик:

  • Метрики на основе xG (xGChain, xGBuildup)

  • Метрики на основе цепей Маркова (xT)

  • Метрики на основе машинного обучения (VAEP, OBV, PV, g+, EPV)

В данной статье рассмотрим первые два типа. Разберемся на примерах с тем, как рассчитываются данные метрики. Выделим сильные с слабые стороны данных подходов. Все это проделаем на основе event-данных от opta, собранных с сайта whoscored.com и некоторой статистики с сайта understat.com. Полученные в данной статье результаты будут использованы в последующих статьях и визуализациях.

Если неинтересны детали, то можете смело переходить в конец к итоговому рейтингу лучших футболистов Европы прямо сейчас по метрике xT.

Если же хотите разобраться на простых и наглядных примерах с тем, что такое xT, и зачем вообще была нужна эта метрика, то вперед к статье.

1. Метрики на основе оценки ожидаемых голов (xG)

xGChain (xGC) - это суммарное значение xG для всех цепочек владения по ходу матча, в которых был нанесен удар по воротам, и в которых участвовал рассматриваемый игрок. По-другому можно сказать, что результат каждой атаки в виде финальной оценки xG транслируется на всех игроков, участвовавших в комбинации, и далее для каждого игрока суммируются все атаки, в которых они были задействованы, в результате чего получается итоговое значение xGChain по ходу матча.

Ниже рассмотрен пример выделения цепочки владения (possession chain) и разметки действий метрикой xGChain в рамках одного из владений Барселоны в матче против Реал Мадрида от 28-10-2023.

Представленная цепочка состоит из 6 событий: передача Гюндогана на Ямаля, продвижение с мячом (carry) и последующий пас испанца на Левандовского, передача Роберта на Рафинью, обратный пас на поляка и удар. Всем игрокам, которые участвовали в данном владении, присваивается значение xG последнего удара = 0.03.

Далее для каждого игрока суммируются все xG по всем владениям и получается финальная оценка. Данную метрику в свободном доступе для всех матчей ТОП5 европейских лиг можно найти на understat.com.

Важно понимать, что данная метрика может несколько отличаться в различных источниках как по причине отличий в оценках xG от различных поставщиков данных, так и по причине различий в способах выделения цепочек владения. Обычно за начало цепочки принимают первую передачу или продвижение мяча во владении для рассматриваемой команды, а за окончание - удар по воротам или потерю мяча (угловой, штрафной или свободный удар и выход мяча за пределы поля также являются событиями, которые завершают цепочку владения).

Однако возникают нюансы - кто-то считает, что цепочка также завершается если было сделано хотя бы два касания игроками противоположной команды, кто-то считает, что в рамках цепочки владения могут быть подкаты и воздушные единоборства, совершаемые игроками противоположной команды, но если противоположная команда не завладела мячом (игрок не сделал передачу или продвижение мяча), то продолжается предыдущая цепочка владения.

Также зачастую при расчете xGChain рассматривают только цепочки владения в рамках open-play фазы, т.е. не учитывают цепочки после стандартных положений (удары, непосредственно после розыгрыша штрафных или угловых). Упомянутый выше understat предоставляет именно xGChain OP, хотя явно об этом нигде не указывается.

По итогам классико футболисты получили следующие итоговые оценки после суммирования всех цепочек владения.

Наблюдается явный перекос по xGChain у игроков Реала. Причина - затяжная позиционная атака Мадрида в добавленное время, закончившаяся голом Джуда Беллингема. Давайте посмотрим на соответствующую цепочку владения, построенную на основе данных opta с whoscored.com.

Атака началась с восстановления реалом владения после рывка Вальверде и борьбе за мяч с Бальде на своей половине поля.

Выиграв борьбу, Федерико, продолжая оставаться под давлением, сделал первую передачу в цепочке на Карвахаля почти от угловой отметки.

Далее после быстрого продвижения мяча в финальную треть и нескольких последующих смен направления затяжной позиционной атаки Реала, Карвахаль сделал передачу в штрафную на Модрича. Хорват, пытаясь обработать непростой мяч, сделал легкое голевое касание, которое решающим образом изменило траекторию мяча и повлияло на исход эпизода.

В результате Джуд нанес удар из позиции с довольно высоким значением xG.

В рамках рассмотренного владения Реал совершил 13 передач и одно голевое касание мяча Модричем (BallTouch), которое по сути также является передачей. В данной цепочке было задействовано 9 человек, каждый из которых получил xGChain = 0.57.

Можно по разному пытаться «экспертно» оценить степень влияния того или иного игрока в данном голе, но одно можно сказать точно, оценки для Рюдигера и особенно Алабы, сделавших по одной передаче без внешнего давления в рамках позиционной атаки в центральной части поля, не должны оцениваться точно таким же значением, какое получил Модрич, дважды изменивший направление атаки через пас после продвижений мяча и совершивший ключевое голевое действие.

Помимо xGChain также на understat.com можно найти еще одну метрику, основанную на xG - xGBuildup. Данный показатель считается абсолютно аналогично xGChain, только при оценке действий в рамках владения не рассматриваются два заключительных действия - голевая и удар. В рассмотренной атаке Биллингем совершил только удар, поэтому его вклад в buildup оценивается как нулевой (xGBuildup = 0). Лука также ничего не получает за голевую по xGBuildup, но так как в рамках владения он совершал другие действия, продвигающие мяч, то в данной атаке он все равно получит xGBuildup = 0.57.

Безусловно, рассмотренные выше метрики помогают в некоторой степени оценивать вклад любых игроков на поле в создаваемую опасность у ворот соперника. Однако приведенные примеры демонстрируют явные ограничения данного подхода:

  • оцениваются только действия во владениях, которые закончились ударом

  • все игроки во владении получают одинаковые оценки в независимости от степени влияния на итоговую создаваемую опасность (количество и тип совершенных действий, положение поля, в котором совершалось действие и тд)

Как итог, не смотря на то что данная метрика до сих пор периодически используется в некоторых любительских аналитических выкладках, обычно для раскраски игроков и передач на pass network (смотрите следующую статью), будущего у нее нет. На смену ей несколько лет назад пришли более утонченные подходы, о которых поговорим далее.

Основная ценность от xGChain сейчас - сугубо образовательная. При анализе event-данных важно научиться правильно выделять цепочки владения мячом. В отсутствии четкого описания того, после каких действий цепочка завершается, можно сделать следующее упражнение: взять event данные с whoscored.com за несколько матчей, взять данные xG для ударов и также финальные оценки xGChain по соответствующим матчам c understat.com. Далее нужно отладить алгоритм обрезки цепочек событий так, чтобы суммарные оценки xGChain, полученные самостоятельно, совпадали с итоговыми оценками xGChain. В результате вы получите возможность быстро выделять для визуализации произвольную цепочку владения в произвольном матче.

2. Метрики на основе марковских цепей

Перейдем к рассмотрению метрики xT (xThreat, expected threat, ожидаемая угроза). Эта метрика стала очень популярной в последние годы в любительской аналитике. Ранее я уже публиковал подробную статью, в которой детально описан процесс появления и эволюции метрик на основе марковских цепей. Если будут интересны дополнительные детали, то вы сможете погрузиться глубже чуть позже. Сейчас же постараемся ответить максимально просто на следующие вопросы: что измеряет данная метрика, и как она считается ?

Метрика xT оценивает изменение вероятности забить гол при перемещение мяча между двумя точками футбольного поля (через N следующих действий). Обычно с помощью данной метрики оцениваются либо передачи и продвижения мяча вместе, либо же отдельно передачи и отдельно продвижения. Суммируя значения данной метрики по ходу матча можно оценить вклад каждого из игроков в потенциальную создаваемую опасность у ворот соперника. Также можно просуммировать все значения за матч и получить одну итоговую оценку.

Из определения выше вытекают два основных фундаментальных отличия от ранее рассмотренных метрик

  • xT позволяет оценивать любые действия продвигающие мяч на футбольном поле в независимости от того, будет нанесен удар в соответствующей атаке или нет

  • xT дает независимые оценки для каждого действия на футбольном поле в рамках одной атаки или цепочки владения мячом (это значит: Алаба и Рюдигер не получат сверхвысоких оценок за незначительный вклад в созданный момент в примере выше с атакой Реала; а для цепочек владений, закончившихся ударами из позиций с низким xG, как в примере с атакой Барселоны, другие игроки смогут получать более высокие оценки)

По сути можно смотреть на xT как на оценку того, как изменится xG потенциального удара, которой мог бы быть нанесен через N действий при перемещении мяча в заданную точку футбольного поля.

Один из примеров использования xT - построение графика, на котором отображается кумулятивная (нарастающая) сумма значений, которые зарабатывают игроки команды по ходу матча.

Обычно такой график идет параллельно с графиком накапливаемого xG, как и в примере выше. Периодически можно наблюдать картину аналогичную той, которая соответствовала событиям в классико - одна команда несколько превосходит другую по набранным xG, однако по создаваемой угрозе, оцениваемой через xT, наблюдается противоположная картина.

Основой расчета метрики xT является - матрица переходов (transition matrix). Такая матрица строится на статистике ударов, голов и действий, перемещающих мяч, за некоторый исторический период.

Также очень важной деталью при построении матрицы является выбор количества последующих действий, совершаемых после целевого. Получаемая оценка xT дается именно для оценки вероятности забить через определенное количество последующих действий.

Ну и конечно же важна размерность матрицы переходов, которая используется при расчете значений метрики.

К сожалению, максимум пояснений, который обычно предоставляют авторы публикаций при использовании метрики xT, - ссылка на твиттер создателя модели @karun1710 (работающего Data Scientist-ом в Арсенале) с указанием, что применяется именно эта модель и все. Далее вы увидите, что существует ряд важных нюансов при подготовке матрицы переходов. Без понимания того, на какой матрице переходов рассчитывал xT тот или иной автор, зачастую нет возможности корректно сравнивать и сопоставлять полученные значения метрик.

В сети я нашел несколько примеров готовых матриц переходов.

Матрица переходов от создателя модели

Оригинальная матрица от автора модели представлена ниже (можно скачать здесь.) Ссылку на эту матрицу автор выложил в своем твиттере без указания количества действий, для которых были рассчитаны соответствующие значения метрики.

Данная матрица была получена на основе статистики ударов, голов, пасов и продвижений мяча для матчей АПЛ 2017-2018. Каждая клетка матрицы - это значение xT для данной конкретной зоны (или по другому - вероятность забить гол находясь с мячом из каждой конкретной зоны через несколько последующих действий). (Затрудняюсь сказать наверняка, сколько здесь было учтено действий, сам автор не привел дополнительных комментариев, но обычно используется 4-5).

Чтобы получить значение xT для любой передачи или продвижения мяча из точки А в точку Б, нужно просто вычесть из xT конечной области - xT начальной области. Например, если успешная передача была сделана из области углового в область 11-метровой отметки, то пасующий игрок получит за такое действие 0.11 - 0.04 = 0.07 xT и т д.

Ниже представлена еще одна матрица переходов от автора модели, которую можно найти в основной статье автора с презентацией метрики xT.

Данная матрица имеет большую гранулярность и получена при оценке вероятности забить гол через 5 последующих действий. Используя данную матрицу при оцени xT для передачи из области правого углового флажка в область 11-метровой отметки, которая несколько ближе к угловому флагу, мы получим оценку xT = 0.176 - 0.068 = 0.108. Полученное значение можно однозначно интерпретировать следующим образом - в результате передачи вероятность забить гол через следующие 5 действий увеличилась на 10.8 процентов.

Для простоты восприятия и объяснения для широкой аудитории конечно можно смотреть на эту метрику как на изменение вероятности забить гол в результате совершенной передачи или продвижения мяча. Количество последующих действий важно на этапе построения модели.

Более наглядно «работу» метрики можно посмотреть все в той же оригинальной статье автора в интерактивном режиме (можете менять кол-во действий, для которых рассчитывается матрица переходов, и наблюдать за изменением вероятностей для различных областей футбольного поля)

Если вы передвинете ползунок с 5 на более низкие значения, то увидите, что значения xT в непосредственной близости у ворот меняются незначительно, а в остальной части поля более существенно. Если зафиксировать количество действий равным 3 и рассмотреть аналогичную ситуацию передачи из области углового в область штрафной, то увеличение вероятности забить гол в результате передачи несколько увеличится и будет равно 0.133 или 13.3%.

Все вышеперечисленное указывает на то, что по-хорошему при предоставлении оценок по метрике xT важно указывать на то, какая использовалась матрица переходов. Мы видим, что один и тот же пас для матрицы переходов, построенной на основе одних и тех же данных, для различных значений гранулярности и количества последующих действий получает различные оценки по метрике xT. (7%, 10.8% и 13.3%).

Матрица переходов от twelve

Также в сети вы можете найти матрицу переходов от компании twelve, автором которой является @jernejfl (Data Scientist в twelve football). Текущая матрица имеет еще более высокую гранулярность - 21 на 17 ячеек.

Есть несколько видео на ютубе где для оценки xT предлагается использовать именно эту матрицу. При этом я нигде не нашел ссылок или описания деталей построения представленной матрицы. На видео ниже автор канала не вдается в детали и просто указывает на то, что для построения этой матрицы использовалась статистика по очень большому количеству матчей и что каждая клетка - это вероятность забить гол из соответствующей позиции.

Если вы сравните схожие области на матрице от первого автора и матрице от twelve, то вы увидите, что в последней ячейки имеют более низкие значения. Также еще раз можно обратить внимание, что повышение гранулярности приводит к тому, что ячейка из предыдущего примера внутри штрафной площади со значением 0.176 для матрицы (5 действий) распадается на две ячейки на матрице от twelve (0.068 и 0.0143) и новая получаемая оценка приращения xT при передаче от углового флага может варьироваться в 2 раза, в зависимости от того, в какую из двух более гранулярных зон попадут координаты паса.

Матрица переходов от the Athletic

Есть статья от the Athletic от 2021 года. В ней автор строит свою матрицу переходов ("модель xT") используются данные за три сезона АПЛ (2018-2019, 2019-2020, 2020-2021)

Далее автор приводит ряд рейтингов на основе полученной метрики xT, в частности предлагает для рассмотрения рейтинг лучших игроков АПЛ по метрике xT приведенной к 90 минутам матча для передач и продвижений мяча на дриблинге.

Также приводится отдельный рейтинг по xT только для передач.

И аналогичный, только уже для продвижений

Я решил построить новую матрицу переходов и использовать матрицу и рейтинги от the Athletic для того, чтобы провалидировать методику оценки xT для передач и продвижений мяча (убедиться, что я корректно считаю метрики на основе готовой матрицы и event-данных).

Важные детали

Использование рассмотренных ранее матриц не совсем корректно по следующим причинам:

  • матрицы автора модели были построены только для АПЛ и уже должны были устареть (актуальны непосредственно после сезона 2017-2018)

  • по матрице от twelve нет деталей по использованным данным при расчетах (сколько сезонов и какие лиги), но учитывая, что она появляется в сети в 2021, то также можно сделать вывод, что она должна была устареть

У меня нет данных относительно динамики изменения матрицы от сезона к сезону при накоплении статистики, просто интуитивно кажется, что паттерны ударов и продвижений мяча могут меняться с течением временем. Интуицию могу подкрепить одной из моих старых статей и интересным графиком, на котором видно, как снижается доля ударов с дальней дистанции в АПЛ на протяжении периода в 6 лет. А координаты и статистика ударов напрямую влияют на итоговые значения xT в матрице переходов.

Также важно иметь в виду, что разные авторы могут использовать разные данные на входе (различные источники - wyscout, opta, statsbomb). Плюс ко всему в процессе построения может проводиться дополнительная предобработка данных. Все это неминуемо ведет к тому, что итоговые результаты (получаемые матрицы) будут отличаться друг от друга.

Для наглядности сравним две рассмотренные матрицы одинаковой гранулярности 16 на 12. (Матрица от Karun, против матрицы the Athletic, рассмотренные ранее).

Ниже представлена разница в абсолютных величинах между двумя матрицами. Видно, что значения xT в финальной трети поля в окрестностях штрафной площади для зон матрицы автора модели несколько превосходят аналогичные значения для матрицы, представленной на the Athletic.

Аналогичная разница, только в относительных величинах. В каждой клетке приведено значение, которое соответствует %, на который значения в оригинальной матрице от Karun больше или меньше аналогичных значений в матрице the Athletic.

Пожалуй основное назначение визуализации выше заключается в том, что нужно с большой осторожностью подходить к сравнению значений метрик xT из разных источников между собой.

Валидируем методику расчета xT для передач и продвижений

Итак, мы хотим научиться оценивать игроков по метрике xT, используя готовую матрицу переходов на основе данных о событиях.

Возьмем готовую матрицу переходов от the Athletic за три сезона и получим рейтинг игроков по xT, аналогичные тем, которые были рассмотрены ранее. Для этого парсим event-данные с сайта whoscrored.com для АПЛ за соответствующий сезон (2020-21).

К сожалению, полученные данные являются не полными, в них отсутствует один давольно важный тип событий - carries (продвижения мяча на дриблинге). Без carries в будущем нельзя будет построить максимально корректную матрицу переходов.

Однако на двух картинках с цепочками владения выше вы видели отображение соответствующих событий (волнистые линии). Эти события были добавлены мной самостоятельно, путем интерполяции значений между двумя соседними событиями, для которых наблюдается разрыв в значениях координат (если бы у вас был полноценный доступ к event-данным, вам бы не пришлось этим заниматься). Соответственно аналогичная процедура была проделана для всего датасета. В результате удалось «восстановить» продвижения мяча для всех футболистов.

Далее среди всех event-данных были выделены только действия, продвигающие мяч - пасы, обыгрыши и продвижения мяча на дриблинге, совершенные в стадии open play. Среди выделенных действий оставлены только успешные. Плюс дополнительно были удалены все кроссы. Последнее необходимо для того, чтобы исключить сильный перекос значений по данной метрике для фланговых защитников и полузащитников, который обусловлен повышенным количеством передач верхом в штрафную площадь соперника со средних и дальних расстояний (при сравнении с другими игроками). Все перечисленные стадии предобработки и фильтрации данных также описываются в статье the Athletic.

Следующим шагом накладываем все совершенные действия на матрицу переходов и, вычитая из конечной зоны начальную, получаем итоговые значения xT.

Заключительным этапом на основе сырых данных о событиях с whoscored.com считаем чистое сыгранное время для каждого футболиста АПЛ в сезоне 2020-2021. Дело в том, что такие популярные ресурсы как fbref и understat не учитывают дополнительное время. В результате по ходу сезона для многих игроков накапливается более одного дополнительного полноценного матча (дополнительные 90 минут), что не учитывается на указанных порталах. Это в свою очередь отражается на метриках, приведенных к 90 минутам. Поэтому не совсем корректно использовать время из этих источников.

После чего нормируем полученные значения xT на 90 сыгранных минут, предварительно оставив только тех игроков, кто имел более 900 минут на поле. Полученные результаты приведены ниже.

Рейтинг лучших игроков по опасности передач с игры по метрике xT.

Сравнение с исходным рейтингом от the Athletic.

Видно, что в целом рейтинги довольно похожи. Из 20 футболистов в исходном рейтинге почти все присутствуют в обновленном перечне. Единственное исключение - вместо Джаки в наш рейтинг попал Родриго. Также можно отметить некоторое отличие в итоговом месте Матича, который из середины рейтинга опустился в конец. При этом наблюдается некоторое смещение в 1-2 сотых xT между приведенными перечнями.

Теперь рассмотрим аналогичный рейтинг, только для продвижений мяча.

Сравнение с исходным рейтингом от the Athletic.

Здесь полученные результаты согласуются с оригинальным рейтингом несколько хуже. Видно, что не удалось выделить Стерлинга в среди других футболистов. Рахим попадает на второе место после Грилиша. Вместо Кертиса Джонса и Аарона Коннолли в нашем рейтинге появились Рафинья и Педро Нету. Также можно отметить, что некоторые футболисты оказались на несколько других позициях внутри полученного рейтинга.

Несмотря на наблюдаемые различия можно сделать вывод, что нам удалось довольно неплохо восстановить данные по продвижениям мяча (18 из 20 исходных игроков попали в итоговый рейтинг!). Дело в том, что почти любая попытка восстановить пропущенные значения путем интерполяции сопровождается ошибками. А если принять во внимание, что сами исходные event данные зачастую могут иметь ошибки, связанные с некачественной разметкой событий, то становится очевидным, что получить идеальную картину маловероятно. (На самом деле можно попробовать усложнить методику восстановления данных, возможно в будущем вернусь к этому моменту.)

Наконец рассмотрим итоговый рейтинг - совместная оценка передач и продвижений.

Сравнение с исходным рейтингом от the Athletic.

Видно, что в полученном рейтинге отсутствует только один футболист из 20, представленных на рейтинге the Athletic. Вместо Кертиса Джонса в нашем рейтинге оказался Харви Барнс.

Также еще раз можно отметить, что есть некоторое смещение полученных значений относительно искомых. (В моем рейтинге значения ниже на несколько сотых).

Но в целом картина довольно схожая:

  • первом место с явным отрывом - Джек Грилиш

  • остальные игроки за исключением Рахима Стерлинга и Матео Ковачича относительно друг друга расположены давольно близко к исходным позициям

Как итог, можно сделать вывод, что нам удалось провалидировать методику предобработки event-данных и последующей оценки xT по готовой матрице переходов.

Строим собственную матрицу переходов

Детальный пример построения матрицы переходов можно найти здесь. Тезисно процесс построения и некоторые нюансы будут описаны ниже:

  • Парсим данные по ТОП5 лигам за последние 5 полных игровых сезонов (с 2018-19 по 2022-2023) с whoscored.com

  • Восстанавливаем события carries (продвижения мяча) для всех матчей на всей истории. (Используем определение события carry непосредственно от Opta=Stats Perform - любое продвижение мяча более чем на 5 метров, можно найти здесь)

  • Формируем датасет с действиями, которые перемещают мяч на футбольном поле (передачи, продвижения мяча, обыгрыши). Далее оставляем только действия, совершенные с игры (стадия open play), те исключаем угловые, ауты, штрафные и свободные. Также исключаем кроссы (дискуссионная тема, по матрице the Athletic и twelve можно уверено сказать, что в них также были исключены навесы).

  • Также формируем два отдельных датасета с ударами и с голами (аналогично оставляем только те, которые были нанесены/забиты с игры)

  • Далее проводим ряд калькуляций, описанных в примере по ссылке выше с курса от soccematics и Дэвида Самптера, и получаем итоговые матрицы переходов (рассматриваются 5 последующих действий при построении)

Я решил построить отдельные матрицы для каждой из ТОП5 лиг и итоговую матрицу по всем 5 лигам. (можно будет визуально сравнить матрицы между собой)

АПЛ

Бундеслига

ЛаЛига

Лига 1

Серия А

Итоговая матрица по ТОП5 лигам, которая будет использоваться далее во всех последующих визуализациях в этой и других статьях.

Применение метрики xT

Вернемся к последнему эль-класико и снова рассмотрим две цепочки владения, в рамках которых разметим метрикой xT все действия продвигающие мяч.

Если ранее все участники атаки получали одну оценку xGChain, равную низкому значению xG удара с дальней дистанции, то теперь у нас появился инструмент, позволяющий оценить индивидуальный вклад каждого участника атаки в созданную опасность.

Ямаль за два действия перемещающие мяч в зону перед штрафной площади получил xT = 0.032. Гюндоган, начавший атаку своевременной передачей на фланг, получил xT = 0.009. Передача Левандовского на Рафинью и обратный пасс под удар на Роберта получили уже более низкие оценки по xT: 0.006 и 0.007.

Полученные результаты можно трактовать так: Ламин Ямаль своими действиями в рамках рассмотренной цепочки владения повысил шансы забить гол (через несколько следующих действий) на 3% и внес наибольший вклад среди всех участников атаки по метрике xT.

Далее мы можем оценить метрикой xT все продвижения мяча игроков Барселоны по ходу матча и выделить тех, кто своими действиями чаще всех доставлял мяч из менее опасных зон в зоны, с более высокой вероятностью гола.

В таблице ниже отсортированы все футболисты Барселоны с суммарными значениями за матч по метрике xT для трех типов действий, продвигающих мяч (передачи, продвижение и обыгрыши).

Ниже по аналогии рассматривается самое «эффективное» владение Реала по метрике xGChain.

В Топ 3 действия по xT в рассмотренном владении формально вошли:

  • предголевая передача Карвахаля на Модрича в штрафную площадь (xT = 0.124). Метрика xT во многом помогает в первую очередь оценивать эффективность предголевых действий в заключительной части buildup-а, непосредственно перед голевой передачей и ударом.

  • продвижение на дриблинге Камавинги в рамках первой фазы атаки (xT = 0.026)

  • передача Рюдигера на Карвахаля, после которой испанец отдал передачу на Модрича в штрафную (xT = 0.021)

Конечно же велик соблазн оценить метрикой xT и голевое касание Модрича, за которое хорват получил бы космические xT = 0.247. Однако, как было описано выше, opta маркирует такое касание не передачей, а специальным типом BallTouch, в результате которого перемещение мяча или отскок к другому игроку совершается непреднамеренно (no intentional pass).

Оценку всех действий в рамках рассмотренного владения можно найти в таблице ниже.

Также стоит обратить внимание на передачу Алабы, которая по метрике xT имеет отрицательное значение. Рассматривая недостатки метрики xGChain именно на этой передаче был сделан акцент, тк данная передача получала высокое положительное значение наряду с другими передачами в атаке.

С одной стороны кажется, что нормально давать отрицательную оценку за передачу поперек (формально поперек + несколько назад в зону, расположенную чуть ближе к своим воротам). Обычно в итоговых рейтингах по xT действия с отрицательными оценками исключаются из рассмотрения.

С другой стороны эта оценка демонстрирует пожалуй самый явный недостаток метрики xT - большинство передач назад оцениваются отрицательными значениями. Данного недостатка лишен другой класс метрик, основанный на применение машинного обучения. (сравнение одной из таких метрик с xT в контексте передач назад освещалось в статье по ссылке)

В таблице ниже отсортированы все футболисты Реала с суммарными значениями за матч по метрике xT. (Модрич без xT за BallTouch)

Лучшие футболисты Европы прямо сейчас по метрике xT

В качестве финальной точки с метрикой xT предлагается рассмотреть актуальные рейтинги лучших футболистов Европы по создаваемой опасности через продвижение мяча.

Снова парсим данные с whoscored.com по TOP5 лигам по текущему сезону. Берем полученную ранее матрицу переходов. Считаем чистое время. Формируем итоговый рейтинг.

Однако перед демонстрацией рейтинга стоит сделать одно замечание. Моя матрица переходов по своим значениям получилась ближе к исходной матрице от автора оригинальной модели, а не к матрице от the Athletic. Соответственно некорректно будет сравнивать рейтинги между собой.

В рейтинге от the Athletic максимальное значение приведенное к 90 минутам у Грилиша равнялось 0.34 xT. Если обновить рейтинг на основе моей матрицы переходов, то Джек получит 0.83 xT.

Лучшие футболисты Европы по создаваемой опасности через пасы и продвижения мяча в TOP5 лигах.

Полученный рейтинг имеет следующую структуру:

  • по 7 игроков из АПЛ и Лиги1

  • по 4 игрока из Ла Лиги и Серии А

  • 3 игрока из Бундеслиги

Лучшие футболисты Европы по создаваемой опасности через пасы в TOP5 лигах.

Структура:

  • 8 игроков из Бундеслиги (4 из Байера!)

  • по 5 игроков из АПЛ и ЛаЛиги

  • 4 игрока из Лиги 1

  • 3 игрока из Серии А

Лучшие футболисты Европы по создаваемой опасности через продвижения мяча на дриблинге в TOP5 лигах.

Структура:

  • 9 игроков из АПЛ

  • 6 игроков из Лиги 1

  • 5 игроков из Ла Лиги

  • 4 игрока из Серии А

  • 1 игрок из Бундеслиги

Интересная картина наблюдается для Бундеслиги, которую к сожалению я почти не смотрю. В рейтинге ТОП25 футболистов, создающих опасность через продвижение мяча, есть только один игрок. В моменте кажется, что это может быть свидетельством высокого уровня оборонительной игры в целом по всей лиге и как следствие повышенной сложностью продвижения мяча через дриблинг. Так же это может объясняться отсутствием соответствующих игроков с сильными индивидуальными навыками по продвижению мяча.

В этом ключе логично видеть перекос в той же Бундеслиге по количеству топовых созидателей через передачи. Хотя возможно это притянуто за уши. В любом случае интересно услышать мнение постоянных зрителей чемпионата Германии.

Телеграм канал автора

P.s.

В следующей статье рассмотрим процесс построения карты передач на основе event-данных с добавлением дополнительного слоя с метрикой xT.