«Ливерпуль» или «Манчестер Сити»? Сорри, но продвинутая статистика против Клоппа
Выбираем чемпиона по xG – все как вы любите!
«Ливерпуль» все еще лидирует в АПЛ по потерянным очкам (3 от «Сити» и 5 от «Тоттенхэма»). Такая позиция после большей части сезона удивляет даже Юргена Клоппа. Хотя можно упрекнуть тренера в ложной скромности, ведь именно благодаря его грамотному руководству команда находится на таком высоком уровне.
Ситуация «Ливерпуля» похожа на погоню «Ювентуса» за победой в Лиге чемпионов в последние годы.
Клуб выиграл 18 чемпионатов Англии (только у «Манчестер Юнайтед» больше). Но «Ливерпуль» не может выиграть этот титул с сезона 1989/90. Перед стартом АПЛ-2018/19 «Ливерпуль» не считался явным фаворитом турнира даже после успешной прошлогодней кампании в Лиге чемпионов, где он дошел до финала, где проиграл (во многом из-за вратаря Лориса Кариуса). Несмотря на трансферы Фабиньо, Наби Кейта и Алиссона Беккера, шансы «Ливерпуля» не выглядели запредельными, ведь прошлогоднее отставание от чемпиона – «Манчестер Сити», было огромным (целых 25 очков).
Чтобы преодолеть такой разрыв за один сезон, зачастую нужно в межсезонье заменить половину состава. «Ливерпуль» ничего подобного не сделал, поэтому их нынешний успех выглядит довольно неожиданно. Давайте попробуем отследить, насколько он закономерен. Еще попробуем оценить шансы «Ливерпуля» и его конкурентов на победу в АПЛ.
Оценивать команды мы будем с помощью xG-статистики сайта xScore.win. Скорее всего вы уже сталкивались xG-статистикой и знаете, как она работает. Но на всякий случай вот короткая справка.
Expected goals, xG статистика, основана на вероятности гола, которая рассчитывается в момент соприкосновения ноги игрока с мячом при ударе. На эту вероятность влияет количество возможных траекторий, по которым мяч может попасть в ворота, положение защитников и вратаря, угол и расстояние до ворот, положение игрока относительно мяча и его позиция в момент удара, его скилл и скилл вратаря, а также множество других менее важных факторов.
Основываясь на этих данных, мы можем выразить уровень игры команд в цифрах. Вот главные из них.
xG – это количество ожидаемых голов от одного футболиста или всей команды;
xGA – количество ожидаемых голов со стороны соперника в ворота команды;
xGD отображает разницу ожидаемых забитых и ожидаемых пропущенных голов;
xG/xGA draw выражает отношение ожидаемых забитых голов к ожидаемым пропущенным при равном счете.
Последний показатель кажется мне особенно интересным. При равном счете команды придерживаются изначальной тактики и играют в свой лучший, с точки зрения математики, футбол.
У xG-системы от xScore есть ряд важных плюсов. Она точнее, так как команда сайта обрабатывает эту статистику вручную, видя каждый удар футболиста и учитывая:
Позицию игрока.
Уровень (скилл) футболиста.
Расстояние до ворот
Расположение защиты
Например, удар Роберто Фирмино (ниже на скрине) большинство систем xG оценивает как 0,62 (Understat). На xScore удар был оценен 0,93 – большее количество факторов обрабатывается вручную. Что ближе к истине – решайте сами. Мне точно не кажется, что бразилец промазал бы в 4 из 10 случаев в таком эпизоде.
Окей, у нас есть xG-модель, в которой каждый момент отслеживается вручную и действительно совпадает с ощущениями обычных зрителей. Теперь давайте разбираться с чемпионской гонкой АПЛ.
Вот результаты «Ливерпуля»:
xG (Ожидаемые голы) – 55,3.
xGA (Ожидаемые пропущенные голы) – 19,3.
xG90 (Ожидаемое кол-во забитых за 90 минут) – 2,06.
xGA90 (Ожидаемое кол-во пропущенных за 90 минут) – 0,72.
xG90 при ничейном счете – 1,87.
xGA90 при ничейном счете – 0,72.
Теперь давайте рассмотрим данные по «Манчестер Сити»:
xG (Ожидаемые голы) – 65,7.
xGA (Ожидаемые пропущенные голы) – 21,9.
xG90 (Ожидаемое кол-во забитых за 90 минут) - 2,37.
xGA90 (Ожидаемое кол-во пропущенных за 90 минут) – 0.79.
xG90 при ничейном счете – 2,22.
xGA90 при ничейном счете – 0,46.
«Ливерпуль» заметно ближе к «Сити» по уровню игры, чем в прошлом сезоне, но все равно уступает команде Пепа Гвардиолы. Особенно важны показатели команд при ничейном счете – тут «Ман Сити» имеет лучшие цифры в лиге и в атаке, и в обороне.
До финиша осталось всего 13 туров. Дистанция довольно маленькая, но «Ливерпулю» очень трудно рассчитывать на титул, если игра подопечных Клоппа не улучшится внезапным образом. Пока игра «Манчестер Сити» все еще ощутимо лучше. Следовательно, их осечки выглядят менее вероятными, чем у «Ливерпуля». «Красные» давно ждут заветный титул. Их победа стала бы красивой историей, но вряд ли она случится в этом сезоне.
Также смотрите видео-версию, где шансы оцениваются еще подробнее:
От редакции блога «Англия, Англия»: этот материал не носит статус рекламы, но мы действительно считаем проект xScore интересным. Они разработали xG-модель, которая отличается от классических (во многих аспектах лучше), несут важные цифры в массы и даже учат ставить на основании этих данных. Вот отдельная ссылка на раздел xG-статистики, еще можете подписаться на ребят в соцсетях: YouTube, Телеграм, Вконтакте, Фейсбук.
Кстати нашёл в чём МС уступает ЛФК, это xG при том когда соперник ведёт в счете 1 мяч. МС -1,55. ЛФК -1,88. При этом если соперник ведёт 2 мяча то xG у МС падает до 0,6. А Ливерпуль вообще ни разу не уступал 2 мяча, то есть Ливерпуль лучше отыгрывается. Возможно из за этого ЛФК не потерпел такое количество поражений как МС. И это не показывает ли Ливерпуль как более морально устойчивую команду?
лукомский как-то писал, что в своих анализах намеренно избегает темы судейства, т.к. его (судейства) оценка крайне субъективна, но в своих текстах с удовольствием пользуется не менее субъективной оценкой происходящего на поле.
по теме: надеюсь ливерпулю хватит сил не выронить чашку назло всем этим мутным показателям.
Главная проблема understat.com и ему подобных ресурсов заключается в том что не учитывается позиция вратаря, позиция защитников в момент удара, также как и множество других факторов, из-за чего оценка каждого отдельного удара не может быть точной.
На xscore.win все эти факторы учитываются, так как данные параметры вбиваются статистиками вручную для расчета нейросетью.
И подскажите мне вот что. Матч Сити-Ливерпуль, вот момент с выносом мяча с линии имеет свой xG при обоих условиях забили/не забили. Но к примеру забили и счёт уже 0:1, потом 1:1, 1:2, 2,2. Ведь тогда команды получают совершенно другой результат при том же xG и как это можно учесть на шансах в каком-то турнире?
Общий xG не показывает ничего кроме как количество ожидаемых голов и всё. Бывают матчи где Ливерпуль забивает 4, а Сити 1. Обе выигрывают и при этом xG у Сити может больше и соответсвенно наоборот. А очков набирают оба по 3. Так почему исходя из этих показателей можно делать вывод что одна выиграет турнир, а другая нет? Определить какая команда фаворит в одном матче, исходя от среднего xG за матч, да, но не на весь турнир.
Хотя не надо акцентировать только на этом. Насколько понимаю, там выдается оценка исходя из факторов, а потом перепроверяется и адаптируется по руками. При перепроверке люди ориентируются на четкие, хотя субъективные критерии. Но ребята, которые работали над моделью, лучше объяснят.
В любом случае это все-таки отличается от того, как ты расписываешь.
По поводу судейства: нет, совсем другое говорил. Говорил, что не считаю, что понимаю в судействе на должном уровне, чтобы выносить вердикты. Также считаю, что судейство редко прямо влияет на тактику команду. В совокупности это дает минимальное упоминание темы.
Что касается использования xG: во-первых, в обзорах матчей его минимум, в рамках одного матча редко что-то суперинтересное можно увидеть, чего нельзя описать иначе; во-вторых, я использую как раз модель, которая только на объективных факторов, без адаптации руками. Как и любые методы, этот требует контекста. Правильность или неправильность зависит от того, как хорошо автор может дать контекст и трактовать данные.
Два совсем общих тезиса только оставлю:
1) В тексте есть редкие и интересные данные (особенно xG при ничейном счете), которые представляют ценность сами по себе.
2) К тексту скорее надо относиться как мини-посту. Подсветили для читателей неочевидный, но интересный факт. Погружения/исследования тут нет (и кажется, не планировалось).