NHL. Продвинутая статистика. Часть 1 - Погружение
Форварда Виннипега Блэйка Уилера спросили недавно, обращает ли он внимание на такие показатели продвинутой статистики как Corsi и Fenwick. Его взгляд выразил полнейшее непонимание, будто бы его спросили про пару игроков с Марса.
"А?", ответил Уилер. "Я даже не знаю, что это такое. Мой ответ будет - нет. Я никогда не слышал об этом, что вы такое говорите?"
Не будем откладывать эту тему в долгий ящик, ведь сезон подходит к концу, а нам с вами многое ещё стоит обсудить. Давайте поможем Блэйку Уилеру разобраться, что к чему, в такой непростой хоккейной науке, как продвинутая статистика. Хотя сложной она кажется только на первый взгляд.
В материале "NHL. Сезон 2013-2014 через призму командного Fenwick'а" мы уже коснулись тех самых показателей, столь озадачивших уважаемого хоккеиста. Давайте ещё раз повторим их, а так же дополним новыми терминами наш глоссарий:
1. Corsi = shots on goal (броски в створ) + missed shots (броски мимо ворот) + blocked shots (заблокированные броски)
Corsi - статистика, первоначально введённая Джимом Корси, тренером вратарей Баффало. По своей сути Corsi похожа на хорошо всем знакомую +/- статистику, но только в рассчёт берутся не забитые комадами шайбы, а броски в створ ворот, броски мимо ворот и заблокированные броски.
Возможные виды Corsi:
Corsi-For (CF) - Corsi-броски нанесённые командой. Такой же показатель встречается и для игроков, но отражает только броски конкретного игрока, без учёта бросков, которые наносились его партнёрами по звену, в момент когда тот находился на поле.
Corsi-Against (CA) - Corsi-броски нанесённые командой соперника.
CF% - процент, который составляет Corsi-For от суммы Corsi-For и Corsi-Against.
CF60 и CA60 - показатели CF и CA в среднем на 60 минут игрового времени. Для игроков так же встречаются показатели на 20 минут - CF20, CA20.
Corsi On - результирующий Corsi между CF60 и CA60, разница этих показателей. Демонстрирует нам баланс Corsi, производимый командой за 60 минут игрового времени, когда конкретный игрок (для которого производится расчёт) находится на поле.
Corsi Off - в противовес Corsi On отражает среднее значение Corsi, производимое командой за 60 минут, когда заданного игрока нет на поле.
Relative Corsi (Относительный Corsi) - выражен разностью Corsi On и Corsi Off. Является способом измерения эффективности владения шайбой игрока, относительно остальной команды.
Читать как: При нахожении Эрхоффа на поле, команда наносит за 60 минут на 12.7 в среднем бросков больше, чем без него. Кори Конакер единственный с положительным Corsi On, так как у него преобладает статистика полученная ещё в Оттаве.
Всё просто, Corsi это всего лишь броски, но за счёт того, что в расчёт идут не только точные попадания в створ, идёт рост количества данных, а чем больше данных, тем лучше будет наша итоговая выборка. Что мы получаем в итоге, как можно трактовать Corsi?
Ответ: Через призму Corsi мы можем оценить давление, создаваемое командой/игроком на поле, владение инициативой. Команда заинтересована в том, чтобы владеть шайбой, ведь зачастую выигрывает именно тот, на чьей стороне находится инициатива. Это звучит убедительно на большой дистанции, такой как целый сезон.
2. Fenwick = shots on goal + missed shots
Вместо Corsi в любом месте можно точно так же рассматривать Fenwick (показатели FF, FA, FF60, FA60, FF%). Данный вид статистики отличается лишь тем, что не учитывает заблокированные броски. По моим соображениям, при сравнении команд предпочтительней использовать именно этот показатель, а для игроков логичней использовать Corsi.
3. Quality of Competition
QoC или качество противостояния. Ряд показателей, через которые в численном виде нам представляют условную силу соперников заданного игрока. Как правило, наивысший QoC имеют лучшие оборонительные игроки команды, это либо самые ответственные защитники, либо лучше shutdown-форварды. С одной стороны, это те парни, на которых тренер соперника натравливает свои лучшие силы. С другой, это те бойцы, которым тренер их команды доверяет противостояние с этими лучшими силами противника.
Не буду вдаваться в тонкости расчётов, просто перечислю какие именно бывают показатели:
+/- QoC - выражение QoC через относительный +/- соперников.
Corsi QoC - выражение QoC через средний Corsi соперников.
Corsi Rel QoC - выражение QoC через средний относительный Corsi соперников.
Лидеры по этим показателям в лиге: среди защитников - Дион Фанёф и Карл Гуннарсон; среди нападающих - Логан Кутюр и Патрик Марло.
4. Quality of Teammates
QoT или качество партнёров. Всё то же самое, что и Quality of Competition, но уже по отношению к партнёрам по звену заданного игрока. Показатели точно такие же: +/- QoT, Corsi QoT, Corsi Rel QoT.
5. Зона старта
Off Zone Start % - единственный показатель, который нам понадобится. Процент выхода игрока на вбрасывание в зоне соперника. Подразумевается не выход на саму точку вбрасывания, а лишь выход на смену, когда назначено вбрасывание в зоне нападения.
Применение полученных знаний
К чёрту теорию, Блэйк Уилер уже утомился. Давайте перейдём непосредственно к одному из вариантов применения хоккейной продвинутой статистики, а именно к Player Usage Charts или Диаграммам Использования Игроков, ведь вы уже поняли, что по отдельности все эти показатели мало что значат, зато когда они вместе, можно натворить много дел.
Данные сайта Behind the Net приведены, к сожалению, пока только на 24.03.2014, не совсем свежие, но для анализа текущего сезона более чем достаточные.
И так, для интереса предлагаю рассмотреть несколько пограничных команд. Условия:
1) Минимум игр в сезоне - 30
2) Ось X - Off Zone Start %
3) Ось Y - Corsi Rel QoC (Чем выше игрок находится на диаграмме, тем сильнее соперники, которым он противостоит)
4) Размер круга - среднее игровое время за матч
5) Цвет круга - Corsi On или Corsi Rel (Синий цвет - наибольший уровень Corsi, коричневый - наименьший)
1. San Jose Sharks - как самая доминирующая команда лиги по абсолютному показателю Corsi-For в равных составах
(цвет круга - Corsi On):
(цвет круга - Corsi Relative):
Трудно разобрать фамилии в центре, вы это сами сможете сделать на сайте, нас же больше интересуют пограничные случаи.
Удивительно для меня, что эта команда, при абсолютном лидерстве по Corsi-броскам, не обладает особым территориальным преимуществом. Весомая часть важнейших игроков располагается по левую сторону от отметки 50%, отвечающей за зону старта.
Какие тренерские решения нам становятся видны? Очень берегут Мартина Гавлата, выставляя его чаще в зоне атаке - очень резкое отличие от остальных. Так же небольшие поблажки в этом плане делались и для молодого дарования - Томаша Хертла. И напротив, лидеры команды, Кутюр, Торнтон, Марло, Павелски активнее остальных используются МакЛелланом для выходов в зоне защиты. Сан-Хосе явно придерживаются мнения, что лучше всего будет, если самых сильных игроков соперника будут закрывать лидеры команды. Сильно выделяется и shutdown-защитник Джастин Браун, его активнее остальных выпускают в своей зоне.
Как я уже говорил, Логан Кутюр, абсолютный лидер лиги по показателю QoC среди нападающих, но кроме этого, он обладает ещё и очень высоким уровнем самого Corsi, при этом выходит глубже всех нападающих команды.
Джо Торнтон, обладатель самого синего кружка диаграммы, даже на фоне мощных лидеров Сан-Хосе выглядит неким Corsi-монстром.
Диаграмма демонстрирует нам, что лидеры Сан-Хосе доминируют над лидерами других команд на площадке. 3-4 звенья в целом так же играют в плюс со своими визави.
2. Toronto Maple Leafs - как команда, получающая наибольшее количество Corsi-бросков
(цвет круга - Corsi On):
(цвет круга - Corsi Relative):
Ожидаемый дичайший контраст между самой бросающей и самой получающей командами лиги. Полностью синие в абсолютных значениях Сан Хосе против полностью бурого Торонто. Трудно разглядеть что-то интересное среди коричневой кучи, Relative Corsi нам здесь больше поможет.
С одной стороны Фанёф с Гуннарсоном лидеры лиги по уровню соперников (QoC), а с другой стороны у них ужаснейший Corsi On - меньше -20 у обоих, что так же близко к лидерству в лиге, но уже с отрицательной стороны. Так оправданно ли их использовать против лучших соперников, если в итоге они с ними не справляются и это приводит к таким результатам. Трудно сказать, смогли бы это сделать Гардинер с Франсоном, но попытаться бы стоило, хотя бы чуть-чуть разгрузить первую пару защитников.
О какой повышенной результативности Кларксона и Кулёмина может идти речь, когда оба исполняют роли shutdown-игроков (роль защитного нападающего), и поэтому чаще всего начинают смены в своей зоне. Плюс, ещё Джей МакКлемент стартует в полном shutdown.
Среди нападающих довольно ровно распределяются соперники по силе, чуть выделяется Бозак, за ним уже Ван Римсдик с Кулёминым и Кесселом. Из лидеров, в чуть большей степени берегут Кадри, но он при этом оправдывает ставку лучшим в команде Corsi. Выпадающие вниз Эштон Картер и Орр слишком мало времени проводят, чтобы их имело смысл как-то оценивать, и получают таких же парней из 4-го звена себе в соперники.
То ли дело в плохом подборе лидеров, то ли Карлайлу пора на пенсию, очевидно, что сейчас эта команда не играет, а страдает на поле. Удивительно как долго они давали хороший результат и занимали высокие места. Я вовсе не хотел глумить Торонто вторую статью подряд, ведь статистика в хоккее даёт далеко не полную картину, всё же тут не учитывается ни исполнительское мастертсво талантливых нападающих (Кессела, Ван Римсдайка, Лупула), ни игра спецбригад, ни отличная игра Бернье, но в плейофф команду, столь уступающую позиционно, видеть бы очень не хотелось.
UPDATE - Забавная картинка про Торонто и их Corsi:
Подведём итоги
Надеюсь теперь у Блэйка Уилера появилось ещё больше вопросов. К Виннипегу и личной статистике Блэйка мы обратимся в следующий раз, а пока сделаем какие-то краткосрочные выводы.
Мы рассмотрели 2 противоположные команды, и увидели, что ни в коем случае не можем сравнивать их игроков между собой. Внутри команды - да, это можно сделать куда проще и объективнее. Но, в первую очередь, продвинутая статистика нацелена на понимание модели игры команды, на тренерские установки, которые трудно уловить по ходу матча, на оценку использования того или иного игрока.
Продвинутая хоккейная статистика не универсальная пилюля от всего, а одна из призм восприятия игры. Вряд ли она сравнится когда-нибудь с бейсбольной сайберметрикой, но и отвергать это учение не стоит. Какие-то аспекты этой теории можно подвергать сомнению, но учиться правильно использовать и трактовать её стоит.
Интересные сайты по этой теме: