Когда «манибол» бесполезен. Почему нельзя доверять продвинутым рейтингам

От редакции: вы читаете пользовательский блог «Баскетбольное ранчо», где пишут об американском баскетболе – мужском и женском. Если труд автора вам по душе, поддерживайте его плюсами. Это не будет лишним.

Разговоры о баскетболе изменились. Исследовать реальность охотников все меньше, куда заманчивей окопаться в уютном мирке цифр и формул. Массив данных пухнет с каждых годом, математические вузы выпускают счетоводов/аналитиков, а тех хлебом не корми – дай все систематизировать и выстроить по ранжиру. Было бы забавно увидеть аналитику по матчу «Олимпиакоса» и ЦСКА в 1995-м, когда половину состава армейцев отравили психотропным веществом. Думается, защитный рейтинг москвичей был ни к черту. А как насчет «Голден Стэйт» без Дюранта, Томпсона и Игудалы? Подарок судьбы, богатейшая фактура. Можно выставить Карри никчемным показушником и уйти безнаказанным, красота.

Загружаю...

Командные метрики не учитывают травмы, конфликты с тренером и приступы камерунской диареи, но производительность клуба оценивают без прикрас. Количество забитых/пропущенных очков на 100 владений, расчеты темпа, эффективного процента с игры (EFG%) – полезные штуки, удобно отсеивать зерна от плевел, видеть разницу между «Никс» и «Милуоки». Вдумчивый просмотр матчей и продвинутая статистика помогает принять верное решение, доказывать нечего, пройденный этап.

С индивидуальными рейтингами ситуация резко хуже. Засоряют эфир. Их приводят в сравнениях игроков разных лет, строят подобие анализа, дурят головы неофитам. Представьте, человек с улицы увлекается НБА, а на него вываливают телегу, что игрок Х полная туфта. Мол, PER как у лавочника БК «Астана», BPM Джереми Лина, отрицательный WS и VORP. Немудрено стушеваться и поверить в авторитет хитро выструганных формул, ссылкам на ESPN и Basketball-Reference.com, мекки аналитиков-самоучек.

Прогуляемся по модным рейтингам и убедимся, что прока от них, как от Дэвида Фицдэйла на латвийской границе. С какой заразой боремся? На повестке четыре головы аналитической гидры.

Загружаю...

PER (Player Efficiency Rating), он же Рейтинг эффективности

Рейтинг эффективности придумал автор ESPN Джон Холлингер. Холлингер – не чуждый НБА персонаж, отработал в лиге больше двух десятилетий, семь сезонов вице-президентом «Мемфиса». Джон одним из первых препарировал цифры в «продвинутой» манере. В конце 90-х принялся публиковать анализы в Интернете (тогда сеть была мирком технарей и упоротых всех мастей), выпускал ежегодный статистический журнал Basketball Prospectus. Холлингер отказался от привычных очков/подборов/передач «за матч» в пользу «минут». Значимость подхода трудно переоценить, в наши дни расчет на владения и минуты стал нормой. Джон сочинил массу персональных рейтингов, самым популярным стал PER.

Переписывать формулу бессмысленно. Гуманитарный мозг не переварит, а любители матана могут лично отправиться на Basketball-Reference и упиваться бесконечными переменными. Главное, PER рассчитывается на базе старых добрых очков, забитых мячей, трехочковых, подборах и прочих радостях, но добавляет в рецепт средние показатели по команде и лиге, плюс выравнивающий коэффициент за игровой темп. Автор рейтинга не скрывает – PER слабо оценивает защитников, только по перехватам и блокам.

Косяки PER несложно заметить, по нему Нерленс Ноэл равен Крису Полу, Кристиан Вуд полезнее Брэдли Била. Несмотря на спорный результат, PER стал ходовым инструментом в руках баскетбольных гиков. Высочайший PER в истории имел Уилт Чемберлен в 1963-м году – 31,82.

Загружаю...

WS (Win Shares), он же Доли побед

«Доли побед» – так называлась книга знаменитого бейсбольного аналитика Билла Джеймса. Именно на трудах Джеймса менеджер «Окленд Эйсес» Билли Бин создал команду, прославленную книгой Moneyball и фильмом «Человек, который изменил все» с Брэдом Питтом. По задумке автора, каждая победа бейсбольной команды делится на условные три доли победы. Поровну, как апельсин. С помощью формул и божьей матери доли распределяют между игроками, оценивая вклад в общий котел. Кто больше победных долек заслужил, тот красавчик.

Адаптировать WS к баскетболу сумел именитый статистик, создатель сайта Basketball-Reference Джастин Кубатко. Он не только выдавал креатив в интернетах, а работал в реальной НБА. С 2008-го по 2011-й Джастин служил консультантом по статистике в «Портленде», в 2014-м НБА наняла его, чтобы запилить софт для обработки той же самой статистики.

Кубатко отказался от деления побед на три куска, для него одна победа – одна доля. Также, в отличие от бейсбола, Джастин допустил существование негативных долей побед. Что вполне разумно, если вдуматься – не каждый игрок приносит пользу, от некоторых больше вреда (привет Айзее Томасу!). Доля победы складывается из атакующей и защитной доли. Атакующая считается из показателя Принесенных очков (Points produced) и количества владений. Как считаются принесенные очки? Суровый матан из забитых мячей, ассистов и подборов на чужом щите.

Загружаю...

С защитными долями проще, извлекаются из защитного рейтинга игрока. Полученные числа пропускают через сито корректировок на средние количества владений, темпы и рейтинги. На выходе дистиллятор отмеряет вклад баскетболиста. Абсолютный рекордсмен по WS – Карим Абдул-Джаббар 1972 года, 25,37 долек.

Аномалии WS этого сезона – 4-е место Руди Гобера в общем рейтинге при 38-м Донована Митчелла. Говорят, ссора Донована и Руди вовсе не из-за коронавируса случилась. Кто-то скинул Митчеллу ссылочку на баскетреф, вот и бомбануло. Другие улетные приколы – Джаретт Аллен выше Джоэла Эмбиида, Митчелл Робинсон превзошел Николу Вучевича. Келли Олиник принес «Майами» больше побед, чем Кендрик Нанн – вот Споэльстра удивится!

BPM (Box Plus-Minus), Продвинутый показатель полезности

Даниэль Майерс родился в городе Норман, Оклахома, в семье аптекаря. Закончил университет, получил степень по структурному анализу. Трудился в департаменте транспорта, конструировал мосты, инспектировал стройки. Дневные дела Майерса важны жителям Оклахомы, ночные – баскетбольным аналитикам. В свободное время Даниэль заседал на форуме APBRmetrics, пристанище цифровых маньяков, где продвинутыми методами оценивают вклад Пиппена в чемпионства «Буллс» и чинят игру «Никс» переводом Бобби Портиса в старт.

Плавильный котел аналитических идей тихонько булькал, прорыв случился в 2014-м. Первой ласточкой в реформе показателя полезности стал аналитик «Финикса» Иеремия Энгельманн. Немец уволился из «Санс», обосновался на ESPN, где предложил новую метрику, реальная полезность (Real Plus-Minus, RPM). Цель – нивелировать фактор «крутого партнера», чтобы парень, которому повезло играть с условным Яннисом/ЛеБроном не собирал зверские плюсы чужими руками. Энгельманн пересчитал полезность на 100 владений и разделил атакующие/защитные владения. Простыми очками не ограничился, а запихнул в расчеты все существующие показатели, от подборов до возраста. Качество работы не осталось незамеченным, в 2019-м Иеремию приняли в «Даллас» старшим аналитиком.

Загружаю...

Майерс пошел дальше, скрестил традиционную статистику с продвинутыми рейтингами и назвал новорожденную чуду-юду BPM. Новинкой стали позиционные коэффициенты. По замыслу Даниэля, разыгрывающий отвечает за креативность (организатор), а дело бигменов (принимающих) – запихивать мячик в корзину с метких передач. В лиге с Йокичем и Грик Фриком говорить о позициях моветон, и все же BPM нашел путь в сердца, очень уж солидно и продуманно смотрится.

Рекордный BPM в истории несколько лет держал Расселл Уэстбрук 2017-го года, но в феврале этого года Майерс поменял формулу, чтобы не поощрять хиробол. Новый чемпион BPM – ЛеБрон 2009-го, следом за ним Джордан-88, Стэф Карри-2016 и Дэвид Робинсон образца 1994-го. Что до прошедшего сезона, приколов хватает. Дружок Янниса Донте ДиВинченцо оказался полезней Джейлена Брауна, лучший запасной лиги Деннис Шредер не годится в подметки Делону Райту, Стивен Адамс играючи рвет единорога Порзингиса. Цирк, да и только.

Загружаю...

VORP (Value Over Replacement Player), Полезность относительно игрока замены

VORP пришел к нам из бейсбола, как и WS. В конце 90-х метрику предложил математик и фанат «Бостон Ред Сокс» Кейт Вулнер. Выпускник Массачусетского технологического института после учебы бился над стартапом в Силиконовой долине, но вскоре понял, что бейсбольные цифры занимают его больше, чем проектирование софта. Девять лет Вулнер писал для аналитического журнала Baseball Prospectus, с 2007 работает боссом по аналитике в клубе MLB «Кливленд Индианс».

Кейт исходил из того, что в бейсболе мало суперзвезд, много «середняков» и хоть лопатой загребай «шлака». «Игрок замены» по Вулману – бестолковый парень на дне пищевой цепочки, который сидит за минимальную зарплату в любой команде. Если поставить его в старт, сыграет лучше или хуже, но средний уровень ясен. VORP оценивает, насколько игрок полезнее, чем случайный иванушка-дурачок.

У адаптации VORP для баскетбола не было одного отца, хотя Даниэль Майерс пробегал мимо. Безумцы-аналитики сломали сотни копий на форумах, пока не решили – игрок замены в баскете должен иметь BPM минус 2. Почему 2, а не 3 или 1? Да хрен его знает, верить или нет – дело хозяйское.

Нехитрый расчет определяет полезность на 100 владений в сравнении с условным «Мело», который наденет вашу майку за миску риса. Из-за привязки к BPM, исторические рекорды VORP очень близки. Джордан-88 и ЛеБрон-09 впереди планеты всей, Робинсон также рядом, зато сезон Карри-2016 из топа вывалился.

Загружаю...

Чем веселит VORP в реальном мире? По нему Дариус Гарланд – худший игрок НБА, 514-й в рейтинге, днищенское дно. Гарланд – продукт сырой, а то и бракованный, но хуже всех? Рейтинг не любит Кайла Кузму и Эрика Паскалла, парням пора в Китай. Случайный запасной «Чикаго» Шакил Харрисон дает прикурить Коллину Секстону, опозорившийся француз Батюм смотрится солидней хайпового Тайлера Хирро. Невозможно воспринимать всерьез, слишком жесткое расхождение с реальностью.

Если взять все метрики разом, истина откроется?

Увы, количество курьезов не уменьшается. Для финальной казни подберем две полные пятерки чисто по продвинутым меркам. Оговорка: пул для набора игроков ограничен 193 ребятами, которые попали в рейтинги PER и BPM (резервистов в расчет не берем, только железные игроки ротации).

Первая команда набрана среди худших по продвинутой статистике, назовем ее «Сборная Ай-Теста».

Воскресший Маркелл Фульц не убеждает математиков, хотя близок к попаданию в защитную пятерку, диктует удушающий темп «Орландо» и по-здоровому агрессивен. Формулы неумолимы. 241-й в лиге по VORP, любой дворовый Вася справился бы лучше.

Диллон Брукс напрасно тащил «Мемфис» в зону плей-офф, наковырял всего 1,0 WS. Сосед Диллона по подвалу рейтинга VORP – Ар Джей Барретт. Пока публика восхищается смелостью и атлетичностью таланта «Никс», BPM рисует жуткие -4,3. PER добивает с ноги, 173-й в НБА.

Загружаю...

Пи Джей Вашингтон закрепился в старте бедового «Шарлотт». В активе новичка цепкость, уверенная работа корпусом, периодический дальний бросок. Пи Джей ровно приносил пользу весь сезон, да так и не впечатлил ни одну из хитроумных метрик. 255-й BPM в НБА, остальное не лучше. Картер-младший играл неровно, мучался травмами, хотя держал марку, собирал стабильный дабл-дабл. В хаосе тренера Бойлена надеяться на большее наивно. 360-й VORP выглядит как приговор.

Вторая пятерка зовется «Мечта аналитика», в ней обитают парни, которые превосходят игроков «Ай-Теста» по четырем продвинутым параметрам.

Смотрите, как легко мусорная стата дурит рейтинги. Алек Беркс насобирал халявы в «ГСВ», получите-распишитесь, 86-й игрок НБА по PER. Его партнер по задней линии – Тайус Джонс, запасной разыгрывающий «Мемфиса». Джонс приносит «мишкам» подлинную пользу, выше среднего по BPM, солидный VORP, сносный WS.

Заглянул недавно в словарь синонимов, искал варианты к слову «посредственность». Там была напечатана фотография Микела Бриджеса. Про таких, как Бриджес, Иоанн Богослов писал: «Знаю твои дела, ты ни холоден, ни горяч; о, если бы ты был холоден, или горяч!» (Откр. 3:15). Высматривать Микела на паркете приходится с лупой, но VORP, BPM и WS уверены – это один из столпов «Финикса». Из-за невзрачных цифр в атаке у Бриджеса вялый PER, зато выше Барретта.

Загружаю...

Маркиз Крисс растратил талант, ничтожество в кубе, дурилка картонная. Усмешка творца подарила Криссу место в старте «Уорриорз», тот и покуражился. Согласно PER, пассажир из Сан-Франциско 43-й игрок НБА. Если бы участников Матча всех звезд набирали по продвинутой стате, Маркиз мог проскочить, жуть.

Ларри Нэнс – единственный в «аналитической» пятерке, кого не стоит скармливать свиньям. Центр «Кливленда» – случайный заложник BPM и PER, они вынесли Ларри непомерно высоко. Нэнс полезный игрок, который не имеет права быть лучше Картера, разные касты.

Кому верить?

Статистика не способна на обман, цифры лишены эмоций. Лукавство не в рейтингах, а в их оценке. Неспроста авторы метрик получали работу в лиге, их главный скилл – обработка данных, поиск закономерностей, отсев совпадений. Проблемы возникают, когда статистику ставят во главу угла, игнорируя ее объективную ущербность. Когда приводят удобные факты, набрасывают чисел в пользу любимчика или предвзято топят фаворита публики.

Ни VORP, ни PER не годятся для сравнения Леброна с Джорданом. Фантазии останутся фантазиями, нам не дано узнать, как Чемберлен сыграет в лиге победивших «пулялок». Кобе Брайант останется сыном 90-х, продвинутые расчеты не отыщут истину, лишь добавят тумана. Единственный путь к трезвости – смотреть игры. Только ай-тест не позволит поддаться учениям цифровых лжепророков и уверенно держаться под струей анализов.

Загружаю...

Смотрите баскет, кайфуйте, оставьте статистику фрикам.

Телеграм «Баскетбольное Ранчо»

Инстаграм «Баскетбольное Ранчо»

Подкаст «Ранчо»

Фото: Gettyimages.ru/Ezra Shaw, Ronald Martinez, Rob Carr; commons.wikimedia.org; globallookpress.com/Ringo Chiu/ZUMAPRESS.com

Этот пост опубликован в блоге на Трибуне Sports.ru. Присоединяйтесь к крупнейшему сообществу спортивных болельщиков!
Другие посты блога
Баскетбольное ранчо
Популярные комментарии
Денис Б.
Мне порой втирают какую то дичь типа True shooting, говорят самых крутых шутеров в истории определяет. Захожу посмотреть а там Деандре Джордан самый крутой в истории. // главная проблема этих рейтингов, что ими пользуются люди, которые в результате 2+2 не уверены, а надпись "10!" выглядит для них как-будто кто-то решил очень эмоционально написать, что это не просто десять, а ДЕСЯТЬ. в результате получается, что человек берёт рейтинг True shooting и думает, что он про "шутеров". и удивляется потом, что центровые тоже по кольцу кидают. и что центровой модели "дерево", который только данчит и звершает аллей-упы, внезапно набирает за 1 бросок больше, чем снайпер, пуляющий через руки трёхи с ведения.
Ответ на комментарий Cap!
Проблема этой статистики что ее пытаются преподнести большим чем она есть на самом деле и об это говорят даже названия показателей. Player Efficiency Rating. Efficiency? Серьезно? Эффективность? Просмотрел аллтайм топ лучших сезонов по этому показателю, в топ20 есть и Джордан и Леброн и Карри и Уилт и много кто еще, но всего четыре случая для кого один из лучших сезонов в истории лиги заканчивался чемпионством. Как то не очень эффективно, не находите? Эффектно? да! Но тогда так и пишите. В Лиге совсем недавно был игрок, чье второе имя "Эффективность", абсолютно плевавший на эффектность игрок, даже кликуха у него была Big Fundamental, так вот его сезоны тоже есть в этом рейтинге - во второй сотне. Даже Амаре Стаудмайер выдавал "эффективнее". Не претендую на однозначность, но по моему если в вашем рейтинге так мало одного из самых эффективных людей в истории игры то это понятие вы не имеете права использовать в названии. Так же можно и по остальным рассмотренным показателям пройтись, что автор и сделал. А ведь есть и другие. Мне порой втирают какую то дичь типа True shooting, говорят самых крутых шутеров в истории определяет. Захожу посмотреть а там Деандре Джордан самый крутой в истории. Так и представляю как этот парень собирает в кружок Дюранта, Джордана, Карри итд и говорит "Так, щеглы, берите тетради и ручки и записывайте - буду обьяснять вам азы атаки". Не спорю, что какая то польза от этой статы есть, но там не то что не "истина последней инстанции", но даже и не первой.
Денис Б.
лучший запасной лиги Деннис Шредер не годится в подметки Делону Райту, // если что, это не однофамилец, а тот же Шрёдер, который считался худшим стартовым пг в лиге, потом ушёл в бекап и был или неэффективным запасным (не вспоминая его зп) или ужасающим запасным (вспоминая его зп, что в контексте не важно). а потом с СП3 начал вроде как пользу приносить. шутка в том, что автор пишет про "Шрёдер лучший, рейтинг гамно" в том же абзаце, что и "эта формула создана нивелировать хороших-плохих партнёров и оценивать игрока самого по себе". бггг Командные метрики не учитывают травмы, конфликты с тренером и приступы камерунской диареи, // а ЗАЧЕМ делать скидку на обстоятельства? командный результат - это командный результат. если у тебя половина поломалась, а главная звезда в плей-офф с горшка не слезает или с тренером срётся, с чего бы результат пересчитывать? Аномалии WS этого сезона – 4-е место Руди Гобера в общем рейтинге при 38-м Донована Митчелла. // и автор даже в двух словах не пояснил почему это аномалия. просто аномалия и всё. видимо, Гобер полотенем машет весь матч, пока Митч в соло тащит Митчелл Робинсон превзошел Николу Вучевича // так Вучевич же играть перестал после получения контракта. Стивен Адамс играючи рвет единорога Порзингиса. // и? команда Адамса выше в таблице, сам Адамс играет лучше, приносит пользы больше. или Порзи лучше только потому что единорог? По нему Дариус Гарланд – худший игрок НБА, 514-й в рейтинге, днищенское дно. Гарланд – продукт сырой, а то и бракованный, но хуже всех? // врагу не пожелаю смотреть матчи Кэвс в этом сезоне, но ты сам напросился. посмотри. и да, он сырой как стейк, который ещё пасётся. и почему же рейтинг должен делать на это скидку? вроде коэффициента Ванги там нет. вот прорумянится, тогда и превраится из 514-го в хотя бы 300-го. но хуже всех? // в вакууме - нет, конечно он не хуже чувака на 2ст контракте, играющем в среднем 0,5мин/матч. в пересчёте на игровое время, он хуже того чувака.
Fungus_Amongus
Если смотреть на эти цифры нормально, а не так как автор, то картину можно получить вполне объективную. Просто надо знать как считаются эти метрики, что они учитывают, что нет, с какими особенностями игры игроков больше шансов на хорошие цифры, а с какими меньше. Минуты игровые надо учитывать, против основы или лавки были набраны цифры, смотреть на контекст - на уровень партнеров, командные результаты, а также NetRating команды с игроком и без. Понятно, что небросающие центровые всегда будут в топе по бросковой эффективности, т.к. они только ставят сверху. Из-за этого и того, что они обычно собирают много подборов у них будут хорошие продвинутые метрики. Но нельзя собрать команду только из небросающих игроков, даже если сумма их WS к примеру будет максимальной. Все дело в том, что небросающие игроки набирают свои очки за счет бросающих. Те обеспечивают для них спейсинг, стягивают на себя внимание защиты. При этом этот их пассивный вклад в атаку остаются неоцененным статистикой, все сливки собирают те, кто этим спейсингом пользуется, т.е. набирает относительно легкие очки из краски в которой только 1 или максимум 2 соперника, а не вся команда окопалась. Именно поэтому продвинутые цифры Гобера и Митчелла не показывают кто там более важен. Тем более в Юте уже традиционно дефицит скореров, лишиться очков Митчелла они не могут себе позволить, тогда просто некому будет стягивать на себя внимание защиты, ролевики сами себе открытый бросок не придумают. Его потеря ударит сильнее, чем потеря Гобера, думаю. В то же время, от спейсинга мало толку, если нет игрока, который этим спейсингом способен воспользоваться. Монтрезл например не бросает, ухудшает тем самым спейсинг, но что будет если его лишиться? Сможет ли Зубац набирать очки Монтрезла с его же эффективностью? Точно нет. Команда просто лишится приличного количества легких очков из краски, которые будут заменены средними бросками от Кавая, Джорджа или Лу-Уилла, эффективность которых существенно ниже. Понятно, что надо смотреть и на результаты и на партнеров. У меня даже собственная метрика есть, которая учитывает и то и другое. Потому что сравнивать просто так продвинутую статистку Данкана и Казинса например - бред. Первый давал результат, второй нет. Ценность цифр Данкана куда выше. Конечно, у Данкана и партнеры были лучше, поэтому и надо оценивать все в комплексе. Можно еще долго писать на эту тему, но пока хватит.
Еще 12 комментариев
15 комментариев Написать комментарий