8 мин.

Какая команда НБА ровнее других прошла сезон, а кого колошматило сильнее, чем «Лейкерс»? Узнать это поможет статистический анализ

От редакции: вы читаете блог «По обе стороны Атлантики», в котором объясняют баскетбол с помощью цифр. Поддержите автора плюсом, комментарием и подпиской!

Второй год подряд мы имеем сезон «не такой, как все». Меньшее число игр, ковидные протоколы, из-за которых отменялись матчи, а некоторые команды играли полурезервными составами, пустые трибуны и травмированный Леброн – все это накладывало свой отпечаток. В таких условиях было трудно пройти сезон на одной волне, без спадов. Поэтому мне стало интересно оценить изменчивость результатов на уровне конференций, позиций и команд. В статье представлен верхний уровень анализа, который позволяет ответить на вопрос «Какая из команд ровнее других прошла сезон 2020/21». Более детальную информацию можно будет посмотреть в созданном мною приложении.

Как считаем?

  1. Берется дата отсчета (пусть 22 декабря 2020 года). Это каждый день сезона, когда были игры НБА.

  2. От этой даты у каждой команды отсчитывается одинаковое кол-во игр (например 10).

  3. На этом игровом отрезке считается процент побед каждой команды.

  4. На основе своих результатов команда занимает место в конференции на этом отрезке (с 1 по 15). При равенстве процента побед, команды получают минимальный рейтинг, т.е. если Бруклин и Фила прошли 8-2, а Милуоки 7-3, то ранг парочки будет 1, у оленей 3, а второго места на этом отрезке не будет

  5. Берется новая дата отсчета (23 декабря) и повторяются пункты 2-4.

  6. Расчет останавливается, если от даты отсчета до конца сезона хотя бы у одной из 30 команд нет необходимого количества игр.

Все эти пункты выполняются для 16 различных скользящих окон: от 10 до 25 игр.

Что считаем?

Энтропию НБА. В теории информации энтропия – это мера неопределенности системы. Энтропия НБА – мера упорядоченности результатов. Чем результаты однороднее, тем энтропия меньше. Формула:

Приведу пару небольших примеров.

Пример 1. На 100 отрезках команда 94 раза была первой и 6 раз второй. Ее энтропия:

1 – (94^2 + 6^2)/100^2 = 0.1128

Пример 2. На 100 отрезках команда по 10 раз занимала места с 1 по 10. Ее энтропия:

1 – 10^3/100^2 = 0.9

Как мы видим, у первой команды энтропия низкая, у второй высокая.

Результаты расчетов

Начнем с энтропии конференций. Результаты в Западной конференции стабильнее на большинстве окон (от 10 до 22 игр), но с увеличением окна разница уменьшается и на окнах в 23-25 матчей стабильнее уже Восток. Достигается это засчет сильного падения энтропии с увеличением окна у лидеров конференции («Бруклин», «Филадельфия», «Милуоки») и аутсайдеров («Детройт», «Орландо»). А например у «Юты», одного из лидеров Запада, хотя показатель и низкий относительно других команд, но с увеличением окна почти не падает.

Самые стабильные позиции – это позиции лидеров (1-3 места в конференциях) и аутсайдеров (13-15 места). Список команд, которые на них бывают, ограничен. В тоже время на местах в середине таблицы бывали почти все и энтропия на них стабильно высокая, причем не особо падает с увеличением размера окна. Результаты довольно предсказуемы: если выдать результат 5-5 может выдать почти любая команда в конференции, то вот пройти тот же отрезок 8-2 или 2-8 «удел избранных».

По таблице и графику энтропии команд можно с легкостью ответить на вопрос из начала статьи: в плане результатов «Бруклин» – самая стабильная команда НБА прошедшего сезона. Вот его показатели на 25-матчевом окне:

Несмотря на все изменения в составе, «Нетс» стабильно держались в топ-3 команд Востока, причем большую часть времени на первом месте. Также стабильно вверху, но не столько много времени на какой-то одной позиции, были «Финикс» и «Филадельфия». Другой пласт стабильных команд возглавляют «Орландо» и «Хьюстон». Но тут причина прямо противоположная: команды на протяжении всего сезона были плохи. «Рокетс», если посмотреть их результаты на 25-матчевом окне, ни на одном отрезке не поднимались выше 11-го места на Западе, а «Орландо» – выше двенадцатого. Это не та стабильность, которой стоит гордиться.

На другом полюсе таблицы обитают команды, чей сезон похож на зебру: полоса белая, полоса черная. Причин этого может быть много и их анализ выходит за рамки данной статьи. Кто-то хорошо начал сезон, но поплыл во второй его половине («Лейкерс», их график на превью статьи), кто-то провалил старт, но собрался и выдал ударную концовку («Даллас»), а некоторые умудрялись за сезон несколько раз умереть и воскреснуть. Лучшим примером этого будет график «Вашингтона» на 10-матчевом окне:

Волшебники провалили старт и плелись в хвосте Востока до конца января, затем провели сильный отрезок до середины февраля, опять упали вглубь Восточной конференции на месяц вокруг МВЗ, и нашли второе дыхание на финальный рывок в конце сезона. Вашингтон хотя бы один раз оказался на всех позициях, кроме последней. Результатом всего этого стало попадание в плей-офф и один из самых высоких показателей энтропии.

Приложение

Формат статьи не позволяет более подробно остановиться на каждой из команд и их пути по сезону. Для тех, кто хочет самостоятельно посмотреть по какой кривой шел сезон той или иной команды, а также сравнить их друг с другом, я сделал небольшое приложение (последние две картинки скриншоты из него).

Приложение находится по адресу: https://vladislavshufinskiy.shinyapps.io/nba_entropy_application

С помощью панели слева, Вы можете выбирать команды, типы графиков и величину игровых окон, а также изменять диапазон дат. Давайте обо всех элементах управления по порядку.

  1. Выбор команды: в этом виджете Вы выбираете команду или команды, которые будут отображаться на графике. Не советую выбирать одновременно больше трех команд, особенно если это команды одного порядка (например, Бруклин, Финикс и Филадельфия).

  2. Тип графика. Есть два вида графиков: позиция команды в конференции каждый день (Rank day-to-day) и общее количество дней на каждой позиции (NDAY by rank positions).

  3. Количество игр. Ползунком можно выбрать скользящее окно любой величины: от 1(команда всегда будет на первом месте, если выиграла и 7-10, если проиграла) до 72(место в итоговой таблице конференции).

  4. Выбор диапазона дат. Можно убрать из расчетов часть сезона (например разделить сезон по Матчу всех звезд).

  5. Кнопка Make. Ее нужно нажать при изменении значений в 4 выше указанных виджетах для отрисовки нового графика.

Помимо графиков, есть еще вкладка с данными, где отображаются результаты всех игр выбранных команд.

Ниже гифка, на которой показано, как работать с приложением (можно увеличить, открыв в отдельном окне).

То же самое можно посмотреть в формате видео.

Все, в том числе приложение, можно запустить локально, скачав репозиторий и имея на компьютере установленную среду языка R.

У меня есть несколько проектов, которые находятся на разной степени готовности (от «Только начался» до «Все в принципе сделано год назад, но опубликовать руки так и не дошли, а теперь я не помню, что считал». Хотелось бы написать следующий пост раньше, чем через полтора года, а также оживить телеграм-канал. Писать в него каждый день, как было пару лет назад, я не смогу, но один-два раза в месяц что-то интересное постараюсь добавлять. Желаю вашим любимым командам успехов в плей-офф, если их название начинается с Далла*.

Телеграм-канал о мире цифр НБА:

https://t.me/nbaatlantic

Надеюсь, данный анализ был вам интересен. Спасибо за внимание и feedback в виде комментариев и оценок.