Парадокс Симпсона: почему Уэстбрук попадает лучше Карри, хотя бросает хуже
От редакции: вы читаете пользовательский блог, где применяют математические методы к познанию баскетбола. Подписывайтесь, здесь всегда интересно.
Загадка
Стефен Карри выдает в сезоне 41,5% с игры, а Руди Гобер – целых 70,7%. Если знать, что первый из них – рекордсмен НБА по количеству трешек, а второй – центровой, который бросает только из-под кольца (целых 2 попытки за сезон не из “краски” из общих 300+ попыток), то ничего удивительного в этом нет. Очевидно, что семифутеру бросать двухочковые удобнее и бросает он их гораздо чаще. Отсюда и высокий процент попаданий в целом.
А вот у Рассела Уэстбрука в этом сезоне – 44,3% попаданий. И есть большой соблазн тоже объяснить это тем, что атлетичный защитник «Лейкерс» лучше бросает двушки, чем более скромный по габаритам Стеф. Но это не так: у Уэстбрука 47,5% внутри дуги, а у Карри – 48,6%. Из-за дуги тем более лучше у одного из “splash brothers”: 28,9% против 38,6%. Перед нами типичный это парадокс Симпсона: при разбитии данных на группы, внутри групп наблюдается одна динамика, а при объединении всех групп вместе – прямо противоположная.
Отгадка
Объяснение парадокса в данном случае такое: Уэстбрук гораздо чаще бросает двухочковые (560 попыток против 290), а они в целом исполняются с более высоким процентом, чем трехочковые, положительно влияя на общую точность с игры. Карри же больше «пуляет” трешек (500 попыток против 150), которые, хотя они ценятся выше и попадать их сложнее, в статистике попаданий “весят” ровно столько же, сколько и двушки. Таким образом, рассмотрение EFG%, где учитывается еще и ценность забитых бросков, вместо обычного FG%, ставит все на свои места: 53,4% у Стефа и 47,8% у Рассела.
Парадокс Симпсона в спорте встречается довольно часто:
пример про бейсболистов Джитера и Джастиса даже попал в википедию
общие карьерные проценты легенд НБА Ларри Берда и Реджи Миллера демонстрируют ситуацию, аналогичную той, что разобрана выше (попробуйте, не открывая ссылку, ответить, у кого общий процент выше)
Какие бывают броски
Парадокс встречается так часто, что интереснее было бы найти случаи с более детальной разбивкой по зонам совершения бросков, а не просто по их ценности. Для этого я достал с сайта статистики НБА данные на 28 января о бросках с разных дистанций за этот сезон.
При этом в статистике НБА место совершения броска учитывается сразу в нескольких разрезах:
классическая разбивка по ценности попадания: 2-очковые и 3-очковые
по дальности от кольца: тут целых две линейки, по 5 футов и по 8 футов. У них там неметрическая система. Они даже называют “Роял чизбургер” четвертьфунтовым чизбургером.
по бросковым зонам: из-под самого кольца, из «краски», со средней и 3х-очковые из угла слева\справа и по центру:
Примеры
Начнем как раз с последнего подхода:
Столбцы на графике – процент попаданий игрока из данной зоны, сплошная линия – общий процент с игры (FG%), а пунктирная – доля бросков из этой зоны для данного игрока.
Примечательно, что игроки схожих антропометрических данных так по-разному выбирают\создают себе броски. Домантас более 50% своих совершает около кольца, что даёт ему +5% общей точности в сравнении с Дюрэнтом, хотя тот лучше в каждой отдельной зоне.
В следующей паре наоборот, игроки различны по позиции и габаритам, но довольно похожи по бросковым линейкам:
Два вполне современных игрока, предпочитают броски из-под кольца и из-за дуги, избегают дальних средних. За этими цифрами (а так же за сравнением зарплат) даже можно не заметить, что один из них – главная звезда и лидер команды, а второй – просто хороший баскетболист. Такое существенное отличие по статусу складывается из суммы различий в небольших деталях.
Пример из последней оставшийся разбивки бросков поистине царский – Леброн и Яннис:
Тут парадокс Симпсона проявляет себя во всей красе: общая статистика идет в разрез с множеством частных, несмотря на схожесть в выборе бросков, близости процентов и даже общего количества попыток (примерно 750 у обоих на момент сбора данных).
Врет ли статистика?
Скорее, в данном случае, она наглядно показывает, что баскетбол сложен и даже один его аспект, будучи измерен избыточно просто, может приводить к неверным выводам.
Фото: Gettyimages.ru/Kevork Djansezian
Атлантида.
это не случай про "рыбак рыбака видит"?
По РВБ можно много чего говорить, но если смотреть только со стороны Вестбрука - изначально было понятно что Лэйкерс, где есть Дэйвис и Леброн - не лучшая для него ситуация. В нынешнем баскетболе очень сложно играть атаку в три игрока когда все трое сильно нацелены на двухочковые. И Вогель явно не тот человек который может решать эти головоломки в атаке.