Саберметрика. Часть 1. Введение
Когда планируешь начать какой-то цикл статей, второе самое главное - его всё же начать. Я начал планировать написание цикла статей о саберметрике ещё в августе/сентябре прошлого года, но концовка регулярного сезона и плей-офф отложили начало на межсезонье. В межсезонье начать сразу тоже не получилось - регулярную работу блога по ситуации в Ред Сокс забросить не хотелось, реальная работа напрягала, да и сначала хотелось перечитать хотя бы часть спецлитературы для того, чтобы иметь на руках более объективные аргументы, подкреплённые цифрами. Потом я приболел на пару недель, потом снова работа придавила сложностью (бывают такие периоды, причём обычно в самый неподходящий момент, когда вроде бы уже решил взяться за дело), Ред Сокс подписали пару интересных игроков и т.д. и т.п. В итоге до начала игр Весенних Тренировок осталось уже несколько дней, а ни строчки я так и не написал. Были мысли отложить написание на следующее межсезонье, но, боюсь, что потом снова что-то изменится, и идея так и останется невоплощённой.
Поэтому я всё же собрался и таки начал цикл этой вводной статьёй. Думаю, что практически гарантированно не успею цикл завершить до начала регулярки, но всё же стимул для самого главного в таких циклах - закончить его - уже есть. И теперь я не смогу послушать внутренний голос и забить - всё равно, мол, мало кто читает, ещё меньше проникнутся, а важного времени потрачу немало. Так что велкам в цикл "Саберметрика", жду ваших комментариев и дискуссий по тому, что останется непонятным. Как обычно, обещаю, что ни один вопрос не останется без подробного и популярного ответа. Главное, чтобы вам это действительно было интересно.
* * * * *
Первую статью в цикле я решил посвятить пояснению основного термина в виде ответов на гипотетические вопросы, которые могут возникнуть у человека, вроде бы интересующегося бейсболом, но не имеющего понятия о саберметрике. Что, где, когда, почему и как. Постараюсь более чем популярно рассказать, что к чему, чтобы после прочтения этого текста у вас уже было стойкое понимание - нужно оно вам, стоит ли тратить время и читать остальные статьи и приобщаться к "движению", или ну его нафиг, лучше киношку какую глянуть или пивка с друзьями попить.
Что такое саберметрика?
Саберметрика (название происходит от аббревиатуры SABR (Society for American Baseball Research), организации, которая занимается исследованием бейсбола во всех возможных направлениях - от истории до цифр) - это собирательное название для продвинутого анализа бейсбольной статистики с целью как можно более объективного понимания бейсбола (в отличие от того субъективного, что видят наши с вами глаза).
Чем отличается саберметрика от так называемой традиционной статистики?
В глобальном смысле - ничем. И традиционная статистика, и саберметрическая статистика - это, в первую очередь, статистика, которая используется для анализа действий игрока. Но в локальном плане разница очень большая. Некоторые традиционные статистики вообще бесполезны для какого-либо анализа, а остальные по отдельности неполноценны, поэтому в саберметрике используются различные их сочетания. Сравнение традиционной статистики и саберметрики можно грубо представить как сравнение обычной математики в плане "2+2=4" и высшей математики с логарифмами и теорией вероятности. Без "2+2=4" не было бы и высшей математики, как без традиционных статистик не было бы и саберметрики, но важность высшей математики и саберметрики значительно выше.
Что можно узнать с помощью саберметрики?
С помощью саберметрики можно понять много чего. Например...
- как сравнить ценность скоростного защитного центрфилдера, отбивающего много синглов и крадущего много баз (Денард Спэн), с ценностью слаггера, выбивающего много хоум-ранов, но получающего много страйкаутов и слабо играющего в защите (Майкл Морз);
- как сравнить ценность стартёра, пропустившего полсезона из-за травмы, но который во время игры показывал великолепные результаты (Клэй Бакхольц), с ценностью клоузера, который отыграл весь сезон и закрыл много игр, но показал средние показатели (Фернандо Родни);
- как сравнить ценность обычного резервного инфилдера (Эмилио Бонифасио) с ценностью обычного миддл реливера (Бёрк Бэйденхоп);
- как сравнить переподписание своего 28-летнего стартового питчера, которому оставался год до свободного агента на 6 лет и 105 миллионов (Гомер Бэйли), с подписанием свободного агента 30-летнего стартового питчера на 4 года и 50 миллионов, за которого нужно отдать первораундовый драфтпик (Убальдо Хименес);
- как сравнить обмен 32-летнего второго бейсмена с посредственным последним сезоном и с контрактом ещё на 4 года и 62 миллиона (Иэн Кинслер) на 30-летнего первого бейсмена с посредственным последним сезоном и с контрактом ещё на 7 лет и 168 миллионов (Принс Филдер) с доплатой 30 миллионов второй стороной...
...а также...
- узнать, почему Фил Хьюз - плохой питчер для Янкиз, но неплохой питчер для Твинс;
- узнать, насколько ухудшатся шансы клуба при потере любого игрока из-за травмы на месяц, и насколько улучшатся шансы другого клуба при обмене звезды на ленточке трейд дэдлайна;
- узнать, как можно грубо спрогнозировать показатели игрока на основании его бывших показателей и показателей других похожих на него игроков;
- узнать, кого лучше выпустить пинч-хиттером против левши - правшу, который ни разу против него не отбивал, или левшу, который отбивал против него 5 раз и отбил 4 хита;
- узнать, как правильно конструировать лайнап;
- узнать, какое влияние имеет питчер на исход момента, если мяч отбит в поле;
- узнать, как из двоих посредственных игроков может получиться один хороший...
... и ещё многое-многое другое, что только можно себе представить.
Нужна ли саберметрика обычному бейсбольному фанату?
Смотря с какой стороны вы смотрите на игру. Я уже неоднократно приводил в пример мой интерес к американскому футболу, который заключается исключительно в просмотре игр Нью-Инглэнд Пэтриотс, без какого-либо вникания в околоигровые ситуации. Я не знаю почти ничего о других командах, не знаю качества большинства игроков, не знаю особенностей тактики, то есть, практически ничего, кроме правил и смысла игры.
Если вы точно так же относитесь к бейсболу, саберметрика вам не нужна. Без её понимания спокойно можно смотреть игры, спокойно можно болеть за понравившуюся вам команду, спокойно можно понять разницу между хорошим и плохим игроком. Но если вы хотите понимать то, что написано в ответе на предыдущий вопрос, тогда без саберметрики вам однозначно не обойтись, так как стандартные статистики, которые указаны на любом спортивном сайте, в данных случаях бессильны.
Выбор за вами, друзья. Хотите понять всё это - присоединяйтесь. Не хотите - ваше право, никого не желающего в это вникать, не назову глупцом, но тогда, пожалуйста, будьте готовы к тому, что ваше субъективное мнение по поводу качества какого-то игрока или смысла какой-то транзакции может быть осмеяно теми, кто понимает, что объективный расклад на самом деле абсолютно противоположный. Это не снисходительность по превосходству, это реальность.
Что нужно для того, чтобы понять саберметрику?
В первую очередь - вера в то, что цифры и мудрёные формулы могут оценить и предсказать качество игрока намного лучше, чем глаза любого специалиста (замечу, что это не камень в огород скаутов, оценивающих свинг, подачу или игру в защиту - это всё так же бесценно, но лежит совсем в другой плоскости, и любой скаут может быть одновременно и саберметриком). Если вы считаете, что это не так и не допускаете такой возможности - вам читать этот цикл не имеет смысла, так как это будет разговор слепого с глухим.
Во вторую очередь - здоровый скептицизм, желание всё проверять и совершенствоваться. Абзацом ранее я написал, что полностью неверующему в цифры читать эту и последующие статьи из цикла смысла нет, но это же касается и тех, кто готов всё сказанное принять на веру и на основании этого провозгласить себя человеком из "высшей касты" саберметриков. Нет, для того чтобы вникнуть в саберметрику, нельзя останавливаться на паре прочитанных статей, тем более, что я буду описывать только основы, каркас, так сказать. И на этот каркас нужно всё время наращивать десятки статей, начинать рассматривать новые, более сложные для понимания вещи. Ведь саберметрика, как и любая наука (хотя я бы не назвал саберметрику наукой, просто она подчиняется законам науки), находится в постоянном развитии, над чем постоянно работают кучи саберметриков, пытающихся улучшить имеющиеся статистики и изобрести новые, чтобы взглянуть на проблему с новой стороны.
И только в третью очередь нужно небольшое понимание математики. Заядлые противники саберметрики любят пугать своих читателей сложностями формул, дабы заставить их читать не объективные выводы саберметриков, а субъективные выводы этих самых противников, зачастую не имеющие никакого отношения к реальности. На самом деле никакого математического образования и даже знания высшей математики для понимания саберметрики не нужно (я сам гуманитарий как по складу ума, так и по образованию, и в последний раз мне преподавали математику в 1999 году, на первом курсе универа в качестве двухнедельного дополнения в составе семестрового курса физики). Нужно просто знать некоторые основные принципы высшей математики (корреляция показателей, статистическая выборка и т.д.), а составление формул, матриц и графиков, а также доказательства верности глобальных заключений оставьте ресёрчерам с высшими математическими образованиями, они за это деньги получают. Тем более, что даже если вы сейчас не совсем понимаете вышеупомянутые принципы, о них я буду говорить в общих чертах, когда в цикле пойдут специализированные статьи. Поверьте, большинство формул, несмотря на их кажущуюся монументальность, можно описать одним-двумя предложениями, которые будут понятны даже закончившим 4 класса церковно-приходской школы.
Какова степень правдивости саберметрики?
Сложно сказать. Как писал когда-то Жюль Верн в "Таинственном острове", можно написать множество книг о том, что люди знают, но в разы больше книг можно написать о том, чего они не знают. Так и в саберметрике - она вскрыла большущий пласт неизведанного, но, тем не менее, предстоить вскрыть ещё немало пластов, прежде чем можно будет с уверенностью сказать, что саберметрика достигла своего пика и двигаться дальше не сможет. Да и то вряд ли - такая зависящая от случая игра, как бейсбол, всегда будет задавать всё новые и новые вопросы.
Но то, что саберметрика сейчас и близко не идеальна, не значит, что ей следует пренебрегать. Лучше что-то неидеальное, чем вообще ничего, не правда ли?
Есть ли что-то, что подтверждает практичность саберметрики, или это только теория?
Я всегда повторял и буду повторять - в некоторых аспектах саберметрики можно сомневаться, некоторые аспекты можно отвергать, некоторые аспекты можно не понимать, в самые глубокие дебри можно осознанно не влезать, но говорить, что саберметрика это только теория, не подтверждённая практикой, может только абсолютно недалёкий человек. Основное и главное подтверждение практичности саберметрики - то, что вся многомиллионная бейсбольная индустрия (за небольшими исключениями) работает с цифрами в таких объёмах, что саберметрикам из обычных сайтов даже не снилось. И когда от работы аналитических отделов зависит судьба многомиллионных контрактов игрокам, а от успеха этих контрактов зависят многомиллионные прибыли - извините, эту карту никому не перебить. Отрицать "рабочесть" саберметрики может только тот, кто до сих пор отрицает то, что Земля круглая.
Поэтому даже при легитимности выборки никакого смысла сравнение дневных домашних и дневных выездных игр не имеет, так как единственное общее у этой группы - время начала игр, а погодные и стадионные условия совершенно разные в каждый отдельный день. На основании этих цифр ERA нельзя сказать, что Дики лучше бросает днём на крытом стадионе, потому что "Роджерс Центр" днём бывает и открытым. Нельзя сказать, что Дики хуже бросает на солнце, потому что он может бросать на крытой "Тропикане" и в дождь на "Фенуэе". Ну и т.д.
Да и ERA сама по себе - не идеальный вариант для какого-то сравнения.
Без сомнения, стоит.
Во-первых, 10 ранов на 1000 питчей - это не крохи, а как раз наоборот, суперпоказатель, на самом деле лучшие сохраняют приблизительно 5 ранов на 1000 питчей.
Во-вторых, за весь сезон даже эти 5 ранов на 1000 питчей - это очень много, так как это около 20 ранов за сезон, а 20 ранов - это лишние две победы для команды только за счёт питч-фрэйминга.
В-третьих, питч-фрэйминг - это очень малая доля всего, что случается на поле, и даже если бы максимально за сезон это добавляло бы команде только 1 ран, это всё равно стоило бы учитывать. Ведь, например, если взять 9 игроков лайнапа Ред Сокс и прогнать их прогнозируемые линии через калькулятор, окажется что их идеальное сочетание (4.987 рана за игру) лучше самого худшего сочетания (4.671 рана за игру) всего лишь на 0.316 рана за игру, что равно всего 51 рану за сезон. Но это разница между самым лучшим и самым худшим, а между, скажем, одинаковым лайнапом, но с Ортисом на 3 месте и Ортисом на 9 месте будет, думаю, не больше пары ранов за сезон. Тем не менее, никто Ортиса под №9 в лайнап ставить даже не подумает.
Да, по подписке идёт каждый раз оплата по цене прошлого сезона, ты как будто "отстаёшь" от обычных подписчиков на 1 год.
Дики провёл 18 игр дома, 16 на выезде, а также 18 игр ночью и 16 днём. Не знаю, где найти такую статистику в два клика, чтобы и день/ночь и дома/выезд захватывала, но предположим, что для такого сравнения вы взяли 9 игр дома днём и 8 игр на выезде днём (ведь распределение наверняка приблизительно равное). Так вот - это сравнение попросту нелегитимное из-за малой статистической выборки, поэтому делать какие-то выводы из этих цифр нельзя. Вот почему нужно понимать саберметрику - чтобы не делать ложных выводов из чего-то, что вам показалось логичным, но на самом деле является простым совпадением.
Бостон и Сент-Луис абсолютно равные команды...
Ключевые моменты Мировых Серий(еще раз повторю решают звезды) главный фактор - это игра Лестера, далее менее значительные факторы. У Бостона на ключевой позиции играл Дрю, а у СЛ Козма, хоум-ран Гомса(который, само собой не является звездой, но учитываю, что он абсолютно ничего не показывал этот хоум-ран абсолютно логичен), провал Уоки тоже абсолютно логичен, потому как слишком хорош он был до этого, и вообще кто он тако против Лэки