33 лучших игрока РПЛ: новая версия. Компьютер против РФС
Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).
От редакции: вы на в блоге Digital Scouting Тимофея Ушанского, экс-аналитика селекции ЦСКА. Еще больше цифровой аналитики, видеонарезок потенциальных новичков РПЛ вы найдете в телеграм-канале автора. А тут – продолжение истории про лучших игроков сезона.
По окончании сезона опубликовали традиционный список 33 лучших игроков РПЛ по итогам сезона под авторством РФС. В нем обнаружены и уже «перетерты» множество кривотолков и несостыковок. Например, Алексей Сутормин, проведший большую часть времени на скамейке «Зенита», оказался в этом списке; Фомин и Шиманьски оказались на одной и той же позиции, Клаудиньо и Барриос также.
В связи с этим я решил провести эксперимент. У каждого клубного аналитика есть программный алгоритм, благодаря которому можно свести множество статистических данных футболистов в единый рейтинг. Сегодня я использую свой и попрошу компьютер создать digital-версию списка 33 лучших игроков РПЛ.
Прошу своего читателя подойти кэксперименту с улыбкой. У компьютера не будет возможности посмотреть все матчи турнира, обзоры игр, послушать аналитические программы с оценками, измерить «децибелы народной любви» после забитых голов на стадионах. Компьютер оценит лишь игровую статистику, накопленную платформой WYScout. Забегая вперед, я удивлен тому, что в 55% случаев «железка» с электроимпульсами внутри, проглатывая лишь сырые данные, единогласна с авторами списка от РФС, а еще минимум в 25% случаев подсвечивает недооцененных игроков. Брак тоже существует, и в конце статьи я объясню, с чем это связано.
Как настроена программа?
Во-первых, кандидат в список должен провести на поле в сезоне РПЛ более 1300 минут
Да, Уилсон Изидор и Юсуф Языджи ярко проявили себя на коротком весеннем отрезке, но этого мало, чтобы попасть в итоговый список лучших игроков всего сезона. Алексей Сутормин по игровым параметрам вошел бы в 33 лучших, но ему также не хватило игрового времени.
Во-вторых, применим следующую схему:
Схема команды очень важна, потому что именно она определит, кого и с кем компьютер будет сравнивать. В опубликованом РПЛ списке 33 лучших на одной позиции находились Барриос и Клаудиньо, что я считаю грубой ошибкой. Никому в здравом уме и в голову не придет сравнивать этих игроков между собой.
Нападение
Сверху до центра поля расположение игроков интуитивно понятно. Центрфорварды будут сравниваться с центрфорвардами (CF), левые полузащитники с левыми (LAMF), правые – с правыми (RAMF).
Полузащита
Центр поля разделим на 3 позиции: “десятки” (AMF), центральные полузащитники (“box-to-box” CMF), опорники (DMF). Разница между опорниками и центральными полузащитниками эфемерна, поэтому отдадим определение позиции игрока на откуп Wyscout. Они определяют позицию игрока в матче по средней точке, в которой игрок встречался с мячом. Позиция игрока в сезоне – та, на которой он провел большую долю матчей.
Оборона
С крайними защитниками также все просто: левый защитник (LB), правый защитник (RB). А вот с разделением центральных защитников у меня возникли сложности. Если делить на левоногих и правоногих, то увидим, что в РПЛ преобладают правоногие (с серьезным превосходством в количестве и среди левоногих защитников в список попадет Егор Сорокин). Если делить буквально по зонам, где играют футболисты – не ясно куда отнести «центральных центральных защитников», прости господи за тавтологию, команд, которые играют в 3 защитника.
Приму спорное решение – пусть алгоритм сравнивает всех CB между собой, после по рейтингу выберет шестерых и распределит по парам. Первая двойка – в первую команду, третий-четвертый во вторую, и оставшиеся два – в третью.
В третьих, зададим разную значимость статистических показателей для игроков разных позиций.
Компьютеру при определении лучшего игрока на позиции нужно понимать, какие статистические характеристики важнее. Например, для центрфорварда – это показатели результативности, качества завершения. Для центрального полузащитника же важнее качество короткого-среднего паса, количество продвигающих передач и так далее.
Например, веса качеств для центрфорварда я принимаю такие:
В-четвертых, я не настраивал алгоритм для оценки вратарей, и считаю, что выбранные РФС кандидаты вполне подходят для сборной 33 лучших.
В-пятых (клянусь, это последний пункт), при равенстве рейтинга выше ставился игрок с бОльшим количеством игрового времени. Нобоа именно поэтому выше Вендела, Моро выше Черникова.
Ну и самое главное – торжественно клянусь не вмешиваться в итоги работы компьютера и предоставить их вам в чистом виде. Вперед, к результатам!
Основной состав digital-версии 33 лучших игроков РПЛ
* рядом с фото указан балл, выставленный компьютером игроку за сезон (в результате сравнения с другими игроками ведущих мировых чемпионатов на каждой из позиций)
Основной состав Digital-версии символической сборной РПЛ
Далее – детали об игроках, попавших в список 33 лучших по версии компьютера. Для тех, кому интересно посмотреть настроенные веса качеств и рейтинг всех игроков РПЛ – открывайте полный рейтинг игроков РПЛ сезона 21/22
Матео Кассьерра (99 баллов)
Кроме высочайшей голевой (14 голов) и ожидаемой голевой результативности (13,75 xG) колумбийца выгодно выделяют великолепная реализация (каждый четвертый удар – гол) и элитное качество короткого-среднего паса для центрфорварда. Это позволяет ему при малом количестве единоборств крайне часто встречаться с мячом в штрафной (6 касаний за матч). Заслуженно лучший digital-форвард РПЛ 21/22!
Арсен Захарян (97 баллов)
Арсен совершил квантовый скачок и сразу после сезона, в котором стал лучшим молодым игроком, уверенно ворвался в топ лучших игроков лиги без поправки на возраст. В активе Захаряна 7 голов и 6 голевых передач, при отсутствии голов с пенальти. Игрок всегда находится в движении, ему свойственна высочайшая игровая активность (получает 31 передачу от партнеров в среднем за матч) и имеет околорекордный показатель передач под удар (2 за игру). Это высший класс не только для России, но и для топ-5 лиг Европы.
Малком (100 баллов)
Футболист второй год подряд показывает себя уровне РПЛ игроком абсолютно без слабых мест. Какую метрику ни возьми – всё высший класс: результативность, игровая активность, качество плеймекинга, удар, дриблинг. Малком не замечает уровня лиги.
Клаудиньо (100 баллов)
О лучшем игроке лиги и говорить особо нечего – «мини-Дзюба» не заметил переезда из чемпионата Бразилии, как ранее играя за «Брагантино» не заметил выход из Серии Б в Серию А. Третий подряд титул MVP лиги с космической статистикой.
Кристиан Нобоа (99 баллов)
Кристиан набрал одинаковое количество баллов с Венделом и только по дополнительному показателю (большее игровое время в сезоне) попал в 11 лучших. Высочайшая игровая активность (47 принятых передач в среднем за игру) и невероятная нацеленность на развитие атаки (по количеству передач вперед, в последнюю треть и с продвижением мяча игрок входит в элитный 1% центральных полузащитников мира), заставляют нас забыть, что большинство его одногодок уже закончили с футболом.
Гжегож Крыховяк (96 баллов)
Гжегож в этом сезоне уже не был способен давать большие объемы единоборств, однако был самым сильным глубинным плеймерком лиги в первой части сезона. На этом отрезке поляк отметился высочайшими объемами продвигающих передач из опорной зоны и был самым бьющим опорником в мире (2,8 удара за игру).
Дуглас Сантос (100 баллов)
Это Дуглас Сантос, безальтернативный царь и Бог на позиции левого латераля.
Марио Фернандес (99 баллов)
Только 1% крайних защитников мира ведут единоборства в обороне лучше, чем Марио Фернандес. Только 2% правых латералей имеют суммарный xG за последний год выше, чем у него. Только Марио мог стать русским, не говоря ни слова по-русски. Спасибо, легенда!
Яка Бийол (99 баллов)
Чую, все комментарии под статьей будут именно об этом странном выборе компьютера, готов даже принимать проклятия и заявления о личной ангажированности. Но я обещал не трогать результаты работы компьютера своими грязными руками :)
Яка классно ведет единоборства (71,7% выигранных единоборств в обороне, 67,3% верховых и 73,7% в атаке), демонстрирует высокое качество короткого-среднего паса (94% точности), и имеет высокие показатели точности длинных передач (68%, выше чем у него этот показатель лишь у 2% центрбэков мира).
Игорь Дивеев (97 баллов)
Игорь был рожден для того, чтобы играть в паре с Якой Бийолом. Показатели ведения единоборств у него явно скромнее, однако он компенсирует это высокими объемами передач в последнюю треть (7,23) и с продвижением мяча (10,3). Повлияла на рейтинг и высокая активность молодого «армейца» на стандартах: 20 ударов по воротам и 3 гола за сезон – очень хорошо для центрального защитника. Так держать!
Второй и третий состав сборной по версии компьютера
Второй состав Digital-версии символической сборной РПЛ 21/22
Третий состав Digital-версии символической сборной РПЛ 21/22
От автора: «Простите, сеньор Барриос!» и другие отклонения алгоритма
Вклад колумбийца в любое из чемпионств «Зенита», в том числе в последнее, трудно переоценить. Однако в этом сезоне Вильмару приходилось играть то в центральной зоне, то в центре защиты. Из-за этого алгоритм не смог оценить его по достоинству ни на одной из позиций. Автор безусловно включил бы в личный рейтинг 33 лучших игроков Вильмара. Но кто я, черт возьми, такой :)
В Гамиде Агаларове компьютер (и меня лично) смущает практически полное отсутствие ключевых передач на партнеров (одна в среднем за 4 полных игры) и низкая игровая актичность (игрок принимал всего около 8,5 передач от партнеров за матч). Бездушная машина чует «оверперформеров» за версту и не пропускает в топ рейтинга.
Также отмечу парадокс отсуствия в списках Себастьяна Шиманьски и Даниила Фомина, хоть они оба были и очень близко. Дело в том, что оценка центральных полузащитников всей лиги единым цифровым методом некорректна. Оценка игроков центральной зоны всегда слишком зависима от требований модели игры. И, наверняка, если выкрутить веса качеств под игровые ценности бело-голубых, можно увидеть уже Шиманьски и Фомина в лидерах рейтинга. Но тогда вопросы посыпятся с берегов Невы и из парка Галицкого.
Оценка центральных защитников также как и игроков других позиций во многом основана на подсчете позитивных действий: отборов, перехватов, выигранных единоборств, длинных передач, передач в последнюю треть и так далее. И если с атакующими игроками такая модель приводит к интуитивно верному итогу, с центрбэками так нельзя. Хороший центральный защитник – не тот, кто делает много полезного, а в первую очередь тот, кто меньше всех ошибается.
И это место для шага вперед всей аналитической отрасли. Когда специалисты компаний-провайдеров данных (WYScout, Instat и подобных) научатся определять позиционные ошибки, делить единоборства в обороне на ключевые и вторичные, точно определять ошибки, приведшие к опасным атакам противника и голам – возможно, будут совершенно другие результаты. Пока же по количеству единоборств в обороне, количеству верховых единоборств клубные аналитики могут определять лишь стилистику игры центрбэка, оценку качества игрока всецело доверяя просмотру видео и вживую.
Сравнение итога digital-версии и списка 33 лучших от РФС
Digital-версия
Кассьерра, Сарвели, Дзюба; Захарян, Юсупов, Промес; Малком, Кабелла, Бакаев; Клаудиньо, Жемалетдинов, Сперцян; Нобоа, Вендел, Кузяев; Крыховяк, Моро, Черников; Сантос, Круговой, Обляков; Фернандес, Бейл, Сильянов; Дивеев, Бийол, Жиго, Родригао, Бальбуэна, Джикия
Версия РФС
Кассьерра, Сергеев, Бикфалви, Агаларов, Жемалетдинов, Дзюба, Захарян, Зиньковский, Полоз, Малком, Бакаев, Кузяев, Клаудиньо, Барриос, Глебов, Нобоа, Шиманьски, Фомин, Сантос, Терехов, Круговой, Фернандес, Сутормин, Варела, Бальбуэна, Дивеев, Осипенко, Родригао, Джикия, Чистяков
Из 30 полевых игроков по 16 у РФС и компьютера согласие.
Наиболее притесненным клубом при определении списка РФС оказался «Краснодар», в него не попали сразу четыре игрока, отмеченных компьютером – Кабелла, Сперцян, Крыховяк, Черников. Вторые по этому показателю – «Спартак» и ЦСКА – минус Жиго, Промес и Обляков, Бийол соответственно. Как всегда пострадала и футбольная «провинция»: недооцененными оказались 2 игрока одной и той же позиции – Бейл и Сильянов.
К чести коллег из РФС, они в своем списке отыграли несовершенства компьютера и «вернули на стол» Барриоса, Шиманьского и Фомина.
__________
Вот таким любопытным вышел эксперимент с оценкой прошедшего сезона РПЛ компьютером. Подписывайтесь на телеграм-канал блога, там больше разборов трансферов и потенциальных новичков нашей лиги.
Фото: globallookpress.com/Stupnikov Alexander