Завершение сезона по текущей таблице – глупость. Лиги выбирают между плохими и очень плохими вариантами
Колонка Вадима Лукомского.
Текущие результаты – плохой инструмент для прогнозирования
Сейчас всерьез рассматривается три варианта завершения турниров, которые не могут быть доиграны:
• По таблице очков за игру;
• По таблице после n туров (где n – число матчей у клуба, который сыграл меньше всех);
• По таблице первого круга.
Между этими методами нет фундаментальных отличий. Разве только первый круг – совсем плох, потому что дает заметно меньше информации. Все три варианта страдают от двух непреодолимых проблем: игнорирование трудности календаря и ориентация на результаты как ключевой фактор при практически полном отсутствии предсказательной силы у них.
Тут очень важно не запутаться в определениях. Важность результатов как конечного продукта любого футбольного процесса – аксиома. Никто не пытается ее оспорить или подменять счета в матчах и таблицу, которую они формируют, другими параметрами. Но важность текущих результатов не наделяет их предсказательной силой. Это абсолютные разные вещи, а в данном случае нас интересует именно максимально точный прогноз.
Суть проблемы: текущие результаты – плохой индикатор будущих результатов. Тезис проверен большим количеством исследований – как внутри аналитических компаний, так и математических в университетских работах (с некоторыми из них ознакомимся ниже).
Практически любая модель, основанная на статистике, а не на результатах матчей, лучше предсказывают будущие результаты на больших выборках матчей и клубов. Тоже не со 100% точностью, но ощутимо лучше. Аномалии будут при любой модели. Критики часто выбирают одну аномалию – и стараются использовать ее как аргумент против всей модели. Но теория вероятностей не так работает – речь об объективном обоснованном прогнозе, а не знании будущего.
Да, даже с самой лучшей моделью мы не можем знать, где и когда возникнет аномалия, а они всегда будут (потому что футбол – спорт низкой результативности), поэтому мы никогда не будем предсказывать со 100-процентной точностью. Но мы можем оценить предсказательную силу модели на большом количестве команд и лиг.
В случае с завершением сезона досрочно через уже набранные очки нам тоже предлагают своего рода модель. Очки за игру – главный фактор. Дальше строится проекция – команды просто сохраняют текущий темп до конца сезона и оказываются на этих местах. Представив это как модель, мы можем изучить ее предсказательный потенциал на исторических выборках.
Подобные исследования проводились в Стокгольмском университете. Выяснилось, что ориентация на текущие результаты не дает практически никакой предсказательной силы. В исследовании строились даже намного более трудные модели, но все они учитывали только прошлые результаты как инструмент предсказания. Ни одна модель, основанная только на результатах уже сыгранных матчей, не дала хороших прогнозов.
Разрабатывая модель ожидаемых голов, Майкл Кэйли тестировал ее предсказательный потенциал, сравнивая с предсказаниями на основании результатов. Это было в начале 2010-х, но даже ранние xG-модели значительно превосходили текущие результаты как инструмент прогнозов.
В обычное время мы просто не воспринимаем таблицу и текущие результаты как прямой инструмент прогноза. Мы воспринимаем их только как результаты и таблицу. Как модель для прогноза они не выдерживают никакой критики. Особенно в наше время, когда достаточно альтернатив.
Правда, что любые модели до сих пор слабы в предсказании результата конкретного матча (возможно, будут всегда из-за хаотичной природы футбола), но на дистанции все меняется. Ричард Уиттэл, бывший аналитик Prozone и 21st Club, приводил цифру в 5-10 игр как дистанцию, на которой xG-модели приобретают предсказательный потенциал. Как раз столько необходимо сыграть в большинстве лиг, а для обоснованного предсказания у нас есть информация 25+ туров. Это вполне хорошие стартовые данные.
Я не хочу бомбардировать вас однотипными, но полезными и показательными исследованиями, поэтому здесь будет абзац с максимально грубым и простым объяснением. Есть простой тезис – и он оказался рабочим: «Если команда достигла случайного результата, его будет повторить труднее, чем логичный». Все остальное из него вытекает. Таблица засчитывает каждый результат как логичный, а статистическая модель (необязательно xG) нацелена на то, чтобы ловить случайные результаты (хорошая – ловит), и учитывать при предсказании будущих результатов.
На малых дистанциях случайности возможны, но на больших предсказательная способность статистической модели возрастает, а модели, основанной только на результатах, падает. Поэтому даже ранние xG-модели давали лучшую предсказательную силу. Грубо говоря, проекция на основании xG-таблицы после 10 туров лучше предсказывает финальную таблицу (вернее даже финальные результаты по очкам), чем настоящая таблица после 10 туров. Чем больше туров, тем больше преимущество моделей.
К сожалению, предлагаемые варианты не просто хуже математических моделей, которые способны учесть больше информации, но и банально плохи сами по себе. У нас нет научного базиса для того, чтобы считать, что команда с темпом набора 1,5 очка за игру сохранит его на дистанции последних 10 матчей. В большинстве случаев расхождения будут существенными. Расхождения при прогнозе через модель, основанную на более глубокой статистике, будут менее существенными.
Использовать единую математическую модель – оптимальный путь (но мы к этому еще не готовы)
Важнейший момент: проекция на основании xG-модели не равняется xG-таблице. Заменить реальную таблицу на xG-таблицу – бред, который никто не предлагает. Использовать информацию из xG-таблицы, чтобы довести реальную таблицу до конца сезона – это разумное с точки зрения теории вероятностей предложение.
Разберем на конкретном примере. «Тоттенхэм» в прошлом сезоне.
После 20 туров у команды 45 очков в таблице, что дает темп набора 2,25 очка за игру. Прогноз на остаток при таком темпе: 41 очко в оставшихся. Но есть сильное расхождение с xG-очками – там всего 34,73 очка после 20 туров (темп набора 1,73). Это дает прогноз: 31 очко в оставшихся турах.
На деле «Тоттенхэм» набрал 26 очков в оставшихся матчах. 100% точности нет ни у кого, она чрезвычайно редка. Но модель, основанная на xG, заметно ближе. Предсказать такое с реальной таблицей было невозможно. Это самый примитивный прогноз на основании модели (даже без учета календаря, а современные модели его способны учесть), но даже тут видна разница.
Этот пример я привел не чтобы доказать преимущество (один пример ничего не доказал бы, а настоящие доказательства уже есть – в материалах по ссылкам и других исследованиях), а чтобы показать, как это в работает (в примитивном упрощенном виде).
Дальше можно усложнять, добавляя в модель новые факторы. Если они не окажутся статистическим шумом, то точность еще вырастет. Но даже самый примитивный уровень лучше прогноза на основании очков за игру из таблицы. Само наличие xG – необязательное условие. Есть модели, которые иначе измеряют силу команды. xG – в данном случае лишь доступный пример.
Сейчас у нас только в открытом доступе есть различные xG-модели, многофакторная модель Opta, которая уже симулировала АПЛ, модель Нэйта Силвера, основанная на SPI. Даже в них мы наблюдаем достойные попытки описать качество игры, стиль команд, учесть календарь и т.д. Внутри аналитических компаний и клубов есть более детальные математические модели.
На выходе у нас абсурдная ситуация. У нас есть четкие доказательства того, что использование текущих результатов в качестве индикатора будущих успехов – плохой метод. У нас есть десятки моделей, которые показали себя намного лучше этого метода, но мы не можем их использовать. И здесь тоже причина достаточно убедительная.
Минус этих моделей еще более явный – между ними есть расхождения, пускай небольшие. Пускай все они точнее метода «очков за игру», но это открывает простор для манипуляций. Клубы будут продвигать выгодную себе проекцию. «Лилль» даже предлагал Лиге 1 модель, подготовленную их аналитиками. Разумеется, в ней команда оказалась в зоне ЛЧ.
В теории нет ничего невозможного в том, чтобы с помощью УЕФА выбрать лучшую с точки зрения предсказательного потенциала модель и навязать ее лигам сверху. С точки зрения качества прогноза – это лучшее решение, но на данном этапе оно выглядит слишком радикальным.
Поэтому на месте боссов лиги я бы тоже не стал использовать аналитические модели. К счастью, функционеры и особенно игроки недостаточно образованы, чтобы понимать, насколько слабы прогнозы на основании очков за игру. Увы, функционеры и особенно игроки недостаточно образованы, чтобы принять более трудную систему, даже если она показывает лучший предсказательный потенциал.
Использование основанной на результатах модели – путь наименьшего сопротивления. Я понимаю, почему его выбрали, но от этого он не перестает быть антинаучным.
Альтернативный вариант: очки за игру + Elo-рейтинг для оценки трудности + стыковые матчи
Даже основываясь только на результатах, можно завершить сезон с более высоким уровнем точности и справедливости. Предложу один из вариантов в максимально упрощенной форме.
Очки за игру берутся за фундамент. Лишь фундамент: повторюсь, очки за игру без учета календаря – мусор, который не пригоден для прогнозов.
Следующий шаг – оценить трудность календаря каждой команды. При этом нельзя уходить в сторону продвинутой статистики. В таком случае я бы использовал рейтинг Elo. Он хорошо знаком любителям шахмат. В футболе по тем же принципам считается мировой клубный рейтинг. Он основан только на результатах. Никто не сможет пожаловаться на выгодные конкретному клубу методы. Elo оценивает силу каждого клуба на основании того, кому он проигрывает и кого обыгрывает – победа над сильным соперником ценится выше.
С помощью рейтинга оставшихся соперников и оценки количества домашних и выездных игр команды можно поделить на группы по трудности календаря. Допустим три категории: легкий, средний, трудный.
Если в таблице конкурируют два клуба со средним календарем, их места фиксируются. Если рядом один с легким, а второй с трудным (то есть с высокой вероятностью поменялись бы до конца сезона), они играют стыковой матч за данное место (возможно, в другой стране – ведь где-то в мире скоро точно будут играть в футбол).
Модель можно развивать. Делить не только на три категории трудности, а на большее количество. Определить, сколько очков нужно, чтобы команда с лучшим календарем получила шанс догнать конкурента в стыковом матче. Такой порог будет разным: для легкий-vs-средний один, а для легкий-vs-трудный – другой.
Плюсы такого варианта: во-первых, мы сразу можем зафиксировать не только очевидные места (чемпионство «Ливерпуля» или вылет «Тулузы»), но и ряд пограничных на первый взгляд позиций. И эта фиксация не будет слепой, как сейчас. Во-вторых, сохраняется простота модели. Не учитывается ни одна трудная статистическая метрика.
В-третьих, при необходимости трудность календаря можно посчитать с большей точностью (а не просто делением на группы), ведь рейтинг Elo – это конкретное число. Тогда даже можно обойтись без стыковых матчей за конкретные места, а определять их сразу. Но это крайняя мера – хорошей точности без игры в футбол никто не даст. Так мы хотя бы сократим количество спорных позиций.
Я не считаю этот сценарий оптимальным. Лишь оптимальным в сложившейся ситуации. Для оптимального общество, кажется, пока не созрело.
Надо ли завершать чемпионат досрочно? «Ахмат» вылетает? 18 команд или 16? Примите решения за Прядкина и Дюкова
Не все игроки АПЛ хотят доигрывать сезон: боятся за себя и родных, обижены на правительство
Фото: Gettyimages.ru/Matthias Hangst, Phil Cole; globallookpress.com/Panoramic/Keystone Press Agency, FrankHoermann/SVEN SIMON, imago sportfotodienst, Xinhua/Keystone Press Agency; РИА Новости/Алексей Даничев
Источник: www.sports.ru