Избранные — Кто достоин играть за сборную России на Чемпионате Мира 2018 по мнению пользователей социальных медиа
Домашний Чемпионат Мира по футболу это ключевое событие в жизни футболистов, а сыграть на Мундиале на родной земле очевидно детская мечта любого футболиста. Именно поэтому итоговый выбор главного тренера это предмет трепетного внимания не только спортсменов, но и миллионов болельщиков, каждый из которых имеет собственное мнение о том, кто именно достоин быть в финальной обойме.
Разделяя ожидания миллионов соотечественников, блог Football Research провёл уникальное исследование мнений русскоязычных болельщиков о потенциальных игроках сборной России по футболу на масштабных данных социальных медиа.
Методология и общие моменты
Игроки для анализа
В подобном исследовании очевидной целью становится охватить максимальное количество игроков, но имеют место ресурсные и методические ограничения. Поэтому для анализа были выбраны игроки, приглашенные главным тренером на последние товарищеские матчи сборной (со сборными Аргентины и Испании) и проведшие хотя бы минуту на поле в ходе последнего вызова. Исключение было сделано только для нескольких очевидно важных кандидатов.
Период исследования
Чтобы собрать максимальное количество мнений пользователей об игроках, мы ограничили период исследования 10 -17 ноября — он включил в себя сразу две игры сборной — с Аргентиной 11 ноября и Испанией 14 ноября. Таким образом, мы смогли застать пользователей в момент их наибольшей активности.
Инструменты
Данные были получены с помощью системы мониторинга и анализа социальных медиа Brand Analytics. Сервис собирает данные со всех ключевых социальных платформ и Онлайн-СМИ – например, за ноябрь 2017 года было собрано более 372 млн сообщений Вконтакте. Выражаем огромную благодарность команде Brand Analytics за предоставленные данные!
Как найти упоминания
Одной из главных задач начального этапа был сбор максимального количество упоминаний футболистов. Для этого была использована более сложная из возможных стратегий – были собраны все упоминания по фамилиям, а не только упоминания в контексте футбола, сборной, матчей. Это позволило найти даже самые нестандартные варианты упоминаний. Вариант упоминаний вроде прозвищ футболистов также были учтены.
Что такое анализ социальных медиа
Так или иначе, это попытка получить новые знания из множества данных, которые генерируют пользователи социальные сетей и Онлайн-СМИ. В нашем случае мы сконцентрировались на текстах с содержащимися в них интенциями к игрокам и игре сборной России и попытке репрезентативного исследования общественного мнения. Основная сложность исследования подобных данных – их бессистемность и неструктурированность.
Как найти и проанализировать мнения
В социальных сетях много шума, спама и просто нерелеватной информации для целей исследования. На первом этапе данные очищались от «мусора», чтобы получить только упоминания фамилий футболистов, на втором – отбирались только авторские сообщения (то, что обозначают термином user generated content). Из финального массива были взяты все сообщения из наиболее релевантных площадок (например, комментарии на sports.ru, championat.com и прочих спортивных площадках), из остальной части массива сообщения были отобраны с помощью простой случайной выборки. Финальной и ключевой стадией стал анализ отобранных текстов на предмет отношения автора к конкретному футболисту – в упрощенном виде шкалу можно представить в виде «заслуживает играть – не заслуживает». Все оценки переводились в бинарные значение. Итоговый рейтинг построен на массиве всех значений в агрегированном виде для каждого футболиста.
Репрезентативно ли такое исследование?
Классические социологические исследования, о результатах которых регулярно можно узнать из СМИ, чаще всего подразумевает собой выборочные исследования, где генеральной совокупностью чаще всего выступает либо большая общность (население страны, города, социальная страта), либо малая группа или то или иное социальное явление. В нашем случае все немного сложнее – генеральной совокупностью выступают пользователи, опубликовавшие сообщения на заранее определенную тему. Эта социальная общность подразумевает как принадлежность к людям, интересующимся футболом, так и к пользователям, не только использующим социальные сети, но и являющиеся достаточно активными авторами. На одном из этапов мы использовали простую случайную выборку, чтобы охватить максимально широкий круг сообщений.
Для просмотра в режиме лонгрида перейдите сюда. Внутри есть примеры сообщений пользователей.
Во второй части (в работе) мы исследуем отношение пользователей к игрокам, которые пока не попали на радары главного тренера сборной России, но активно обсуждаются больщиками в качестве кандидатов.
Всегда рады ответить на все возможные вопросы. Продолжение следует!