Российский футбол в двух словах
Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).
Действительно ли российский футбол — «дно», а его игроки — бездарные, ленивые, беспомощные, бесполезные (выберете свою ассоциацию)? Или все мы оказались в большом информационном пузыре, попавшись на хитрые уловки разгонов негатива в медиа?
Мы решили проверить на реальных данных.
Для этого мы спарсили данные о 98 записях в разделе РПЛ сайта sports.ru, опубликованных 12-15 декабря. Нас интересовали тексты новостей и комментариев к ним. Так получилось две коллекции, которые затем были проанализированы с помощью методов компьютерной лингвистики и инструментов python, AntConc и Cytoscape. Результат оказался неожиданным.
Что удалось выяснить
Логично предположить, что в комментариях будут часто попадаться примерно те же слова, что и в новостях. И одновременно с этим они будут идти вкупе с критикой и негативом, как мы и предполагали. Однако внезапно всплыло слово «хороший». Кстати,оно нередко употребляется и в новостях. Кажется, можно было ожидать любую другую единицу оценочной лексики в рамках дискуссий под новостями, но не ту,что предполагает положительную оценку.
Что можно узнать еще из этого облака слов?
- какие футбольные клубы чаще всего создавали инфоповоды;
- в комментариях любят обсуждать денежные вопросы в контексте футбольных трансферов;
- даже если в новостях часто фигурирует ФК «Динамо» то комментаторам этот клуб не так интересен, как «Зенит» и «Спартак».
В совокупности слово «зенит» употребляется чаще всего. Но при этом разница в частоте его употребления в новостях и комментариях самая большая: комментаторы его использовали на 28 раз больше, чем журналисты. Безусловно, важно учитывать, что на частоту употребления слова влияет и количество самих комментаторов. Но это также может говорить и о большом интересе именно к этому клубу, что мотивирует оставлять комментарии.
Но есть и хорошие новости!
130 раз слово «хороший» употребили в комментариях
«Бессмертный хороший игрок. Я не специалист. Потому не буду спорить»
А для данных, основанной на новостях, рекордсменом является «Зенит». Оно встречается 87 раз
«Я болел за ленинградский «Зенит», а сегодня это «Зенит-Газпром» — разные команды, идеология»
А какие словосочетания самые распространенные?
В новостях часто попадается «Зенит» в сочетании с млн. Это скорее всего значит, что с этим футбольным клубом связаны трансферы игроков. А в комментариях лидером стало словосочетание «хороший игрок».
О чем говорят все комментаторы в сущности?
«футболист – хороший – игрок – который – мочь – играть – футбол»
Логично? Еще как! Граф в данном исследовании помог нам раскрыть, кого имеют в виду комментаторы, когда говорят «хороший игрок».
Похоже, они зашифровали в своих дискуссиях главное назначение профессиональных футболистов. Так что устами комментаторов глаголет истина.
Получается, российский футбол – «хороший зенит», что ведь в сущности – правда. Этот футбольный клуб удерживает звание Чемпиона России уже пять лет подряд.
Итоги
- Самые часто используемые слова в новостях имеют нейтральный оттенок — опровергнута гипотеза, что в комментариях самое часто употребляемое слово будет иметь негативную коннотацию.
- Цитаты из корпуса показали, что, действительно, контекст, в котором употребляются часто используемые слова, скорее носят нейтральный характер и не содержат оценочных суждений, если это только не цитата из интервью.
- Кроме того, анализ показал, какие темы больше всего интересуют комментаторов. Например, даже если в новостях чаще фигурирует наименование конкретного клуба, то в комментариях его может вовсе не быть.
- И самое важное: оказывается, есть любители футбола, которые считают российских футболистов хорошими игроками! Не стоит вторить общепринятым стереотипам о том, что абсолютно все считают отечественный футбол плохим, а игроков — «бревнами».
Исследование сделано совместно с Анастасией Беляковой.