Представители агрегатора "Яндекс.Новости" объяснили отсутствие в топ-5 новостей дня за 26 марта сюжетов, касающихся воскресных массовых акций протеста, которые прошли во многих городах России, плохой работой алгоритма кластеризации. Сообщение об этом было опубликовано в блоге "Яндекса".
"Сообщения с места событий поступали постоянно, и происходящее можно назвать одной из важных тем дня. Многие посчитали, что "Яндекс" сознательно убирал новостные сюжеты об акциях протеста из топа "Яндекс.Новостей", и обвинили нас в цензуре, не особенно разбираясь в происходящем. Это не так: никакого ручного вмешательства быть не может, работа "Яндекс.Новостей" по-прежнему полностью подчиняется алгоритмам", – говорится в сообщении компании.
Как отметили представители сервиса, в момент начала акции, которая стартовала на Дальнем Востоке, ее освещали далеко не все СМИ. В результате в первой половине дня сюжеты формировались лишь из сообщений небольших источников, и их общего веса не хватало, чтобы вынести тему в топ-5. Позднее различные новости, связанные с антикоррупционными митингами, периодически отображались на главной странице "Яндекса" (время их появления можно увидеть на графике), но вытеснялись оттуда сюжетами с большим весом. При этом в сообщении отмечается, что вес других сюжетов мог быть завышен из-за недобросовестной оптимизации, с которой борется агрегатор.
Основной же причиной отсутствия новостей о митингах в топ-5 в компании считают промахи в работе алгоритма, который объединяет похожие новости в сюжеты, а затем оценивает вес каждого сюжета на основании целого ряда факторов, включая состав источников, плотность потока информации, время публикации сообщений, вес других сюжетов на ту же тему. После этого сюжеты ранжируются по весу, и первые пять попадают на главную страницу "Яндекса".
"Мы признаем, что вчера "Яндекс.Новости" отставали от картины дня. Скорее всего, дело в том, что алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты – в темы, не всегда мог объединять в одну тему, например, сообщения о задержаниях во Владивостоке и об аресте Навального в Москве. Иными словами, временами агрегатор мог рассматривать одну большую, сложную и географически обширную тему про протесты как несколько разных тем, что, в свою очередь, могло повлиять на качество работы сервиса", – говорится в сообщении "Яндекса".
В компании также напомнили, что вступление в силу закона об агрегаторах повлияло на состав источников новостей, используемых сервисом. Так, с января этого года агрегаторы, включая "Яндекс.Новости", могут показывать на главной странице, в сюжетах и в тематических рубриках только материалы СМИ, зарегистрированных в Роскомнадзоре.
"Поэтому количество источников по сравнению с прошлым годом сократилось — это также влияет на вес сюжетов. И если о гололеде в Москве вчера написали практически все городские источники, то о протестах только те, кто решил об этом писать. В таком случае у двух разных сюжетов оказываются неравные шансы на выход в топ", – отметили в компании.
Напомним, что акции протеста прошли накануне по всей России. Поводом для них стала публикация Фонда борьбы с коррупцией (ФБК) Алексея Навального, в которой говорилось о секретных активах премьер-министра Дмитрия Медведева. В некоторых городах прошли задержания, больше всего участников митингов взяли под стражу в Москве.
О протестах ничего не сообщалось в сюжетах федеральных телеканалов, на сайте "Вестей" опубликовали новость о митингах, однако в эфире телеканала об этом событии не упомянули. Позже на телеканале "Россия 24" заявили, что проигнорировали протесты потому, что "государственный новостной телеканал всякий "шлак" не показывает", и пообещали показать, когда будет "разгон с применением спецсредств". В вечерних выпусках новостей Первого канала и НТВ также не было сказано о проходящей в Москве и регионах акции.