О проекте
Что такое «Баден-Баден»
В марте 2017 года Яндекс выпустил новый поисковый алгоритм определения текстового спама, который «по понятным причинам» был назван «Баден-Баден». Страницы, на которых обнаружены тексты, написанные «не для людей, а для поисковых алгоритмов», теперь могут понижаться в выдаче (в среднем на 20 позиций). Поскольку новый механизм включен в общий алгоритм ранжирования, никаких предупреждений вебмастерам в случае наложения санкций на отдельные страницы не делается. Из-за этого часто непросто определить, отчего упал трафик — из-за нового фильтра или по каким-то другим причинам.
В апреле была запущена вторая волна «Баден-Бадена». Если на сайте найдено достаточно много «плохих» текстов, санкции могут быть наложены уже на весь сайт. В этом случае появляется предупреждение в «Яндекс.Вебмастере», но конкретные провинившиеся страницы в нём не указываются. Правда, отвечая на вопросы от владельцев сайта, техподдержка Яндекса обычно приводит пример некачественной страницы.
Яндекс неоднократно намекал, что критерии плохих страниц будут постепенно ужесточаться. Пока свидетельств закручивания гаек не видно — в топе по многим запросам еще остаются достаточно дикие экземпляры. Но нет сомнений, что решение Яндекса навести порядок стратегическое, и тучи над SEO-текстами сгущаются.
Кому грозит «Баден-Баден»
По состоянию на конец 2017 года, под санкции чаще попадают коммерческие сайты (особенно интернет-магазины), реже — информационные, работающие в высококонкурентных («коммерческих») тематиках.
Типичная страница, попавшая под санкции — «витрина» или главная страница интернет-магазина, на которой есть достаточно большой (от двух-трех до десяти и более абзацев) текстовый блок, содержащий описание продаваемых товаров, их классификацию, объяснение, почему их лучше покупать именно здесь, и т. п. Этот текстовый блок и вызывает гнев Яндекса — и обычно он действительно довольно ужасен. Среди качеств, которые бывают присущи текстам, попавшим под фильтр, наблюдатели отмечают:
- насыщенность «ключевиками», а также сочетаниями собственно ключевиков со словами типа «купить» или «Москва»;
- переоптимизацию, высокую частоту некоторых слов;
- большое количество «воды» (правда, разные комментаторы при этом имеют в виду разные вещи);
- низкое качество текста, обилие разного рода ошибок;
- большой размер текста — по сравнению с тем, что представляется разумным или с тем, что можно видеть у соседей по топу Яндекса;
- наличие скрытого текста, или, по крайней мере, расположение текстового блока в самом конце страницы, там, где его мало кто увидит;
- отсутствие форматирования — или, наоборот, форматирование, предназначенное для поисковых роботов (например, выделение «ключевиков» жирным шрифтом);
- переоптимизированные заголовки.
Ни один из этих признаков, впрочем, не обязателен. Яндекс подчеркивает, что оцениваются не формальные характеристики, а полезность для пользователей.
Знакомьтесь, «Тургенев»
Мы в Лаборатории поисковой аналитики компании «Ашманов и партнеры» давно изучаем факторы ранжирования Яндекса и Google, в том числе и текстовые. Разумеется, с апреля 2017 года мы стали изучать и параметры, которые могут влиять на попадание страниц под новый фильтр. Постепенно стало понятно, что мы умеем «раскладывать по полочкам» проблемы, которые характерны для пострадавших страниц, и оценивать риск «Баден-Бадена».
И тогда мы решили создать сервис, открытый для всех. В конце концов, инициатива Яндекса организовать генеральную уборку SEO-текстов в Рунете представляется нам достойной всяческого одобрения. Почему бы в таком хорошем деле не поучаствовать?
По понятным причинам (воспользуемся тут формулировкой Яндекса) мы назвали наш сервис «Тургенев».
Правда, пока мы решили ограничиться проверкой текстов, а не сайтов и даже не веб-страниц. Это делает недоступной часть факторов, которые мы учитываем для наших клиентов, — например, вне контекста бессмысленно оценивать размер текстового блока, поскольку тут важно сравнение с соседями по результатам поиска. Но оставшихся факторов вполне достаточно, чтобы оценить, есть ли на странице проблемы и нужно ли с ней что-нибудь делать.
Как «Тургенев» работает
Мы не знаем точно, но скорее всего за оценку качества текстов, как и за многое другое, в Яндексе отвечают алгоритмы машинного обучения. Им достаточно предъявить очень много примеров плохих страниц, еще больше примеров хороших — и они сами начинают строить набор правил, по которым можно отличить одни от других. Это очень эффективный путь — но если бы мы им воспользовались, то не смогли бы ответить на вопрос, что именно не так вот в этом тексте и что с ним делать, чтобы он стал лучше.
Поэтому наш подход другой — аналитический. Мы сформулировали несколько критериев оценки качества SEO-текстов, создали программы, которые оценивают тексты по этим критериям, и продолжаем работать над их совершенствованием и наполнением их словарей, а также над поиском новых критериев.
По каждому из критериев текст может получить то или иное количество штрафных баллов. Если баллов оказывается много, то вне зависимости от того, за что именно они получены, это означает, что текст нуждается в до- или переработке (иногда проще написать новый). Чем больше баллов, тем выше риск того, что и Яндексу это тоже не понравится.
Читать далее: