Блог Яндекса для вебмастеров

май 2011
Скрытые спам-ссылки и безопасность сайта
3 мая 2011, 17:33

В последнее время заметно участились случаи взлома сайтов с целью включения в страницы скрытых спам-ссылок, ведущих на посторонние ресурсы. Из-за этого взломанный сайт может быть временно исключён из результатов поиска, а пользователям могут выдаваться не те страницы, которые они хотят найти. Идея такого заражения не нова, но сейчас оно носит массовый характер и обладает новыми особенностями, с которыми мы раньше не сталкивались. Поэтому мы решили ещё раз напомнить о существовании такой проблемы и о способах её устранения.

Последняя волна заражений была связана в основном с сайтами, которые используют CMS Joomla, но это не значит, что сайты на базе других CMS не могут оказаться взломанными.

Как это происходит

Сначала злоумышленник получает доступ к сайту, использовав одну из его уязвимостей. Затем он загружает на сайт файл .php, содержащий вредоносный код, или дописывает этот код в уже существующие файлы. Вредоносный код никак не проявляет себя при посещении сайта обычными пользователями, но когда сайт индексирует робот поисковой системы, ему выдаётся множество скрытых спам-ссылок, например, таких:

<!--cacheb--><p style="display: none;">
<a href="http://www.msu.edu/~offbeat/.ed/tadalafil-generique.html">tadalafil generique</a>
<a href="http://www.msu.edu/~offbeat/.ed/viagra-europe.html">viagra europe</a>
<a href="http://www.msu.edu/~offbeat/.ed/canadian-cialis.html">canadian cialis</a>
<a href="http://www.msu.edu/~offbeat/.ed/cialis-commercial.html">cialis commercial</a>
...
<a href="http://www.msu.edu/~offbeat/.ed/contre-indication-viagra.html">contre indication viagra</a>
<a href="http://www.msu.edu/~offbeat/.ed/cialis-moins-cher.html">cialis moins cher</a>
<a href="http://www.msu.edu/~offbeat/.ed/cialis-espagne.html">cialis espagne</a>
</p><!--cachee-->


Вредоносный код выдаёт страницу со ссылками только роботам поисковой системы. В страницах, которые выдаются обычным пользователям, таких ссылок нет. Вебмастер тоже не сможет увидеть эти ссылки в исходном коде страницы, если зайдёт на неё через браузер.

Наличие на сайте скрытого текста расценивается Яндексом как нарушение, поэтому содержащие его страницы временно исключаются из поиска. Если мы обнаруживаем скрытый текст на сайте, который зарегистрирован в сервисе Яндекс.Вебмастер, то присылаем вебмастеру сообщение об этом, чтобы вебмастер смог оперативно проверить свой сайт и устранить найденные проблемы.

Как найти источник проблемы?

Вредоносный код, который в последнее время используется, чтобы выдавать роботам страницы со спам-ссылками, с большой вероятностью содержит функции “eval”, “base64_decode”, “json_decode” или “gzuncompress”, при этом использует переменные user_agent и referer. Но такой код постоянно эволюционирует, поэтому его признаки и принципы действия могут измениться в любой момент.

По ссылке приведён образец вредоносного кода, который был включён в CMS Joomla. В данном случае, его характерным признаком является, кроме перечисленных, наличие строки “JOOMLA_CACHE”.

При запросе страницы со взломанного сайта, код отправляет запрос серверу злоумышленников с ip-адресом 78.159.101.232. Этот сервер проверяет user-agent, referer и другие параметры, и выдаёт вредоносному коду на взломанном сайте инструкции для дальнейших действий. Например, если user-agent принадлежит роботу поисковой системы, то роботу выдаётся страница со спам- ссылками.

Что делать дальше

Если Ваш сайт действительно был заражен, то после его полной очистки рекомендуем предпринять следующие профилактические меры, чтобы свести риск повторного заражения к минимуму:

1. Сменить все пароли доступа к сайту: от ftp, административной панели, базы данных, SSH и панели управления веб-хостингом.
2. При дальнейшей работе с сайтом не сохранять эти пароли в браузерах, ftp-клиентах, файловых менеджерах и т.д.
3. Обновить CMS до последней версии и регулярно обновлять её в будущем.
4. Использовать надежную антивирусную программу и также следить за ее регулярным обновлением.


P.S. Команда Яндекс.Поиска выражает глубокую благодарность вебмастерам, которые поделились с нами подробной информацией «изнутри» и сделали написание этой статьи возможным.

40 комментариев
безопасность
Новое в поиске (апрель 2011)
5 мая 2011, 15:39

 

Подводим итоги апреля:

 

Поздравляем вас с праздниками!

Команда поиска

 

15 комментариев
новое в поиске
Новые расширенные сниппеты для сайтов организаций
16 мая 2011, 13:56

Рады сообщить об очередном пополнении списка организаций, для которых можно сделать специальный сниппет. Сегодня это тату-салоны, автомобильные мойки и шиномонтаж, санатории, ломбарды, ателье по пошиву одежды и солярии. Кроме того, для сайтов гостиниц теперь можно указывать существенно больше информации на странице организации на Яндекс.Картах.


Владельцы сайтов часто интересуются: как формируются сниппеты, по какому принципу выбираются организации для расширенных сниппетов, как мы решаем, какие данные показывать. Сегодня мы расскажем об этом.

Какие данные со страницы попадают в результаты поиска?

Заголовок результата поиска — это чаще всего заголовок самого документа, либо его фрагмент. Текст для описания страницы отбирается следующим образом. Из текста на странице программа выбирает все фрагменты со словами из запроса. Каждый фрагмент разбивается еще на несколько частей, например, со словами из запроса в начале, в конце и в середине. Все получившиеся части сравниваются между собой. Лучшие попадают в сниппет.
Подробнее об этом читайте в статье про результаты поиска и их формирование.

Как можно повлиять на содержимое сниппета своего сайта?


Один из вариантов — использование тега meta description, то есть мета-описания. При формировании сниппета вместе с фрагментами текста страницы рассматривается содержимое этого тега. Рекомендации по составлению мета-описаний вы найдёте в Помощи.

Как вы выбираете организации со специальными сниппетами? Почему, например, для автосервисов они есть, а для мотосервисов — нет?

Для выбора есть несколько критериев. Самый основной — популярность данного типа организаций у пользователей поиска Яндекса и Яндекс.Карт. [Бассейны в москве], [рестораны], [кинотеатр в питере] — такие запросы пользователи задают часто, что позволяет сделать вывод о востребованности информации такого рода. Следовательно — необходимо качественно и полно отвечать на подобные запросы уже в результатах поиска.

Как вы выбираете параметры, которые будут показываться в сниппете?

Для каждого типа организаций мы подбираем признаки — важные или уникальные характеристики объекта. Необходимость указывать такой признак либо очевидна и не требует обоснований (звездность гостиницы, официальный ли дилер автосалон и.т.д.), либо эту характеристику часто запрашивают пользователи Яндекса (кальян в ресторанах, сейф в гостиницах, чипирование в ветклиниках). Пользователи могут прямо в результатах поиска выбирать подходящий ответ из однотипных, например, гостиницу нужной «звёздности», и экономить время и трафик. А организация — получать посетителя сайта, заинтересованного именно в её услугах.


Мы приглашаем владельцев сайтов организаций передавать данные для формирования спецсниппетов. Это можно сделать с помощью сервиса Яндекс.Вебмастер, в разделе «География сайта», «Адреса и организации».
Подробнее узнать о добавлении организаций вы можете в специальном разделе Помощи.


Команды Поиска и Справочника организаций

17 комментариев
содержимое сайта
Поддержка атрибута rel=”canonical” роботом Яндекса
23 мая 2011, 12:44

Сегодня мы включили поддержку атрибута rel=”canonical”.
Что это такое и зачем это нужно?

На вашем сайте могут присутствовать страницы с разными URL, но с очень похожим (или одинаковым) содержанием. Например, одна и та же страница сайта может быть доступна по двум адресам:

www.examplesite.ru/pages?id=2
www.examplesite.ru/blog


Алгоритмы поисковых систем умеют определять среди таких дублей основную страницу, которая попадет в поисковую выдачу. Однако не всегда выбор поискового робота может совпадать с предпочтениями владельца сайта.

С помощью атрибута rel=”canonical” вы можете указать, какая страница является «канонической» – предпочтительной для индексации и появления в результатах поиска. Если Яндекс будет знать о том, что содержание страниц одинаково, он проиндексирует и добавит в результаты поиска только одну из них, выбранную владельцем сайта. 
Таким образом можно избежать дублирования содержания страниц в результатах поиска и дать возможность поисковому роботу уделять больше внимания индексированию других, не менее важных страниц сайта.

Подробную информации об использовании тега rel=”canonical” читайте в Помощи Яндекс.Вебмастера.


Команда Поиска
67 комментариев
робот
Об одном из некорректных способов поискового продвижения и его последствиях
23 мая 2011, 16:42
Яндекс уже высказывал своё отношение к поисковой оптимизации — единственно правильным способом мы считаем улучшение качества сайта в интересах пользователей. Влияние на параметры ранжирования с помощью различных манипуляций мы рассматриваем как стремление обмануть поисковую систему и пользователей.

В последнее время мы видим попытки повлиять на поисковую систему путем эмуляции действий пользователей. Чаще всего это происходит с помощью программ, которые задают запросы в поисковую систему и потом переходят на определенные сайты, но известны и другие способы. Все они — обман, не имеющий ничего общего с настоящей оптимизацией сайта. Кроме того, создание подобных систем накрутки способствует развитию бот-сетей, которые могут быть использованы для DDoS-атак, распространения вредоносного ПО, рассылки спама.

Мы уверены, что такие методы вредны для развития интернета. Мы считаем их поисковым спамом и предпринимаем соответствующие меры в отношении использующих их сайтов.

Яндекс настоятельно рекомендует владельцам сайтов, веб-мастерам и компаниям, предоставляющим услуги в области SEO, воздержаться от использования этого и других методов псевдооптимизации. Они бесперспективны и могут привести к потере вашим сайтом репутации и позиций в результатах поиска.

Команда поиска Яндекса
244 комментария