Блог Яндекса для вебмастеров

Семейный поиск становится лучше

1 июня 2010, 14:18
Многим пользователям важно иметь возможность оградить себя и своих детей от сайтов с материалами "для взрослых" при поиске в интернете. Поэтому с 1999 года на Яндексе существует "семейный поиск", где мы стараемся максимально обезопасить пользователей от появления в результатах поиска сайтов с "взрослым" содержанием как по запросам с неоднозначным толкованием, так и по прямым запросам.

Недавно мы значительно улучшили точность и полноту алгоритма классификации "взрослости" документов. От точности классификации напрямую зависит качество "семейного поиска", так как из-за ошибок релевантные документы могут исчезнуть из результатов поиска, а полнота фактически определяет надежность защиты пользователей от неприличного содержимого.

Существенный вклад в качество фильтрации внес алгоритм обнаружения баннерной рекламы порнографического содержания: документы, содержащие такую рекламу, мы также удаляем из результатов "семейного поиска". По нашим данным реклама взрослого содержания размещена не менее, чем на 50 тысячах сайтов рунета.

Воспользоваться "семейным поиском" можно, включив его в настройках поиска в разделе "фильтрация страниц".

Разработанная технология используется также и в большом поиске, когда в поисковом запросе явно не выражено намерение найти материалы "для взрослых". В этом случае поисковая система не предлагает пользователям в результатах поиска ссылки на ресурсы с подобными материалами.

Подробнее о политике Яндекса в отношении контента "для взрослых".
UPD: Если вы обнаружили в результатах неуместные сайты с материалами "для взрослых", сообщите нам.

Группа пролетарского гнева
19 комментариев
Подписаться на комментарии к посту

Вопрос по политике и ранжированию на конкретном примере.

Запрос не взрослого содержания 'вконтакте', умеренный фильтр, в выдаче сайт vkontakte-x.ru. При клике на любую ссылку на этом сайте - выдается откровенный порно-баннер.
Тот же запрос при 'семейном фильтре' - сайт исключается из десятки по запросу 'вконтакте', но находится по прямому запросу "Лучший сайт о Вконтакте (Vkontakte)".

Вопросы:
1. Сайт vkontakte-x.ru таки попадает под семейный фильтр или нет?
2. Если да, почему он находится прямым запросом? Если нет, почему он выпадает из десятки по запросу 'вконтакте'?
3. Почему этот сайт не попадает под политику умеренной фильтрации?

Ну и баг заодно сгружу.
Вы при семейном поиске забываете фильтровать текст, который отображается в выдаче в поле "найден по ссылке". Ну и, как следствие: по невинному запросу вида 'гигиена полового члена' - "найден по ссылке: Половые члены у стареньких дедушек (порно-ролики)…" и т.п. (Да, масштаб подхода - фильтровать все, кроме Википедии, оценил).

Запрос "Лучший сайт о Вконтакте (Vkontakte)" подразумевает поиск конкретного сайта, и в этом случае включается немного другая логика фильтрации, пороги "взрослости" для некоторых сайтов могут быть завышены. Что касается умеренного фильтра, то, поскольку на этом сайте из взрослых материалов есть только реклама, то он чуть-чуть не дотянул до порогового значения :(
Спасибо за примеры, посмотрим, что тут можно сделать.

По запросу "киски" находятся мокрые киски (в смысле кошки, которых вымыли). А запрос "мокрые киски" уже того. Результаты нулевые. 


 


По логике "Яндекса" выходит, что если кошку помыть, она становится порнографией. 

киски, киски... а если запросить" члены правительства", то интересно - что покажут?

Несколько замечаний по семейному фильтру:


1. Если порно-содержание находится в noindex (текст, картинки), то сайт не фильтруется.


2. Если идет поиск с ограничением по какому-нибудь сайту, то выводятся все страницы, в том числе и со взрослым содержанием. Кстати еще пару месяцев назад работало нормально.


3. Если в тексте написано "для всех членов вашей семьи", то страница попадает под семейный фильтр.


 


Замечание номер три исправить довольно тяжело, а вот первое и второе можно устранить довольно быстро.

Вы не могли бы привести пример страниц, которые попали под фильтр из-за наличия в тексте фразы "для всех членов вашей семьи"? Дело в том, что алгоритм должен распознавать такие случаи. Например:[ для всех членов вашей семьи ]


Спасибо.

Уберите картинку из третьего ряда по запросу "пушистая киска". Картинка кстати размещена в клубе я.ру. Себя забыли пофильтровать видимо. И это при включеном семейном поиске.

Скажите, а кто мешает ребенку, желающему найти порнографию, не пользоваться семейным поиском? Выходишь в обычный яндекс или гугл, и все тут.

Кстати, да, резонное замечание

Кто хочет - тот всегда найдет, в этом Вы правы. Но если желание это не очень сильное, либо ребенок, если мы говорим о них, еще не начал разбираться с настройками поиска, то семейный поиск может помочь оградить его от порнографии.

Гарантировано оградить - по ссылке о политике Яндекса.
кстати, вот: введите няфка при включенном семейном поиске. на первом месте чо? Луроморье. А там ... ;-)
собственно, с молодежным сленгом наверное все будет неоднозначно. область такая
или особая любовь к "энциклопедиям", в т.ч. и Лурку - тому виной
Спасибо! Актуальность ем стремительно подрастает рядом на стульчике.  :)
Скажите, в yandex.com действуют аналогичные фильтры?
Не ожидал получить по нормальному запросу preggy насквозь порнушную выдачу - http://yandex.com/yandsearch?text=preggy
Здравствуйте,
Спасибо за показательный пример. В yandex.com качество аналогичных фильтров пока весьма далеко от желаемого уровня, но в будущем мы постараемся исправить эту ситуацию.
Пока еще не нужен, но в будущем, думаю пригодится.

А контент с ненормативной лексикой семейный поиск фильтрует или это не входит в понятие "для взрослых"?