Все разделы помощи
  • Как искать в Яндексе

  •  Proxy и privacy

    Летом 2001 года администрация Яндекса приняла решение о запрете доступа к Яндексу через анонимные открытые прокси. В этом тексте мы подробно объясняем нашу позицию.

    Сначала немного теории. Прокси-сервер (от английского "proxy", означающего "полномочие; доверенность; заместитель, уполномоченный, доверенное лицо") - распространенный способ организации доступа в интернет. Прокси используется для экономии трафика - статические страницы на нем кэшируются, поэтому если, например, все сто ваших программистов начинают день с чтения новостей на Slashdot, прокси избавит вашу сеть от лишних 99 обращений на сайт slashdot.org. Такая работа прокси-серверов в принципе полезна всему интернету, поскольку уменьшает общий объем прокачки информации и, следовательно, меньше загружает каналы связи. Прокси используют практически все провайдеры.

    В другую сторону, на выходе во внешний интернет, прокси-сервер как бы выступает от имени пользователей, находящихся за ним - запрос к сайтам идет от IP прокси, а не каждого конкретного компьютера. В частности, это значит, что весь штат компании может выходить в Сеть через один подсоединенный к ней компьютер.

    В большистве случаев прокси передает в запросе адрес (IP) клиента, но существуют и анонимные прокси. Тогда "снаружи" видна только некоторая интегральная деятельность пользователей этого прокси, но не одного конкретного человека (IP). Компании часто ставят прокси, чтобы скрыть структуру своей внутренней сетки и минимизировать трафик. Это нормальное поведение серверов в интернете. Ненормальным оно становится тогда, когда прокси не только анонимный, но и открытый.

    Теперь настало время коснуться понятия privacy. Это слово плохо (пока) поддается переводу на русский язык, самое близкое значение - "частная жизнь". Технически грамотных пользователей (которые, конечно, составляют небольшую долю, но именно они во многом определяют развитие интернета) часто беспокоит сложившаяся практика установки меток (cookie) не только самими сайтами, но и счетчиками и баннерными сетями, на них расположенными. Яндекс относится к privacy в интернете следующим образом - в нашем Соглашении о конфиденциальности информации сказано, что мы никогда никому не предоставляем информации о пользователе, иначе как на законных основаниях. А если мы располагаем на своих страницах чужой код, то обязательно подписываем с его владельцем соглашение об аналогичном отношении к пользователям. Несмотря на страшные прогнозы, которые иногда появляются в интернете (big brother is watching you), несмотря даже на СОРМ-2, в который пришлось вступить многим провайдерам (к счастью, бесплатные сервисы пока от него свободны), в нашей стране еще не зафиксировано ни одного случая, чтобы человек был выслежен и пострадал за какое-либо выражение своих убеждений в каких-либо рассылках или конференциях.

    Возникает естественный вопрос: зачем тогда вообще знать IP пользователя? Ответ такой: IP пользователя нам нужен в одном единственном случае, а именно - при его некорректном поведении, наносящем урон другим пользователям. Более того, знание этого IP служит нам единственным образом - мы можем закрыть доступ с него и/или написать письмо его хозяину (корпорации или провайдеру). Здесь не имеется в виду размещение на Народе сайта, посвященного детской порнографии - такой сайт мы просто закроем и отменим регистрацию, по которой он был создан, совершенно не интересуясь адресом, с которого сайт был закачан. Некорректное поведение - это долбление служб Яндекса скриптами, которые могут, например, автоматически регистрировать почтовые ящики и рассылать с них спам, или скачивать информацию, запрещеную для скриптов (в robots.txt), или просто устраивать DOS-атаки и загружать наши сервера бессмысленной работой в ущерб пользовательским запросам.

    И вот тут мы вплотную подошли к проблеме анонимных открытых прокси. "Анонимные" - значит IP пользователя нам не передается, а приходит IP самого прокси. "Открытые" - что им может воспользоваться не ограниченный круг пользователей (клиентов провайдера, сотрудников компании), а абсолютно любой человек, подключенный к интернету. Теперь смотрите, что получается. Когда "нехороший" скрипт достает мой сайт с одного IP, я могу это довольно быстро отследить и, в конце концов, просто закрыть этому IP доступ ко мне. Но имея список открытых прокси (а они исчисляются сотнями), можно написать программку, которая будет заниматься своим "черным" делом с сотен адресов, что гораздо труднее и заметить, и пресечь. Эта проблема хорошо знакома владельцам интернет-счетчиков, поскольку именно с помощью таких прокси счетчики легко накручиваются. Подобная проблема беспокоит и провайдеров (см. http://www.ofisp.org/documents/ofisp-005.html, п.5).

    Надо сказать, что в 99% открытые анонимные прокси - это не обдуманное решение его владельца, а ошибка в конфигурировании сервера или "любезная" настройка хакера, этот сервер вскрывшего. Поэтому владелец не в состоянии отследить деятельность, проходящую через него. А кроме этого, часто еще и платит за трафик, который гоняют через его сервер неизвестные ему пользователи.

    За первый месяц со дня введения этой меры у нас набралась кое-какая статистика. Ну, во-первых, из пары тысяч открытых прокси, заходящих на Яндекс, российские составляют порядка сотни. Во-вторых, количество запросов, на которые выдается эта спецстраница, составляет несколько тысяч в день (доли процента на фоне миллиона обращений к Яндексу). Причем, через 85% открытых прокси приходит по 2-3 запроса в день, а запросы через остальные 15% более чем на 90% сгенерированы роботами. По нашим оценкам количество человек, для которых Яндекс оказался недоступен из-за неправильно сконфигурированных прокси, не превышает сотни в день, и это, в основном, корпоративные пользователи (то есть неправильно сконфигурированные корпоративные прокси).

    Второй способ оценки результатов нашей акции - письма пользователей. Естественно, пик возмущения (5-6 писем) приходится на следующий день после обновления списка прокси - "Почему это еще вчера я мог зайти на ваш сайт, а сегодня меня не пускают?" Проблема состоит в том, что прокси - это ответственность и вотчина сисадмина, а не пускают пользователя, который может не знать ни слова "прокси", ни слов "системный администратор". Как выяснилось, подавляющее большинство российских открытых прокси - это не провайдеры, имеющие штаты опытных системщиков, а компании, недавно подключившиеся к интернету и не имеющие большого опыта конфигурации серверов. К чести новичков надо сказать, что они довольно быстро понимают, чем грозит открытость их прокси как в смысле общественного порядка, так и в смысле оплаты прокачиваемого через них "паразитного" трафика, ликвидируют проблему и пишут нам благодарность (на что мы меньше всего рассчитывали при принятии этого решения :-). Естественно, как только прокси перестает быть открытым, его клиенты тут же восстанавливаются во всех правах.

    Из сотни писем, на которые мы ответили после введения этой меры, парочка касалась privacy. Нас упрекали в том, что мы сотрудничаем с ФСБ, что мы хотим ограничить свободу и т.д. Отвечаем на это еще раз: по нашему глубокому убеждению эта мера никак не ограничивает никакой вашей деятельности, и наоборот - нет никакой приличной деятельности в интернете, для осуществления которой нужно было бы пользоваться анонимными открытыми прокси. Кстати, вы не боитесь, что и без нас есть человек, который хранит полные логи вашего поведения - ваш провайдер? А если вы пользуетесь неизвестно чьими анонимными прокси, вы не боитесь, что они могут выуживать информацию о ваших логинах и паролях? Поэтому совет для параноиков: постоянно покупайте карточки разных провайдеров, входите в интернет с разных телефонных номеров (еще лучше - с разных компьютеров), пользуйтесь услугами www.anonymizer.com. А главное - ведите себя прилично, и тогда все будет как с неуловимым Джо (А почему он такой неуловимый? А потому, что его никто не ловит...).


      © 1997—2012 «Яндекс»
    О проекте · Статистика