Зачем поиску социальные сети?

2 марта 2012, 16:39

Поиск в интернете проделал большой путь: от поиска по описаниям сайтов из каталога к поиску по текстам страниц, от учета ссылочной авторитетности (PageRank), интерпретации поведения пользователя на выдаче до сложных систем машинного обучения (MatrixNet). Сегодня мы на пороге следующего серьезного изменения.

В интернете уже опубликованы десятки, по другим подсчетам – сотни миллиардов веб-страниц. Более 99% из них созданы не людьми: являются спамом, дубликатами контента или другим автоматически сгенерированным мусором. По коротким поисковым запросам, например, [яндекс], в вебе может найтись более 100 млн. документов. Иногда в подобных случаях даже нет смысла искать слова по тексту страницы. Нам нужно понять, какие страницы по подобному запросу будут признаны другими людьми как наиболее авторитетные.

Аналогичный процесс информационной перегрузки имеет место при потреблении информации пользователями интернета. Многие материалы, с которыми вы можете столкнуться в сети, на первый взгляд похожи на что-то стоящее, но могут вводить вас в заблуждение или оказаться скрытой рекламой.

Чтобы решить эту проблему, люди давно научились выбирать сайты, например, новостные, которым они доверяют. Это им помогло, но сейчас этого уже недостаточно. Мы стали больше доверять не сообщениям «официальных» источников, а персонализированной информации, исходящей от знакомых, которым мы верим. Появившиеся социальные сети помимо функции общения стали играть роль сетей по эффективному распространению информации. А решение в них вопроса доверия и отбора информации привело к тому, что значительная часть информационной активности переместилась из классического веба в социальные сети.

Парадигма сегодняшнего интернета включает в себя слова "авторство", "авторитетность", "подписка", "дружба" и возникающий на основе этого – персональный информационный поток. Анонимная информация перестает оказывать влияние на людей, ибо просто не проходит через их фильтры. Веб-поиск, по нашему мнению, просто должен быть не глупее пользователей, уже научившихся отбирать информацию, и использовать схожие механизмы для адекватного ее восприятия.

Знаменитый Твиттер, с полным потоком данных которого (Firehose) недавно начал работать Яндекс, великолепно решил задачу построения сети распространения информации между людьми. Короткие твиты как результаты поиска могут быть полезны, когда какое-то важное событие происходит или произошло прямо сейчас, а классические медиа еще не успели осветить развитие ситуации. Эту задачу решает Real-Time поиск по Твиттеру (http://twitter.yandex.ru). Еще одно применение такого поиска – это поиск мнений людей о той информации, с которой пользователь уже знаком.

Однако именно поиск веб-страниц и других объектов в интернете, упомянутых в Твиттере или соцсетях, – это то, зачем по-настоящему нужны социальные сети поиску. Эту модель реализовал поисковик Топси (http://topsy.com), результаты которого теперь используются Яндексом. Анализируя упоминания материалов авторами, которым доверяет алгоритм, опираясь на понятие авторитетности для отсечения мусора, поиск может находить то, что наиболее интересно большинству людей. А Real-Time анализ популярности тем, обсуждаемых прямо сейчас в соцсетях, позволяет определять наличие событий и потребности у пользователя в свежих материалах.

Следите за нашими запусками в рамках программы поиска в социальном интернете.

Федор Романенко, в размышлениях о поиске

8 комментариев

Авторизуйтесь, чтобы оставить комментарий

netsergey

26 ноября 2015, 16:47

Будет перекос в сторону полемической части у такого поиска.

Тем, кто хочет быть выше в таком поиске, стоит создавать контент, который будет возмущать.

Fedor R.

26 ноября 2015, 16:47

Некоторый перекос в желтизну и полемичность может быть, но только в отдельных случаях. В целом такой способ поиска просто работает.

Globator

26 ноября 2015, 16:47

Поиск? Регистрация в соцсетях? Легко поднять ТИЦ? Легко раскрутить? Уверены? А вот эту статейку не хотите глянуть
http://xxdevil.blogspot.com/ я вот этих советчиков сетевых тоже начитался и по этим советам раскручивал сайт о том как заработать в сети http://xxdevil.narod2.ru/ и вышеупомянутый блог о заработке и что? В плане прироста ТИЦ – НИЧЕГО. Зато все по советам. Будут они конкурентов плодить и толковое советовать? Короче все в статье.
С Уважением xxdevil

PAND-or

26 ноября 2015, 16:47

Мне кажеться, что если вдруг Яндекс начнет полностью ранжировать сайты по социальному статусу. То возникнет обратная сторона проблемы - огромное количество мусора в социальных сетях.

Уже сейчас, многие акаунты наших друзей в социальных сетях взломаны и от их имени идет ~~спам~~ репост с различных социальных групп. На этом фоне возникнет целая новая индустрия мошейничества и накрутки.

Fedor R.

26 ноября 2015, 16:47

Да, есть такая опасность. Как только начинаем использовать новый вид сигнала, появляется желание его замусорить. Однако, спама на блогохостингах и в соц.сетях сейчас уже очень много (десятки процентов), но большинство людей его не замечают, ибо персональные средства фильтрации источников информации в соц.сетях хорошо работают. Поиск просто должен быть не глупее. Хороший момент в том, что в структурированных сетях, когда автор всегда известен, достаточно просто ловить спаммеров, и это уже делается.

PAND-or

26 ноября 2015, 16:47

Спам, рекламу сейчас соц сети пытаются пресекать, меры предпринимаются, усложняется капча, вводится запрет на ссылки.

Но что делать со скрытой рекламой или пиар других ресурсов?

Маша ведет посещаемый блог, есть читатели, есть и те кто верит Маше. А вот однажды Маше предложили рассказать о каком-то товаре, услуге или сайте и дали за это шоколадку?

Социальная активность пошла, сайт (товар) стали обсуждать. Но как в таком случае Яндекс будет определять? дали ли Маше за это шоколадку? или она действительно была заинтересована тем ресурсом?

Fedor R.

26 ноября 2015, 16:47

По поводу фильтрации спама: капча это только первичный фильтр. Социальный поиск же основан на "экономической" авторитетности, которую очень сложно заработать и довольно легко растерять. В частности, какие-то простые методы накрутки авторитетности в виде создания фермы аккаунтов, ссылающихся друг на друга, приведут к нулевому результату.

Да, второй вопрос - совершенно правильный, в рунете есть "продажные" блоггеры. На него есть такие ответы:

- все-таки, как правило, одной ссылки совершенно недостаточно

- социальный поиск не обязан отвечать на запросы всех тематик, вполне возможно его не использовать, скажем, для коммерческих запросов, где риски наткнуться на сео высоки

- если доля продакт-плейсмента мала, он не раздражает пользователей, они не отписываются от автора, то да, автомат его, вероятно, не заметит. Однако, влияние таких постов на поиск также останется сравнительно небольшим. Т.е. поиск всего лишь должен быть не глупее человека при фильтрации информации.

j-mlm

26 ноября 2015, 16:47

Да не как не будут проверять, а шоколадки давали дают и будут давать )... А те кто не берут... И начинают конкуррировать то поподают под ДДОС.