Яндекс дружит с Твиттером

Вчера мы впервые рассказали о нашей программе ПСИ (поиска по социальному интернету). Важной частью социального интернета являются микроблоги и в частности Твиттер.


И сегодня Яндекс и Твиттер объявляют о начале сотрудничества, в рамках которого Яндекс стал получать в режиме реального времени все обновления Твиттера (поток Firehose) и сможет использовать это для улучшения поиска, как русскоязычного, так и международного, а также других своих сервисов.



Чтобы уже сейчас сделать доступнее содержимое Твиттера, мы сделали для поиска по нему отдельную страницу:
http://twitter.yandex.ru


По данным Поиска по блогам Яндекса в кириллической части Твиттера свои микроблоги ведут более 2,2 миллионов пользователей. Среди них 1,5 миллиона – из России, более 500 тысяч – из Украины, около 95 тысяч из Беларуси.
Каждый день хотя бы одну запись на русском в Твиттер пишет более 265 тысяч человек.


И конечно, всё это – только начало.


Антон Волнухин, менеджер Яндекс.Поиска по блогам,
Ольга Никитушкина, руководитель группы технологических партнёрств

21 комментарий

Бомба, первый нх.

Пока в результате нововведений тяжело проходят комменты и статьи, часть поставленных статей и комментов (видимо, в момент перестройки) потерялась безвозвратно при установке, как будто их кто съел, в закрытых клубах не работает поисковик

Аватарки в комментах меньше смайликов в то время как на каких-то дешевых форумах о фэнтези они в 3-5 раз больше, чем аватар на ярушке в посте.

Буду надеяться, что все эти недостатки будут устранены, потому что не очень приятно общаться, когда твои комменты в момент общения исчезают. ;-)

Конечно, мы будем и дальше оптимизировать страницу результатов поиска. То, что есть сейчас – лишь первый шаг.
Спасибо за замечания.

Спасибо большое, Антон. Удачи вам в ваших делах!

Антон Волнухин, менеджер Яндекс.Поиска по блогам
Антон Павлов, менеджер сервиса Поиск по блогам
Да, берём только Антонов.
Класс, а как долго предполагается хранить проиндексированную информацию? Если это не секрет:)
Ограничений по срокам хранения твитов у нас нет, искать можно и за любое время в прошлом.
1. Если поток закрывается от общего доступа, что происходит с поиском по нему?
2. Если поток приоткрывается для общего доступа, как происходит его индексация?
1. Твиты из него перестают индексироваться. Уже проиндексированные по умолчанию остаются (автор может написать в службу поддержки и попросить их скрыть).
2. Новые твиты начинают индексироваться.
2. Только новые? Предыдущие вообще не будут проиндексированы? А в момент запуска сервиса что попадёт в его базу — то, что уже собрано ППБ?

Этот сервис на данный момент – составная часть ППБ.

Мы и раньше неплохо индексировали твиттер, хотя не 100% – мгновенно. Теперь скорость увеличилась, а в остальном правила остались почти такими же, как раньше.

Роман Климов
26 ноября 2015, 16:47
+1
это ОЧЕНЬ полезный сервис, вы молодцы! Был бы ещё поиск по картинкам, то есть можно было бы выбрать отображение исключительно картинок. И также с видео и текстами. Но это так, личные пожелания;). Удачи вам!
Александр Семёнов
26 ноября 2015, 16:47

А для этого есть какое-нибудь API? Чтобы можно было выгружать результаты поиска через этот сервер в файл или приложение? Извините, если вопрос покажется глупым, т.к. я не очень силён в технической стороне вопроса.

Отлично!) Еще бы и индекс обновили))

Антон, а были какие-то особые причины не делать ссылки в твитах реальными html ссылками в теге А?

сейчас они являются спаном с JS поведением:

 

http://t.co/6Vk5dQoQ' }">http://t.co/6Vk5dQoQ

в результате, я не могу навесить обработку этих "урлов" из аддона к браузеру. Эта же проблема будет у всех аддонов, которые проверяют ссылки на вирусы и т.п.

Можете поменять span на a?

Напиши этот вопрос мне по почте, пожалуйста, я спрошу у верстальщиков.

Странно, что подобная идея ни у кого не возникла раньше. 

Нужна не только идея, нужно подружиться с Твиттером =)