Люди пользуются Яндекс.Картинками по-разному. Одни ищут изображения знаменитостей, другие по фотографии кресла-качалки пытаются найти интернет-магазин, в котором его можно купить. Бывает и так, что на вопрос отвечает не одна картинка, а несколько. Люди, которые в поиске спрашивают [как нарисовать дракона], рассчитывают найти пошаговое руководство из нескольких изображений, а тем, кто интересуется архитектурой, нужны фотографии здания с разных ракурсов. Это достаточно распространённая цель — только с инструкциями связано около девяти процентов запросов к поиску по картинкам. Как правило, пользователи находят подходящую картинку и переходят на сайт в надежде, что там будет больше нужных изображений. Но они не могут знать заранее, где именно найдут ответ. Чтобы решить эту задачу, мы выделили в результатах поиска те страницы, на которых есть несколько похожих картинок. Так появились Серии картинок.
Серия — это отдельный блок изображений, связанных между собой единым стилем или тематикой. В Серию входит несколько изображений с одной страницы — чтобы пользователь понял, что на ней можно увидеть полный репортаж или мастер-класс.
За подбор картинок отвечает алгоритм иерархической кластеризации. Он берёт все изображения с той или иной страницы и с помощью технологии компьютерного зрения выделяет группу похожих — тех, которые обладают общим цветом, формой, деталями и так далее. (В отличие от недавно запущенного поиска по картинке, для определения сходства в Сериях используются глобальные признаки, а не визуальные слова.) Очевидно, что в одной группе должны оказаться, например, все картинки, на которых одинаковые предметы сняты с разных ракурсов. Или на которых одинаковые предметы выполнены в разных цветах. Алгоритм анализирует все изображения на странице, и в результате все схожие оказываются в одной группе. Если на странице есть хотя бы четыре похожих (но не одинаковых) картинки, то они образуют Серию.
Следующий важный вопрос — юзабилити, насколько пользователям удобно работать с Сериями. Сколько картинок должно быть в Серии? Как их лучше расположить? Как пользователь поймёт, когда начинается Серия и когда она кончается? Мы создали около десяти вариантов дизайна, несколько из них предложили протестировать пользователям. Вот два примера:
Почти всем больше нравилось, как выглядят Серии на первом варианте. Но при этом активнее взаимодействовали люди со вторым. Конечный дизайн включает в себя лучшие стороны протестированных вариантов — наглядность и удобство.
Пользователи чаще переходят из Серий на страницу-первоисточник, чем вообще из картинок. На тестированиях мы видели, что люди очень негативно реагируют на избыточную рекламу и внезапно выпрыгивающие попапы. Поэтому для страниц с агрессивной рекламой Серии не формируются.
Александра Ямпольская, менеджер проектов Яндекс.Картинок