Клуб Я.Субботника

Кластеризация дубликатов в Яндекс.Картинках

фото автора
Александр Крайнов. Екатеринбург, 2 июля 2011 года
С 2000 года занимается проектами, связанными с обработкой медиаданных. В Яндексе отвечает за проекты, в которых задействовано компьютерное «зрение».

О докладе
Как делается поиск дубликатов изображений, для чего это нужно и какие проблемы приходится решать.

Легко найти дубликаты среди тысяч картинок. Сложнее – среди миллионов. И совсем трудно –среди миллиардов. Чем выше полнота работы алгоритма, тем больше проблем. Но в то же время полнота кластеризации дубликатов – это основа качества поиска изображений.




презентация, pdf видео, 1.35 Гб