Клуб Фоток

Поиск дублей

Хочу кнопку "найти дубли". Чтобы находить у себя в альбомах дубли текущей картинки. Ну допустим, я ее загрузил, но мне кажется, что я ее загружал уже раньше. Хочу удостовериться. Можно без интеллектуальности - просто по хэш-коду например. Ну то есть, только точные копии будет достаточно.
17 комментариев
хотя бы тот же алгоритм, который в поиске картинок работает...
на фотках нафиг надо, в программе - хорошо бы.
Сергей Смирнов
28 января 2016, 00:56
и там и там
Alex-Raduga (Алексей)
28 января 2016, 00:56
Если уж искать - то по всему Яндексу. Кто у кого своровал. :-)
Сергей Смирнов
28 января 2016, 00:56
Это долго и ненужно)
Alex-Raduga (Алексей)
28 января 2016, 00:56
А сколько же надо загрузить фотографий, чтобы не найти у себя дубли ? У меня больше тысячи и я легко нахожу. Они же по альбомам..
А искать по всему Яндексу может быть, и правда будет долго. Хотя и нужно. У меня своровали, а я узнал только, когда в Популярные попала...
Сергей Смирнов
28 января 2016, 00:56
У меня около 4 тысяч на вскидку.
Alex-Raduga (Алексей)
28 января 2016, 00:56
Тогда - сложнее...
Сергей Смирнов
28 января 2016, 00:56
И это при том, что у меня продуманная система тегов и вложенных каталогов, да.
Alex-Raduga (Алексей)
28 января 2016, 00:56
У меня вложенных альбомов нет - их смотреть неудобно. А вот меток у меня много. Для того, чтобы лучше смотрели фотографии.
Кстати, копии всех загруженных фотографий я сохраняю на своем компьютере. Они же в другом размере.
Александр Козлов
28 января 2016, 00:56
А у меня около 102 тысяч :) Функция - очень нужная.
позитив, я +1
Николай Конев
28 января 2016, 00:57
Хэш изменится при первом же изменении в метаданных (теги, дата, гео, описание и пр.).
Я раньше метки в EXIF проставлял через XnView, программа "Я-Фотки" их поймала, не исключено, что она только в файлах и хранит метаданные.

То есть хэшем тут не отделаешься.
Сергей Смирнов
28 января 2016, 00:57
я знаю что такое хэш. Я прошу хотя бы хэш.
Николай Конев
28 января 2016, 00:57
Дык хэш не поможет, если теги-описания-итп сохраняются в файле фотки. Хотя не факт, конечно.
Но если факт, то дубли будут.
Сергей Смирнов
28 января 2016, 00:57
По-моему никакие теги и описания в фотках не сохраняются сейчас. Только то, что было в EXIF, то и есть.
Николай Конев
28 января 2016, 00:57
А потом мы обновляем фотку в альбоме из программы "Я-Фотки", которая стопудняк пишет всё в EXIF, льем заново на сервис и если тот не потрошит из EXIF'а теги, опять получаем "уникальную" фотку.
Или например, не дай бог, Я-Фотки сохранит перед отправкой дату изменения файла в EXIF или другой какой мусор.
Но с точки зрения производительности и гибкости теги всяко выгоднее держать в бд и я бы на месте Я-Фотки-разработчиков сносил EXIF целиком, сохраняя все его параметры в бд.
Как оно на самом деле — легко проверить: сливаем фотку в разных размерах и смотрим, что там у неё в EXIF. А можно и полным циклом — сделал фотку, набил EXIF, залил, потом слил и посмотрел, что осталось от EXIF'а. И сливать лучше "оригинальный размер", а не уменьшенный.
Но при всем моем скептицизме, маловероятно, что разработчики хуже меня в таких вещах шарят, так что дело за ними.