Клуб Фоток

Дубли

Совершенно случайно наткнулся на дубль картинки и возникла идея, что можно такое как-то контролировать.

 Картинка 1

 Картинка 2

Первую картинку я лично сканировал с газеты и залил на яфотки. Специально отмечу - я не имею никаких претензий по этому факту. Но ведь кто-то будет претендовать на авторство в подобных случаях, и хорошо, если ещё заметит.

Поэтому предлагаю фичреквест - в случае загрузки фотки/картинки, идентичной той, что уже была кем-то загружена, автоматически приписывать "оригинал фотографии находится здесь", а к оригинальной добавлять коммент "ваша фотка была опубликована тут". В таких безобидных случаях, как этот - будет просто полезная информация. В случае же воровства картинки - серьёзным аргументом против ;)

22 комментария
Как быть в ситуациях, когда ты являешься автором фотографии, заливаешь её сначала куда-нибудь на фотоконференцию в другое место, не на яндекс. Оттуда её кто-нибудь копирует сюда. А потом автор пытается свою фотку в яндексе опубликовать, а ему говорят: оригинал уже есть, и он не ваш. Надо, мне кажется, предусмотреть такой поворот событий) Например, как-то изменить текст про оригинал. Хотя, если автор сочтёт, что его права нарушены, он может обратиться в поддержку Яндекса.
Ну, можно добавить кнопочку рядом с подписью - "это моё!", и что-нибудь с предоставлением оригинала.
для выяснения кто автор у Я.Фоток вроде процедура была, не? Пишите в сапорт, они спрашивают у вас факты подтверждающие, вы предоставляете, и ситуация разруливают. Предлагаемая фича полезна в вашей ситуации будет полезна тем, что вы (автор) будите своевременно информаированы о том, что ваши работы уже расползлись
Да, я именно это и имела ввиду. Например: "Ещё ссылки на это фото".
Да, очень хороший вариант.
> идентичной той И кто будет сверять идентичность? Только не говорите, что скрипты напишут, щас, ага, за пару дней. И более простых-то вещей не допросишься...
поиск по картинкам яндекса уже умеет находить похожие изображения.
Я что-то пропустил, и появился поиск по образцу изображения, а не по тексту описания?
http://clubs.ya.ru/company/replies.xml?item_no=14086 Задача поиска дубликатов оказалась технически сложной. Есть много научных работ на тему интеллектуального сравнения двух изображений, а для специалистов по "компьютерному зрению" задача опознать пару изображений, полученных изменением размеров, не является серьезной задачей. Однако никто из этих специалистов не имел возможности поработать с базой из 600 млн картинок. Попарное их сравнение на одном компьютере потребовало бы около 300 млн лет. К сожалению, обычными методами с помощью хеш-функций задачу решить тоже не удается. Но мы это сделали!
http://tineye.com/ Ищет именно дубликаты.
ээ, мне-то этот линк зачем? О том, что есть такие сервисы в природе, я как-бы знаю, но мне они не интересны. До сих пор ни разу не было необхдимости искать дубликат. Я сообщал собеседнику, что технология поиска дубликатов у Яндекса есть. Вы, оказывается, тоже не знали - теперь знаете.
Если ей невозможно пользоваться - то можно считать, что и нет ;) Ведь загрузить оригинал для поиска нельзя. А что при поиске по текстовой фразе выводятся картинки в разном разрешении - это хорошо, но немного не то.
Я не понимаю, вы что мне пытаетесь показать? Я пытался показать, что ваша задача на 80% решена в тех или иных сервисах яндекса. И что имея все эти решения, технических сложностей решить вашу задачу нет. Вы начинаете мне что-то объяснять и доказывать. Если вас устраивает тот сервис который специализируется на поиске дубликатов, зачем тогда фичрексест к фоткам? Фотки, это фотохостинг. Тут разрешают хостить любые изображения. Ограничения написаны в пользовательском соглашении.
Ой, ни в коем случае не пытаюсь, скорее хочу выяснить, может я чего не знаю, а оно уже есть ;)
следует отметить, что есть не "поиск по образцу", а "склейка дубликатов". Т.е. механизма в котром можно дать яндексу картинку, и он найдёт все похожие я не знаю. Но похожие картинки, которые уже проиндексированы, поиск склеивает в один результат, и понимает - что это всё вариации одного изображения - суть дубликаты
Тогда с этого момента поподробнее. Есть выложенная фотка, пусть вероятно проиндексированная, без меток, описания и названия. Как и что надо вводить в поиске, чтобы найти вот эти самые дубликаты?
за этим, видимо, лучше обратиться к сотрудникам яндекса, которые знают тонкости работы работы поиска по кратинкам :)) Я повторюсь - сейчас технология работает так - в выдаче поиска выдаются все найденные дубликаты картинки как один результат выдачи. Что нужно набирать, чтоб найти хотя-бы один из них - я не знаю. Как быстро дубликаты склеиваются - я тоже не знаю. С точки зрения практического применения, это всё находится на границе моей вселенной.
Размер картинки, экзиф (если есть), размер файла.
И контрольную сумму посчитать для убедительности. Всё это совершенно несложно и быстро делается автоматически.
Контрольная сумма штука капризная, один байт вбок и всё, не совпало) Зато если совпало - то 100% дубль...
хм, мы например, чтобы вычислить плагиат пользуемся тинаем.
Так это если искать специально конкретную фотку. А моё предложение сводится, в итоге, к тому, чтобы мне на емыл пришло само - "вашу такую-то фотку выложили вот там-то" ;)