Блог Яндекса для вебмастеров

Улучшение определения авторства

2 ноября 2010, 17:57
Многие вебмастера знают, как обидно обнаружить копию своего текста, размещенную на чужом сайте, которая в результатах поиска находится выше оригинала.Чтобы честные вебмастера расстраивались как можно реже, Яндекс старается отдавать предпочтение оригиналам. Благодаря сегодняшнему обновлению страницы, содержащие авторский контент, стали ранжироваться лучше.

В большинстве случаев наш поисковик правильно определяет автора документа, убирая копии из выдачи. Обычный пользователь ссылки на ресурсы с «копипастой» не увидит, но у вебмастера есть возможность посмотреть, где и кем используются его тексты. Чтобы увидеть результаты поиска без фильтрации, нужно пройти по ссылке «Показать все ответы без исключения» в конце выдачи.

Мы хотим сделать определение авторства еще точнее, поэтому если ваш оригинальный текст ранжируется хуже копии, сообщите, пожалуйста, нашей службе поддержки.

Разумеется, Яндекс не пытается оценить законность копирования текста. Мы отдаем предпочтение авторской публикации, даже если дальнейшее ее распространение происходит с полного согласия автора.

В общем, перефразируя Маяковского: больше текстов, хороших, но разных.

Оригиналы и команда поиска
126 комментариев
Это вполне справедливо!:-)
:-D это так предполагается решить некоторые проблемы ранжирования?)
Это не будет работать, так как это не в интересах Яндекса. Яндекс зарабатывает на Директе, а что делал бы Директ без "тематических площадок", а что делали бы "тематические площадки" без копипэста?

Как всегда, в примерах, которые приводятся в блоге, все красиво. В реальности же все гораздо-гораздо хуже. Чтобы убедиться в этом, попробуйте искать не многословные "цитаты" с вашего сайта без указания авторства, а короткие фразы, которое, по идее, должны быть только на вашем сайте (ну, или даже длинные, но с одним-двумя измененнымы словами). Я поэкспериментировал, нашел сайт, продающий через биржи статейные ссылки, с моей же статьей, где проставлена ссылка на мой же источник, ранжируется выше, чем этот источник. И сколько таких багов еще впереди? Так что непонятно, чем тут радуются народ.

Но это все - "во-первых". А во-вторых: какая реальная польза от того, что Яндекс научился чуть лучше бороться со 100%-м копипэстом и парсингом? Меня бы это порадовало года три-четыре назад, но с тех пор копипэстеры научились слегка рерайтить тексты в промышленных масштабах, и вот тут Яндекс никакого авторства как не мог определять, так и не может.

Наконец, в-третьих. Допустим, копипэстерский сайт будет ранжироваться ниже, чем источник, по длинным точным цитатам. Но кому из пользователей придет в голову запрашивать у поисковика такие цитаты? Запрашивают 1...5-словники, и вот по ним-то никакого преимущества у более или менее нечетких копий, насколько я сейчас могу судить, нет. Факторов ранжирования, как мы знаем, тысячи, авторство - всего лишь один из них, очевидно не самый важный для Яндекса. И вот если сайт копипэстера-рерайтера в глазах Яндекса по этим факторам "лучше", то он легко поднимается выше сайта источника, зарабатывая трафик (для себя или для Директа). И это известно давно, и ничего не поменялось.

Единственное эффективное решение - содержать базу данных авторских оригиналов, но для Яндекса это неоправданные расходы. Более того - еще неизвестно, как отразилось бы соблюдение авторских прав на развитии того же Директа. Это же рерайтерам пришлось бы для очередной своей ГС- "тематической площадки" писать оригинальные тексты :)

"Больше текстов - хороших, но разных"... Перевожу: плагиаторы, не копируйте тупо чужие тексты один-в-один. Яндексу надоело выслушивать жалобы веб-мастеров, он не цензор, а зеркало Рунета с Директом. Меняйте немножечко - и будет вам щасте
Кривое зеркало, да.

Честно говоря, мне все равно, что этому зеркалу надоело выслушивать, пусть работу свою делает. Они ведь даче по точным цитатам опять правильно сделать не смогли. Так что переход ко второй части вашей речи даже не имеет смысла — там не удастся тем более. Я давно уже поводов для радости не вижу в том, что Яндекс делает.

В принципе, я мог бы написать «плюс один», просто не люблю этой глупой фразы.
Фунтикова Наталия Евгеневна
22 ноября 2010, 05:13
Яндекс это умный яндекс:-@куда вам до него
как отразилось бы соблюдение авторских прав на развитии того же Директа

Считаю, что никак не отразилось бы, как минимум не в худшую сторону. Опыт adsense в гугле показывает обратное. Целевые посетители не ходят по говносайтам. А вот кликерство на ГС прекратится - отсюда вырастет конкуренция у рекламодателей + повысится общее доверие юзеров к рекламе, следовательно будет и рост в количестве переходов.
Фунтикова Наталия Евгеневна
22 ноября 2010, 05:12
я одно слово вставлю оно весь текст изменит

Как то не пойму по запросу "календарь для путина" так и выводятся копипастеры:


1 lenta.ru›Новости›Альтернативный календарь
2 www.wikireality.ru/wiki/Календарь_для_Путина
3 www.gazeta.ru›Оппозиционный календарь


На сколько понимаю первоисточник ЖЖ? И в перепечатанных статьях стоят ссылки на оригинал.




 

жж — репостер)

В Викиреальности оригинальный текст

 

Было бы здорово если б это действительно работало, однако сегодня мой сайт(контент которого разворовали) уж очень сильно просел в выдаче, придется все переписывать уже в который раз.
Удачи вам в оттачивании алгоритма!!!
Осталось мне найти письмо годичной давности. Я переписывался месяц почему сайт не попадает в индекс (не плхоой в общем то сайт) - не добился. Но через еще два месяца полную копию яндекс выложил - снова таки не добился правда. Хотя по банальной дате времени публикации на сайте дублере и фактом что домен у них был куплен позже, в исходных кодах можно было найти и другие показатели... сайт прекрасно жил долгое время (сейчас не проверяю).

Аналогичная ситуация у одного моего сайта. Устал уже писать.

gaudeamus-omskcity
2 ноября 2010, 19:00
Бред какой-то... А если автор перевыложил, убрал ошибки и тому подобное? Вообще-то говоря, копировать целые статьи целыми страницами - это маразм.
очень часто встречается копипаст целых страниц, и даже сайтов... например, роман, повесть... статья на политическую или новостную тему, которую не хочестя потерять из-за удаления первоисточника... вариантов в этой жизни много...
gaudeamus-omskcity
2 ноября 2010, 19:18
Если что-то нужно конкретно для себя - на диск и всё. А зачем ещё раз помещать-то? Ну, здесь в Ярушке всякое возможно, но для обычных сайтов-то...
статьи с научных сайтов, как правило, не для себя. (как пример). Они цитируются и обсуждаются.
gaudeamus-omskcity
3 ноября 2010, 06:05
Цитаты и копипаст - разные вещи. Обсуждать со ссылкой на предмет обсуждения на своём уже "обсуждалочном" функционале - вот общепринятая сейчас норма. Так позволяют эффективно сделать сегодняшние многие инструменты. Да и скорость, а также надёжность хостингов не та, что десять лет назад. Когда обратно всё так и было - с копипастом.
Не "конкретно для себя", а для своей целевой аудитории. Чтобы они могли этот полезный для них материал прочесть и прямо сейчас (просто по ссылке куда-то на другой сайт, как показывает практика, никто ходить попросту не станет, а вот прочесть на своем любимом сайте, где делается выборка именно тех материалов, что интересна этой группе - прочтут с удовольствием), так и через несколько месяцев, когда этот материал с "оригинального" сайта уже исчезнет.
а если кавычки убрать? :-(
собственно, вопрос риторический...
достаточно известен способ борьбы с копипастом своего контента.
Очень хорошая новость. Спасибо!
А то никакого покоя нет от плагиатчиков.
А вот примеры когда не научились. И я скажу больше, из 10 попыток найти как оригинал наши материалы, яндекс показал нас как оригинал лишь в 3 случаях.

Яндекс нашел типа оригинал на самом деле там не оригинал
Смотрим все результаты вместе с исключенными
При этом сам оригинал яндекс не показал вообще. Хотя он в индексе. Это при том, что в обоих случаях в показанных яндексом материалах есть ссылки на оригинал, а сам текст лишь цитата из интервью. Ну и ещё несколько страниц разных сайтов, где дублировали интервью просто нет в индексе я Яндекса.

Нет, вы молодцы, улучшили, но ещё работать и работать, сделали бы форму для подачи заявки на оригинальность.
да много таких примеров... еще работать и работать
отлично!
А правильно ли, что все дубли убираются под rd?
Понятно, что от полных дублей, где кроме копипасты ничего нет, можно влёгкую избавиться, не потеряв в качестве, но часто к скопированному контенту добавляются какие-то дополнительные мысли или комментарии читателей.

Вот, например, по вашей ссылке скрывается в дубликатах документ, где текст оригинала дополнен комментариями - ведь такое, в принципе, может быть полезно. Из-за rd многие пользователи не доберутся до таких страниц.
А на источнике вашем открывается 404. Или это вы так элегантно и источник показали и новым дизайном сохранёнки похвастались? ;-)
Поправили.
Спасибо Вам!
Если дополнительный контент будет полезен пользователю, то пользователь его увидит.
Подскажите, куда следует обращаться, чтобы из индекса Яндекса был удален спарсенный по состоянию на какое-то определенное число клон моего сайта?

Вор не изменил ни дизайн, ни анкоры внешних и внутренних ссылок в текстах, только сменил ЧПУ и перебил все внешние ссылки на внутренние.

Алгоритм распознавания оригиналов имеет вопиющие глюки.

8-летний сайт, посвященный Ржевской битве, rshew-42.narod.ru, на котором все работы были размещены впервыес благословения авторов (историков, ветеранов и исследователей) ,был признан "неглавным зеркалом" сайта-клона rshew-42.ru - трех месяцев от роду.

Сайт-оригинал был удален из Яндекс-каталога, сайт-клон размещен в каталоге аж в двух разделах. При этом клон бомбит письмами сайты, имеющие ссылку на оригинал, с просьбой "обновить ссылку в связи с переездом на новый домен".

Бурная переписка с модераторами Яндекса показала полное бессилие человека перед аццкой машиной, хотя удалить клон из каталога Яндекса удалось.

Модераторы советуют разместить на оригинальном сайте больше материала - который тут же стырят плагиаторы.

Ну и как нам раззеркалиться - будете алгоритмы дорабатывать, или таки новые статьи выкладывать?



ВАУ!!!



Не прошло и полгода, с января по 22 июня - и Яндекс разобрался, "кто
есть ху". Дубль с ворованным контентом выкинули из индекса (главная страница, правда,
осталась), а мой восьмилетний сайт восстановлен!!!



Яндекс рулит!

Спасибо, отличное нововведение.


Главное, чтобы корректно определяло авторство, особенно, в случае публикации копий на более раскрученных и весомых ресурсах.

а это точно будет работать так как задумали ? или как обычно ? (помнится "срочную переиндексацию" пытались сделать ... )
Отличный подход, лицом к народу. Хочется надеяться, что рерайченные тексты тоже будут посчитаны за украденные. И то же по фотографиям.

Очень хорошая новость. Надеюсь, теперь не будете советовать авторам заниматься поисковым спамом.

Здорово!
Ура! Наконец-то! Счастье-счастье! :-D
> если ваш оригинальный текст ранжируется хуже копии, сообщите, пожалуйста,
> нашей службе поддержки

отписался

если бы он еще индексировал бы этот контент быстрее, вот тогда былы бы польза, а так написал статью разместил ее на сайте, и жди допустим 2 недели пока ее робот увидит, кто нить зашел статью взял и теперь яндекс считает оригинал не вашу статью а кто у вас ее спиз...л.

А на счет авторского права на статьи у меня для ЯНДЕКСА есть предложение сделать какой нить банк статей куда люди добавляют тексты и так сказать заверяют ее что она его, а не чья другая и спокойно размещают у себя на сайте, зная что у человека есть полные права на нее и что на других сайтах появиться она точно уже не может или может но с согласием автора или с обратной ссылкой на первоисточник

С основного должен сразу подхватывать, там пинговалка ботовая.
Ну и в банк статей выстроится очередь из копипастеров. А потом сам будешь бегать и говорить что у тебя украли статью и добавили в банк без твоего ведома.
Ага, щаз - Яндекс забьет на свои доходы от Директа на тематических площадках, перестанет "отвечать на вопросы" и начнет блюсти авторское право :) Вот ударит моча в голову - и начнет.

Чайники, ламеры, юные "веб-мастера". Я завидую вашей невинности и вере в будущее. Но все же не облольщайтесь. Яндекс - коммерческая организация в форме "ООО", которой положить с высокой башни на все ваши авторские копирайты. Бабло побеждает зло :)
Что за шарфик вы тут развесили? Такая победа Яндекса над рерайтом достойна как минимум георгиевской
Вот за это вам огромное человеческое спасибо!!!!

Наконец-то эти воры, которые делают рерайт или просто копируют текст будут не в топе, а там где положено.

Все очень долго ждали, когда вы уже удалите эту нечесть с выдачи!

СПАСИБО![:]|||||||||[:][:]|||||||||[:]
Позор ворам контента! Кто оскорбит Яндекс, будет побит палками, а кто похлопает Яндексу в ладоши, будет повешен!
Яндекс борется с ворами контента - насколько успешно... посмотрим!
тут есть минус. Очень часто сайты оригиналы бывают не доступны или совсем закрылись. А копипастеры, тут им надо казать спасибо все скопировали :) Зашел и читаешь :) Это качается технической документации... 

Яндекс ты клевый!

А вот и пример некорректного определения источника


Первый сайт - как бы «рерайт». Тупо замена нескольких слов на фразы про знакомства (почему-то).


Второй сайт - полный копипаст на Юкозе. Там даже мои ссылки сохранились.


И только третьим в списке идет мой сайт.


Плюс дальше в выдаче очень неплохо чувствуют себя рерайто-копипастеры.


И это только с главной текст!


То-то я думаю в последний апдейт сайт упал по запросам. А это вон в чем дело! Он теперь «не источник» :-)

А вот так нас двое, но я последний. :-)

Тут вообще нет моего сайта!


Охренеть! Все растащили!


И как дальше жить!? Я боюсь проверять остальные страницы!!!


Что делать-то? Если серьезно.

А как объясняется, что в вашем примере с исключениями единственным находится www.expert.ru, а без исключений тот же www.expert.ru на 4-ом месте? Что Яндекс считает оригиналом в приведенном примере?
Оригиналом Яндекс считает, конечно, www.expert.ru. Перемещение оригинала в примере без исключений объясняется тем, что пользователь желает увидеть все дубли, а не только автора. Только автор показывается с включенным фильтром.
Т.е., я так понимаю, что мои примеры и вопросы выше так и останутся без вашего внимания?
Ну вот у меня на MediaRevolution.ru все тексты авторские. Однако Яндекс продолжает показывать дубли на Состав.ру и показывает их в выдаче выше. Пример: http://yandex.ru/yandsearch?text=Huggies+%D0%B8+American+Express+%D1%81%D0%BF%D0%BE%D0%BD%D1%81%D0%B8%D1%80%D1%83%D1%8E%D1%82+%D1%81%D0%BE%D1%86%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5+%D1%81%D0%B5%D1%82%D0%B8+&lr=213
tsaplin-kupaysinov
2 ноября 2010, 23:56
Предлагаю смоделировать часто встречающуюся ситуацию:


Имеем сайт с уникальным контентом, но по каким-то причинам робот его обходит реже, чем второй (не наш сайт), на который наглым образом копируется наша уникальная информация.


Имеем:наш сайт изначально с уником, но реже индексируемый попадает в хвост, а чаще индексируемый сайт воришек - за счёт нас в топе?


т.е. ключевой вопрос теперь - это скорость индексации сайта?
Время захода робота не является главным критерием при определении авторства.

Есть пара сайтов, которые скопировали текст с морды к себе с небольшой коррекцией типа смены названия компании на свою. Так они попрежнему в основной выдаче по уникальным фразам, а не в дополнительной.

Хорошие новости(+1)
А поточнее можно узнать как это все-таки организуется? Предположим выложил я статейку в разделе сайта, через месяц ее растащили и повесили на главную ГС. Как вы определите кто автор? Только по времени индексации? Ведь также возможна ситуация, что главную ГС проиндексируют быстрее моего подраздела.

не очень ваш новый механизм работает(((


оригиналы:


http://www.re4i.com.ua/zazhimy-dlya-deneg/1287-zazhim-dlya-deneg-deadly-creatures


http://www.re4i.com.ua/lepnoj-kitajskij-farfor/1719-tchashka-s-blyudtsem-i-lozhetchkoj-zheltyj-mak


кусок описания товара в поиске дает ссылку ТОЛЬКО на копию

Спасибо Вам!
Не понятно как работают Ваши алгоритмы если мой сто% авторский сайт за несколько месяцев ни одной страници в индекс не попало.http://www.ost-alco.ru/
Сомневаюсь, что это будет работать.[:]||||[:]
Спирит, чего сомневаться, возьмите и проверьте. Не работает  ;)
Все это хорошо, а вот как быть с агенскими магазинами, у меня их более 20 и доход приносят, вылетят и все...... Как быть в данной ситуации...?
Кстати, было бы логично определять тИЦ не только по гиперссылкам, а по цитируемости твоих текстов в том числе.

Ваше мнение?
Например "календарь для путина" введите первоисточник блог, а выдаются разные ленты.ру и подобные новостники!
Милые мои, я вас люблю просто. Не сказать, чтобы я ждал этого лет пять (я ждал, а Платон получал мои письма), но крайне рад, если работать функция будет гораздо лучше, чем, к примеру, исключение порнухи из результатов поиска.

а вопрос такой я вот как делаю.. качаю с торрнета или с ютуба клипы и фильмы по интересующей теме и выдёргивают от туда фотки и размещаю на сайте?


 


ЯВЛЯЮТСЯ ЛИ ЭТИ ФОТКИ ОРИГИНАЛЬНЫМИ?

В этом посте мы говорим об улучшении определении авторства текстов.

понятно.. а как к картинкам относитесь... они вообще катят или на них забить надо.....


 


ПОЧЕМУ У ВАС НЕ РАБОТАЕТ ПОИСК ПО АНИМАЦИИИ ?


 


кому нужно лабудень читать, все смотрят видео и картинки а тексты они для тупарылых задротов или для ДАУНОВ


вот Жирик про это хорошо сказал http://www.youtube.com/watch?v=DmYewI8rNeg&feature=grec_index

Спасибо, что информируете нас об этом.
Некоторые результаты. На нашем сайте есть раздел FAQ, который рерайтится уже 8 лет. Рерайт делает один и тот же человек, он же директор фирмы, ясно, что индивидуальный стиль сохраняется все 8 лет, рерайт делается периодически, тогда когда критическая масса по копискейпу превышает уровень терпения ))

Поиск 2 цитат из последней версии растащенной страницы с нашего сайта показал, что
- ранжирование действительно стало точнее (сайт-оригинал идет в выдаче первым)
- копии с точными, до запятых, цитатами не скрываются от пользователя, а идут вслед за оригиналом, занимая 2 и 3 место.
- в выдачу попадают предыдущие версиии нашего текста, в том виде как они были полгода-год-два-три назад, в выдаче они идут так же вслед за нами.

При этом копипастеры (они же конкуренты в реальной жизни), идущие в выдаче на 2 и 3 позициях, просто подменили наименование бренда, и лишь немного модифицировали текст, откинув несколько сложноподчиненных предложений, поменяв порядок слов в нескольких словосочетаниях. А по каким-то фразам оригинального контента сниппеты 2 и 3 позиций вообще показывают точнейшее цитирование.

В выдаче указано, что найдено 312 ответов.
Для сравнения: поиск в гугле дал всего 34 ссылки в выдаче, точное вхождение только одно, да и то копия страницы конкурента, размещенной на narod.ru, которую служба поддержки Народа недавно "загасила" по нашему обращению.

Честные вебмастеры по-прежнему расстраиваются..

С пожеланиями дальнейших успехов.

Искрненне Ваши, Злостные борцы за права текстов )

Свежо предание, да верится с трудом. Посмотрим, что выйдет из заявлений.
Сделайте, что ли, удобную форму, куда жаловаться, что воры выше оригинала вылезают.

А что, через неудобную форму неприятно жаловаться? ;-)


Пишите Платону, как и раньше. )


Да лан вам) Это маленький шаг в сторону поддержки оригинального контента, но уже большой удар по вседозволенности копипастеров. (о как завернул). В общем ждем вторую серию. Первая как то не особо зацепила. Но жанр интересный)

Некоторым, а то и многим, вебмастерам было бы полезно видеть уведомления о скопированном с их сайта контенте в вебмастерской панели.
Спасибо. С вашей помощью нашел наглеца, который стащил полностью у меня сайт :-)

Было бы интересно посмотреть на решение задачи, когда один и тот же текст, например, новость от РИА Новости, находится на многих сайтах СМИ. По после самого материала часто идут комментарии, которые иногда информативнее и лучше, чем сама новость.


Как ранжируются эти документы? Учитывается только основной текст (новость) или комментарии выступают составной частью страницы, и поэтому страница считается уникальной?

здорово, давно была необходимость
отлично.
улучшили выделение стилей, как я понимаю.

скоро любой мой текст станет уникальным и его невозможно будет стырить. хо-хо!
В большинстве случаев наш поисковик правильно определяет автора документа

А что, бывает что и неправильно?
Бывают же случаи, что не успела твоя статья проиндексироваться, как её уже кто-то своровал, а у вора например она быстрее проиндексировалась и позвольте тогда спросить, как яндекс определит кто вор, а кто настоящий автор? А из-за таких уродов и до фильтра недалеко.
Плохо работают ваши алогоритмы.

Например, возьмем  книгу "Всестороннее руководство по технике выполнения упражнений с отягощениями".

Первый ее перевел Hugin и выложил на сайте http://www.ironmine.narod.ru/books/insider/entry.htm

В выдаче по запросу "всестороннее руководство по технике выполнения упражнений с отягощениями" сайта нет даже в пределах 50-ти.

Та же цитуация и с другими переводами.
Чушь полная, как и обычно. Привожу пример: Яша мой сайт ошибочно промял АГСом, несмотря на авторские статьи и т.д.. Как он, интересно знать, будет определять авторство моих новых статей, если он их даже не хочет индексировать?
Здравствуйте! А как быть с умниками, которые в наглую воруют целиком материалы и публикуют их "задним числом" (временем). И Яндекс.новости оригинал ставит ниже сайта-вора по причине именно якобы более раннего времени публикации? Сегодня ночью был именно такой случай с моим материалом. Написал в службу поддержки Яндекс.новости, жду ответа. Что скажете вы? Что делать в таких случаях и как вы будете наказывать таких беспредельщиков?
не нужно выдавать желаемое за действительное.
вы не можете не только статью или страницу определить как первоисточник, а целые копии сайтов.
месяц-два  назад писал вам, что сайта моего даже в дополнительных нету, "спасибо" теперь он там появился, только это не решает проблему первоисточника.
новостным сайтам грядет конец? Они то нормальноодин и тот же контент выкладывают и у яндекса хватает места на серверах для этой чернюги не чем не отличающейся друг от друга,- это просто новость, которая на всех сайтах! Смешно просто, чтотворит Яндекс. Скоро "нормальные" веб-мастера перестанут с Яндексом работать (не знаю почему до сих пор продолжают работать) из-за вечных непонятков, еще пару глюков и прощай скажут. Яндекс , из-за недостачи места, хочет, чтобы был только уникальный контент, фильтруя старый и т.д. аналогию не сложно привести, когда на компе не хватает места и мы начинаем старье не нужное удалять...вот так и тут будет! Успехов в работе, ребята...))))))))))))))))))))))))))))))))))))))))))))))

Просто сайтов появляетсявсе больше и больше, а места все меньше и меньше...)))
По вашему нужно дать дорогу копипастеру? 
Сами-то поняли, что написали про нехватку места - СМЕШНО! 

сам то понял, поэтому и написал....


 


"По вашему нужно дать дорогу копипастеру?"


 


Я такого не говорил, я говорилпро то, что когда выходит новость, на новостных сайтах онапоявляется даже без рерайта...вот и подумайте о чем я... Просто даже если контент уграден, он может быть дополнен своими наблюдениями и т.д.


 


"Сами-то поняли, что написали про нехватку места - СМЕШНО! "


 


Вы не верите , что у Яндекс не хватает места? тогда давайвместе посмеемся....)))

Лично я заметил только исправленное ранжирование статей. Яндекс не убирал их из индекса, но что бы они появились в выдаче требуется нажать на кнопочку "ещё".
Да в общем-то это и правильно... Зачем пользователю 10 одинаоквых результатов в выдаче.

Если статья была дополнена своими наблюдениями, то она становится не копипастом, а уникальной статьей ((:
К моему сожалению кажется алгоритм сбоит:
http://yandex.ru/yandsearch?text=%D0%91%D0%BE%D0%BB%D0%BB%D0%B8%D0%B2%D1%83%D0%B4%D0%B0+%D0%B1%D1%83%D0%B4%D1%83%D1%82+%D1%81%D0%BD%D0%B8%D0%BC%D0%B0%D1%82%D1%8C+%D1%84%D0%B8%D0%BB%D1%8C%D0%BC%D1%8B+%D0%B2+%D0%93%D1%80%D1%83%D0%B7%D0%B8%D0%B8&clid=130340&lr=213
http://yandex.ru/yandsearch?text=%D0%9C%D1%8B+%D1%80%D0%B5%D1%88%D0%B8%D0%BB%D0%B8+%D0%BF%D0%BE%D0%BC%D0%BE%D1%87%D1%8C+%D0%BD%D0%B0%D1%88%D0%B8%D0%BC+%D0%BD%D0%B5%D0%BE%D0%BD%D0%B0%D1%86%D0%B8%D1%81%D1%82%D0%B0%D0%BC.+%D0%9D%D0%B0%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%2C&clid=37243&lr=213
http://yandex.ru/yandsearch?text=%D0%BD%D0%B0%D0%B1%D0%BB%D1%8E%D0%B4%D0%B0%D0%B5%D1%82%D1%81%D1%8F+%D0%B2+%D1%81%D0%B2%D1%8F%D0%B7%D0%B8+%D1%81+%D1%81%D0%BE%D0%BA%D1%80%D0%B0%D1%89%D0%B5%D0%BD%D0%B8%D0%B5%D0%BC+%D0%B2+%D0%A0%D0%BE%D1%81%D1%81%D0%B8%D0%B8+%D0%BC%D0%BE%D1%89%D0%BD%D0%BE%D1%81%D1%82%D0%B5%D0%B9+%D0%BF%D1%80%D1%8F%D0%B4%D0%B8%D0%BB%D1%8C%D0%BD%D0%BE%D0%B3%D0%BE+%D0%BF%D1%80%D0%BE%D0%B8%D0%B7%D0%B2%D0%BE%D0%B4%D1%81%D1%82%D0%B2%D0%B0&clid=37243&lr=213
http://yandex.ru/yandsearch?text=%D0%BF%D1%80%D0%B5%D0%B4%D1%81%D0%B5%D0%B4%D0%B0%D1%82%D0%B5%D0%BB%D0%B5%D0%BC+%D0%B4%D0%B2%D0%B8%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F+%22%D0%96%D0%B5%D0%BB%D1%82%D0%BE%D0%BA%D1%81%D0%B0%D0%BD+86%22+%D0%93%D1%83%D0%BB%D1%8C%D0%B1%D0%B0%D1%85%D1%80%D0%B0%D0%BC+%D0%96%D0%A3%D0%9D%D0%98%D0%A1&clid=37243&lr=213

Во всех случаях отсутствуют оригинальный тексты REGNUM, хотя в материалах на первых позициях есть на него ссылки.
Я могу таких примеров сотни и сотни привести, если нужно
Господа..... Я тут сделал сайт о рецептах русской кухни, и что я обнаружил, мой сайт постепенно начал выпадать из индекса!!! Ну бог с теми страницами, которые я взял из некоторых сайтов..... Но что мы видим дальше???? Я стал добавлять рецепты из старой поварской книги, которой уже лет 200, как вдруг через один сервис обнаруживаю что эти рецепты уже существуют на нескольких сайтах...Я так понимаю что при обходе робот их тоже забанит.... Так что же мне делать????  Я ведь сидел днями и ночами, книгу поварскую расшифровывал...... Если можно напишите мне на почту...
Господа сеошнички и веб-мстера.
Яндекс - коммерческаяя организация, обладающая монополиейи как до сих пор не понятно, что ему на нас ПОХ... Это мы зависим от него, а не он от нас. Для пресекания лучшего ранжиования копипаста и УГ-рерайта есть другие действенные способы и не надо надеятся на то, что кто-то станет решать ваши проблемы. Почему бы не начать наконец работать?
Да, много у Я. косяков, но надо искать, исследовать. Очень помогает.
Будет ли это работать, вот например фотки, даже урлы прописаны и их воруют а Яндекс видит и ни чего не делает. Вот пример http://images.yandex.ru/yandsearch?ed=1&rpt=simage&text=%D1%83%D1%82%D0%B8%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F%20%D0%B0%D0%BA%D0%BA%D1%83%D0%BC%D1%83%D0%BB%D1%8F%D1%82%D0%BE%D1%80%D0%BE%D0%B2&img_url=energolider.com.ua%2Fuploaded%2FAkkymykatoryIbp.jpg&spsite=www.avtogar.ru&p=24
:) ну вы тогда замучаетесь делать базу. Да еще нужно будет учитывать, что некоторые статьи общедоступные и присвоения авторства там не возможны, хотя бы потому, что это давние учебники. А право на авторство уже давно закончено. И вебмастера, который просит признать авторство за ним, придется наказать за лжеавторство.
К сожалению, после включения данного алгоритма потеряли половину трафика с Яндекса (около 10к визитов в день), при детальном рассмотрении оказалось что два сайта, что подворовывают у нас на досуге тексты ранжируются теперь вместо нас на нашем же уникальном контенте, вот такие пироги.
Вот если автоматически начнется установка прямой ссылки поисковым запросом на страницу автора со страницы того, кто украл текст,-вот будет здорово, тогда пускай воруют....У меня был недавно такой случай со стаьей сетевые магазины и некоторыми другими.
Очень хочется в это верется, но на деле ничего не меняется. Перечитайте пожалуйста нашу переписку "[Ticket#201009249022533] Скопировали сайт".

Рип сайта, который появился пару месяцев назад по некоторым запросам занимает первые позиции, в то время, как мой проект, информация на котором появилась более полутора лет назад частично пропал из поисковой выдачи.
Каким образом автора вычисляют? Или кто успел тот и съел?)))))
а как будут обстоять дела  с авторством, если я:
1) переношу свой сайт на новый домен
2) меняю структуру сайта, перенося его на новую CMS и испотльзуя выборочно свои старые тексты?
1) Нужно, чтобы на ваш новый домен ссылались как на автора, в том числе и ваш старый домен тоже.
2) Ничего не произойдет.
Извените если не в тему, но мне хочеться узнать, а как правильно поступить в таком случае, чтоб никому не было обидно? Я сделал одному знакомому сайт-визитку. Но как сайт визитка он выглядет не очень. Хотелось бы чтобы кроме фоток были и материалы какие-нибудь. Но воровать в наглую то же не хочеться. И как быть? Я в этом деле новичок, и еще во многих вещах не разбираюсь. Подсткажите. Конкретно, сайт связан с проведением свадеб, и есть мысль разместить материал о самых необычных свадьбах. Заранее благодарен всем
Вы перефразировали Маяковского, что по российским законам означает пределку произведения и его публикацию общедоступным способом. Привет от РАО :)
Глотов Василий
15 ноября 2010, 14:46
написал в службу поддержки, посмотрим что скажут.
Ответят следующее:

>Обратите внимание, поисковая система Яндекс является лишь зеркалом интернета,
поэтому мы не правомочны разбираться в вопросах плагиата. Чтобы защитить свои
авторские права, Вам надо, видимо, обратиться к хозяевам указанного сайта и к
провайдеру, на сервере которого он находится. Если сайт прекратит свое
существование, он будет удален из поисковой базы Яндекса автоматически.
---

Вот так вот и живем (((
Фунтикова Наталия Евгеневна
17 ноября 2010, 00:50
ты не когда не узнаешь сколько человек писали одновременно эти слова за один так или тик времени (-1)
Фунтикова Наталия Евгеневна
17 ноября 2010, 03:25
такт
Это в том случае если "паучок" съест его до того как он (уникальный текст) попадёт в третьи руки.
Совершенно не работает то, что вы написали.
По поисковому запросу"Пора быть честными и поменять аббривиатуру: РФБР  - Российская Федеративно Бюрократическая Республика ." поиск выдал запись на дайри, а оригинал записи на я.ру определил как копию, хотя это дайри экспортирует записи с я.ру, причём даже устанавливает ссылку на оригинал.
А взяв  первое предложение из этой темы: http://aurina.ya.ru/replies.xml?item_no=15930 "Сегодня покончил с собой стеклянный заварочный чайник.", я вообще получила ворох чего попало, а не ссылку на текст.. Просмотрев десяток страниц поиска, я так и не нашла своего текста. Как-то странно выглядит результат, в котором поиск нашел только по одному результату из полного предложения.
По поисковому запросу http://yandex.ru/yandsearch?text=%D0%BA%D1%83%D0%BA%D1%83%D1%88%D0%BA%D0%B0+%D1%81%D0%BA%D0%BE%D0%BB%D1%8C%D0%BA%D0%BE+%D0%BC%D0%BD%D0%B5+%D0%9A%D0%A3&lr=10716
первой стоит "поделиться ссылкой", то есть кто-то поделился ссылкой на оригинал и попал выше авторского текста?

Неужели ни один "копипастер" не решился здесь отметиться?


А у меня задачка. Похожий пример здесь приводили, но не могу удержаться.


Допустим, сайт А публикует кусок "Идиота" Достоевского, который раньше никто не догадался в сети выложить. Через время сайт Б публикует тот же кусок, честно ручками перепечатывая с бумаги. Кто "автор"? Понятно, сайт А - кто первый встал, тому и тапки (хотя мы-то знаем, что настоящий автор - Достоевский). Усложним задачу. Допустим, сайт А имеет тематику "авто-мото", а сайт Б посвящен как раз Достоевскому или  в крайнем случае литературе. Вот здесь-то и начинаются недоразумения. Гугль, по-моему, в такой ситуации предпочтет сайт Б, а Яндекс, опять же по-моему, последнее время все больше применяет алгоритм "в большой семье хл...балом не щелкают".

спасибо. а как вам такая идея, чтобы в Яндекс.Вебмастер была возможность видеть ссылки с копипастом текста? чтобы знать кто крадет тексты. ведь не станем же мы каждую свою запись проверять на предмет её незаконного копирования. ну это так, просто идея
Спасибо команде Яндекса.
В моем случае все сработало - плагиатчики в попе.
Заметил недавно изменения, и это было очень приятно... =)
Решил проверить некоторые статьи со своего сайта, никаким улучшением и не пахнет.
для примера:
статья http://wseweb.ru/diz/43oshibki-web-dizayna.htm
"первоисточник" - http://ermakov-g.livejournal.com/1386.html(блог на бесплатном блогосервисе)

статья http://wseweb.ru/diz/obzor2.htm
"первоисточник" - ironscorpio.my1.ru/publ/4-1-0-69(сайт на бесплатном хостинге)

статья http://wseweb.ru/diz/kak-sozdat-sait-v-bloknote.htm
"первоисточник" - www.srubil.ru/forum/topic571.html(топик на форуме)

статья http://wseweb.ru/diz/obzor3.htm
"первоисточник" - earneasy.ucoz.ru/publ/1-1-0-5(ещё один сайт на укозе)

И т. д. Видимо, чтобы быть в выдаче Яндекса, нужно клепать сайты на укозе и наполнять копипастом.

гугл все первоисточники определяет правильно.

"Улучшатели" алгоритмов Яндекса, убейте себя!
Доставляет ссылка, данная в самом письме. Точнее, первый результат по ней :) И даже без отключения фильтрации.

Правильно ли я понимаю, что если алгоритм стал работать лучше, то впервые этот текст был опубликован не, скажем, здесь, а на SEO Форум MaulTalk?
Увы, на практике  если сталкиваются небольшой сайт с авторским текстом и портал ворованного с десятков таких сайтов контента, второй выигрывает :(
Добрый день! А куда можно обращаться при проблемах определения авторства? На моём сайте размещена статья, которую скопировали несколько сайтов, часть их поставили ссылки на оригинал статьи, часть нет. В результате они все отображаются в индексе, а страница с моей оригинальной статьей пропала из индекса!

У меня сегодня созданный журнал dzhuletta889.livejournal.com/ скопировал почти весь контент и не только у меня и всё за один день. Куда пожаловаться не знаю. У яндекса такой формы нет для отправки жалобы.

Скопировал конечно автоматически, потому что все ссылки сохранены, хотя и noindex.

Алгоритм распознавания оригиналов имеет вопиющие глюки.

8-летний
сайт, посвященный Ржевской битве, rshew-42.narod.ru, на котором все
работы были размещены впервыес благословения авторов (историков,
ветеранов и исследователей) ,был признан "неглавным зеркалом"
сайта-клона rshew-42.ru - трех месяцев от роду.

Сайт-оригинал был
удален из Яндекс-каталога, сайт-клон размещен в каталоге аж в двух
разделах. При этом клон бомбит письмами сайты, имеющие ссылку на
оригинал, с просьбой "обновить ссылку в связи с переездом на новый
домен".

Бурная переписка с модераторами Яндекса показала полное
бессилие человека перед аццкой машиной, хотя удалить клон из каталога
Яндекса удалось.

Модераторы советуют разместить на оригинальном сайте больше материала - который тут же стырят плагиаторы.

Ну и как нам раззеркалиться - будете алгоритмы дорабатывать, или таки новые статьи выкладывать?

тест webmaster3
Сергей Куприянов
14 июля 2011, 18:36

Улучшение определения авторства Яндексом - это важно и справедливо!

 

Надеюсь, что это поможет.

:-)

Вопрос - на сайте нашей компании и на сайте компании наших партнёров имеется раздел Блог.
Мы бы хотели с добровольного согласия обеих сторон обмениваться статьями. Таким образом они будут так называемой "копипастой". 
Наше желание обосновано тем, что у каждого сайта есть своя аудитория, своя сфера потенциальных посетителей и мы бы хотели, чтобы информация была доступна и там и там и её было легко найти.
Есть ли возможность оформить статью таким образом, чтобы обе копии появлялись в поиске?