Насколько я понял, в результатах поиска повторяются результаты с www и без www? Если это так, то скорее всего мы скоро это поправим. Если нет - приведите примеры, чтобы было понятнее, о чем речь (желательно со ссылками).
Хм.. документ был проиндексирован именно с таким адресом. Значит, как-то робот такую ссылку обнаружил. Значит, такая ссылка где-то есть. Я попрбую найти источник этого, но советую вам тоже поискать.
Вообще вы можете сделать редирект с таких вот адресов на правильные адреса (только обязательно ставьте статус HTTP 301). Тогда робот будет индексировать документы с правильным адресом.
А еще можете логировать referer для таких документов и таким образом найти источник проблемы.
По большому счету тут http://help.yandex.ru/webmaster/?id=996567#996571 все написано про директивы robots.txt. В сервисе Яндекс.Вебмастер есть валидатор файла robots.txt. Если у вас будут затруднения с этим, вы можете связаться со службой поддержки сервиса Яндекс.Вебмастер.