Клуб Яндекс.Поиска для сайта

Несколько общих вопросов по Яндекс.Поиску для сайта

Здравствуйте. При поддержке Циклопедии — универсальной энциклопедии — и Викиреальности — свободной энциклопедии Интернета — я готовлю некоммерческий образовательный проект, неотъемлемой частью которого должен быть кастомизированный поиск по энциклопедическим источникам. Сейчас раздумываю, переходить ли от пользовательского поиска Google к Яндекс.Поиску для сайта. В частности, Вы предоставляете возможность загрузить в поисковую тему 100000 адресов, — конкуренты всего 5000, и это вместе с исключениями, — также Яндекс всегда выгодно отличала качественная поддержка, тогда как у Google отвратительный, если не сказать отсутствующий, фидбэк по интересующему продукту. Тем не менее, изучив выложенные на Вашем сайте материалы и протестировав поиск, у меня появились вопросы:


По поисковой теме:

1) Согласно https://site.yandex.ru/themes/ "Поисковая тема позволяет включить в область поиска до 100 000 сайтов одной тематики." Могу ли я включить в ОДНУ, а не несколько поисковых тем сайты по науке, культуре, спорту и т. д., объединённые между собой не тематикой, а энциклопедическим изложением материала?

2) Могу ли я добавлять в поисковую тему не только сайты и их разделы, но и исключения? По адресам https://site.yandex.ru/themes/new/ , https://yandex.ru/support/site/themes/create.xml , и на других страницах Яндекса ответа отыскать не удалось.


По области поиска:

Хотелось, конечно, чтобы Вы внедрили так, как здесь: https://support.google.com/customsearch/answer/71826?hl=ru&ref_topic=2601037

3) Множество сайтов имеет неудобные URL. Допустим, мне необходимо включить в свой поиск рецензии с kinobank.org . На "Форрест Гамп" они располагаются по адресу http://kinobank.org/movie/1281/reviews/ , на "Зелёную милю" — http://kinobank.org/movie/14/reviews/ . Включать kinobank.org/movie не хочу, поскольку в выдаче будет присутствовать куча поискового мусора. Мне нужны именно reviews, как если бы запрос поступил с документным оператором inurl: : https://yandex.ru/support/search/query-language/search-operators.xml . Добавит пользователь, к примеру, kinobank.org/*reviews , и выдача с kinobank.org будет выглядеть следующим образом: https://yandex.ru/search/?text=%D0%97%D0%B5%D0%BB%D1%91%D0%BD%D0%B0%D1%8F%20%D0%BC%D0%B8%D0%BB%D1%8F%20site%3Akinobank.org%20inurl%3Areviews&lr=1104 .
Вопрос: собираетесь ли Вы реализовывать эту функцию для включаемых и исключаемых сайтов?

4) Внёс в область поиска academic.ru , сохранил. Но добавился URL не academic.ru , а dic.academic.ru , — http://f2.s.qip.ru/s6WVNou7.jpg — по-видимому, основное зеркало этого сайта. В результате поисковая выдача лишилась ships.academic.ru , demography.academic.ru и прочих многочисленных поддоменов academic.ru .
Вопрос: нельзя ли пользователю самому решать, что добавлять в область поиска, а не Яндекс совершал это за него автоматически?


Имеется ещё ряд второстепенных вопросов в зависимости от того, как Вы ответите. Уверен, что это случится, поэтому заранее спасибо. В надежде на дальнейшее сотрудничество,

С уважением,
Саша Черных

6 комментариев
Елена Першина
2 февраля 2016, 20:03
Добрый день!
Простите, пожалуйста, за задержку с ответом. Вот ответы по вашим вопросам:
1) Да, можете.
2) Не в поисковую тему, а в сами настройки раздела «Область поиска» – да, можете. В саму поисковую тему данная настройка не вынесена.
3) Да, мы как раз думаем над доработкой языка поисковых запросов и, как следствие, исключений. Но не уверена, что это произойдет в ближайшее время.
4) Это, видимо, бага, продублируйте её, пожалуйста, в нашу поддержку. Будем исправлять: https://yandex.ru/support/site/troubleshooting/feedback.xml
Про саму систему – мы сейчас хотим лучше развести два поиска – Поиск для сайта (https://site.yandex.ru/) и Яндекс.XML (https://xml.yandex.ru/settings/). Поиск для сайта мы планируем все больше затачивать под поиск по конкретному подтвержденному сайту со структурированными данными (разметка, XML), а Яндекс.XML, наоборот, предлагать использовать для неподтвержденных сайтов и поисковых тем. Поисковые темы тоже работают. Посмотрите, если вы не можете подтвердить права на сайты, по которым собираетесь искать, возможно, данная технология для вас будет более актуальной.
Саша Черных
3 февраля 2016, 15:36
Елена Першина,
большое спасибо за ответы 1, 3, 4. Разрешите уточнить по 2.

Правильно ли понял, что Исключения можно добавлять только при ограничении в 200 сайтов, которые можно указывать вручную, а в поисковых темах, когда необходимо добавлять больше 200, придётся вообще обходиться без них? Если да, то собираетесь ли Вы вводить Исключения и для поисковых тем?

В нашей нынешней поисковой системе в 2 с лишним раза больше Исключений, чем самих сайтов. Везде удаляются новости — example.com/*news , форумы — example.com/*forum , а для сайтов, содержащих множество словарей, вроде gufo.me , убираются лингвистические и переводческие, как gufo.me/content_enrudic и gufo.me/content_esru . Без Исключений поисковые темы буквально кишат информационным шумом, в чём можно убедиться, введя запросы на поиск по научным и научно-популярным сайтам http://elementy.ru/runet , реализованный на Яндекс.Поиске для сайта, так что их введение пришлось бы очень кстати. У конкурентов (там поисковые темы загружаются файлами в формате .XML) оно реализовано.

Вопрос 4 продублировал в службу поддержки. Спасибо.
Елена Першина
5 февраля 2016, 20:45
Вы можете использовать поисковую тему вместе с исключениями (просто исключения задаются через раздел "Область поиска"). Исключения сейчас улучшаем, да. Но как быстро введем эти исправления, сказать, к сожалению, не могу.
Саша Черных
6 февраля 2016, 07:20
Елена Першина,
какое максимальное количество исключений можно сейчас задать?

Благодарю за ответы. Желаю Вам, чтобы быстрее нагнали конкурентов в плане языка поисковых запросов, не растеряв то, в чём их превосходите. Спасибо.
Елена Першина
12 февраля 2016, 21:39
Мы сейчас сокращаем количество адресов в области поиска и исключениях. Раньше на все было около 200 адресов. Теперь около 100.
Саша Черных
14 февраля 2016, 09:46
Елена Першина,
ужас... А если необходимо добавить тысячи исключений, как поступать?

Спасибо.