Объясняем на карточках

15 апреля 2016, 10:30

На многие вопросы Яндекс умеет давать так называемые объектные ответы. Попробуйте спросить, например, что такое антаблемент или когда жил Ричард Львиное Сердце, и вы увидите справа от результатов поиска карточку с нужной информацией. Часто она содержит не только текст, но и другие данные об объекте вашего интереса. Если вы спрашивали про художника, вам покажут его картины, а если про музыканта — предложат послушать треки.

Объектный ответ

Необходимость получить быструю справку возникает на каждом шагу. Кто-то, читая новость об очередном открытии астрономов, захочет уточнить, что такое красное смещение. А кто-то, наткнувшись на интересную статью о новгородских берестяных грамотах, решит узнать, что такое Неревский конец. Но каждый раз отрываться от чтения и искать ответ в поисковике не очень удобно. Для таких случаев мы выпустили браузерное расширение Яндекс.Карточка.

Яндекс.Карточка позволяет справиться о том или ином объекте — человеке, предмете, событии или явлении, — не покидая веб-страницу, на которой вы находитесь. Она подчеркнёт в тексте слова и словосочетания, значение которых, возможно, потребуется уточнить, и покажет на всплывающих карточках подсказки. Кроме того, расширение предложит поискать заинтересовавшее вас слово в интернете или на сайте, где оно вам встретилось.

Подсказки Яндекс.Карточки на сайте N+1

Как работает Яндекс.Карточка

Подсказки на карточках — это данные из базы объектных ответов Яндекса. Она содержит десятки миллионов записей и постоянно пополняется (подробнее о том, как она устроена, можно почитать здесь). Но какой полной ни была бы база, одних только определений недостаточно — нужно ещё решить, какие именно понятия в тексте нуждаются в подсказках, и подобрать для них такие описания, которые им больше всего подходят.

Одна из сложностей — в том, что в русском языке много омонимов, то есть слов, одинаковых по написанию, но разных по значению. Скажем, [кратко] может быть наречием, которому подсказка ни к чему, или фамилией скульптора — про него имеет смысл рассказать подробней. В таких случаях Карточка выдвигает несколько гипотез. Например, встретив слово [ЦСКА], она предположит, что это футбольный клуб, хоккейный клуб, баскетбольный клуб и так далее.

Выбрать наиболее подходящую гипотезу помогает метод машинного обучения Матрикснет. При этом учитывается несколько сотен факторов — в том числе контекст, характеристики объекта и его связи с другими объектами из текста. Например, если в тексте финансовой тематики встречается слово [открытие], оно может быть названием банка, а если рядом с [о нём] упоминается режиссёр Вячеслав Криштофович, это, вероятно, название фильма.

Подчёркивать в текстах все слова, которые есть в базе объектных ответов Яндекса, бессмысленно — читателю это будет только мешать. Чтобы подобрать подсказки, уместные в конкретном случае, Карточка использует так называемую «формулу важности».

Сначала Карточка оценивает, как часто то или иное понятие встречается в текстах в целом. Общеупотребительные понятия — например, «простуда» или «витамины», — отсекаются. Затем она проверяет, связаны ли оставшиеся слова с основной темой текста. Если в тексте про футбол единожды встретится фамилия политика, Карточка, скорее всего, не станет давать подсказку — но зато уточнит подробности про футболистов и тренеров.

Подсказка с картой на сайте Студии Артемия Лебедева

***

Яндекс.Карточка работает в браузерах на основе Chromium — это Яндекс.Браузер, Google Chrome, Opera и другие. Первая версия расширения вышла в декабре 2015 года. Недавно мы обновили Яндекс.Карточку — теперь она лучше учитывает контекст, а также распознаёт не только объекты, но и адреса. Нажав на адрес, вы увидите фрагмент карты с меткой. У расширения есть своя JS-библиотека: с её помощью разработчики могут добавить технологию на свой сайт. В этом случае карточки с подсказками смогут видеть даже те пользователи, которые не установили расширение.

42 комментария
Подписаться на комментарии к посту
Firefox не поддерживаете только потому, что он не на Chromium?
kuma,
проект молодой. Начали с поддержки браузеров на базе Chromium.
Тимур,
Будем надеется на порт или http://kangoextensions.com/
firstlena.pershina
15 апреля 2016, 17:23
Да, Яндекс.Карточка еще не на всех браузерах есть, но мы постараемся сделать расширения для всех основных браузеров. А вот скрипт, установленный на сайте, работает во всех браузерах.
firstlena.pershina,
если что, вопрос был с иронией :)
К тому, что дополнение, видимо, не выйдет для Firefox до тех пор, пока этот браузер тоже не перейдёт на Chromium
kuma,
те же Элементы Яндекса для Firefox поддерживаются.
Интересно, что в объектовых ответах даётся ссылка на Википедию, если определение показано из неё (и это правильно), а в Карточке такой ссылки нет
ajvol,
Согласен. Неприятно. Часто сталкиваюсь с этим препятствием при поиске через сервисы одной американской компании. Приятно было узнать что Янжекс в объектных ответах ссылку все же дает. Но не в этот раз (
firstlena.pershina
15 апреля 2016, 17:25
Спасибо за обратную связь. Мы посмотрим, как тут можно сделать удобнее.
И ещё минутка филологии. Я понимаю, что язык живой, он эволюционирует, в разговорной речи встречаются оба варианта, но, всё же, как-то непривычно видеть "искать на Яндексе" вместо "искать в Яндексе"
firstlena.pershina
15 апреля 2016, 17:26
Спасибо, услышала. Еще раз проконсультируемся по этому вопросу с нашими филологами.
ajvol,
спасибо, что заметили! Скоро исправим.
Крутотень! Обалденно! Нереально! Осталось сделать версию для FF.
firstlena.pershina
15 апреля 2016, 17:26
Постараемся с ней не затягивать!
>>> Подчёркивать в текстах все слова, которые есть в базе объектных ответов Яндекса, бессмысленно — читателю это будет только мешать.

Было бы круто иметь возможность настройки.
firstlena.pershina
15 апреля 2016, 17:29
Слова подчеркиваются по умной технологии, мы очень тут старались как раз не мешать. И, судя по нашим метрикам, нам это удалось. Если есть примеры, где разметка мешает, её слишком много, напишите нам об этом, пожалуйста, будем исправлять.
firstlena.pershina,
А печему бы не добавить возможность показа арточки по запросу? Выделил слова нажал хоткей или выбрал пункт в дропменю и полил карточку. Не всегда те слова, что выбрал алгоритм будут теми словами, что нужны юзеру.
sntxerror,
это еще и вопрос расширения базы объектных ответов. Не для каждого слова есть карточка. А для некоторых объектов значений так много, что непонятно какую карточку показывать - поэтому мы и используем "формулу важности", но тогда и решать, какую карточку показывать приходится нам. Но тема интересная, думаем над ней.
firstlena.pershina
15 апреля 2016, 18:35
Когда слово не подсвечено, то большинство людей, к сожалению, даже не подумают, что его можно как-то выделить и получить по нему справку. Тем более, в большинстве случаев справку хотят получать в один клик. А вот над точностью "угадыванья" как раз очень серьезно работаем.
ilya-miroshnichenko
15 апреля 2016, 21:10
слишком мало слов подчеркивается.

встройте в карточку ту же википедию, словари и прочее - чтобы они вкладками были и чтобы человек мог не покидая страницы, в "облаке" карточки просмотреть информацию о нескольких источниках. curyo (вроде так называлось) так работало/ а то проще настроить контекстное меню, выделить слово и в один клик найти в нужном источнике
"попробуйте в работе" и нифига не работает.. хрень..
Егор Виноградов
16 апреля 2016, 01:43
Классная вещь, на мой взгляд. Особенно порадовало обновление. Повысилась точность и слов стало подчёркиваться больше. Единственное пожелание - подчёркивать чаще аббревиатуры, особенно если в тексте они встречается впервые. Сейчас часто приходится искать старыми методами.
Валентина
16 апреля 2016, 14:07
А зачем было заголовок у "Медузы" заимствовать?
Полковник Фридрих Краус фон Циллергут был редкостный болван. Рассказывая о самых обыденных вещах, он всегда спрашивал, все ли его хорошо поняли, хотя дело шло о примитивнейших понятиях, например: "Вот это, господа, окно. Да вы знаете, что такое окно?" Или: "Дорога, по обеим сторонам которой тянутся канавы, называется шоссе. Да-с, господа. Знаете ли вы, что такое канава? Канава — это выкопанное значительным числом рабочих углубление. Да-с. Копают канавы при помощи кирок. Известно ли вам, что такое кирка?"

Он страдал манией все объяснять и делал это с воодушевлением, с каким изобретатель рассказывает о своем изобретении.

"Книга, господа, это множество нарезанных в четвертку листов бумаги разного формата, напечатанных и собранных вместе, переплетенных и склеенных клейстером. Да-с. Знаете ли вы, господа, что такое клейстер? Клейстер — это клей".

Полковник был так непроходимо глуп, что офицеры, завидев его издали, сворачивали в сторону, чтобы не выслушивать от него такой истины, что улица состоит из мостовой и тротуара и что тротуар представляет собой приподнятую над мостовой панель вдоль фасада дома. А фасад дома — это та часть, которая видна с мостовой или с тротуара. Заднюю же часть дома с тротуара видеть нельзя, в чем мы легко можем убедиться, сойдя на мостовую.
Да... Припоминаю, как несколько лет назад аналогичный сервис отправил меня на сайт, где можно было купить топор, когда я читал новость о зарубленной топором тётке.
У меня на Яндексе стоит замок . В чём причина ?
Поставил на свой сайт по моему не работает можете  проверить  тут.
валентина
25 апреля 2016, 14:03
Круто,только знакомлюсь с Я-новым, но уже влюбляюсь, настоящие Россияне.Так держать!
 А говорят недоумки что младеж некудышняя, ох....Деды б вами гордились, кабы знали цену ваших изысканий.
Поставил код на эту страницу для теста 
,но ничего не отображается я так понимаю нужно заходить на сайт только через браузер Яндекс или Chrome ?
cool.yande2016
28 мая 2016, 11:59
у меня не получается: пишет, что файлы отсутствуют на сервере
Полезно. Мучас грасиас!
serg.alexandr2014
20 июля 2016, 21:23
Большое Спасибо за Яндекс.Карточки!
Так держать Яндекс!:)
как оградить часть текста от анализа скриптом?
По тому что бывает что яндекс.карточки путают малоизвестного человека с его известным однофамильцем и вставляют ссылку там где это вообще не надо!
вставляли отчество между именем и фамилией тогда скрипт оставляют подчеркнутой только фамилию и сохраняет ссылку.
Света Чистякова
24 августа 2016, 16:33
Здравствуйте. Да, однофамильцев Карточка иногда путает. Для таких случаев в правом нижнем углу окна карточки есть кнопка «Пожаловаться». Когда вы жалуетесь на неправильную подсказку, Карточка получает сигнал, который помогает улучшить работу алгоритма.
Света Чистякова
24 августа 2016, 19:14
И ещё: уточните, пожалуйста, вы использовали у себя на сайте разметку Карточки? Она позволяет видеть подсказки даже тем, у кого не установлено расширение. О том, как настроить разметку, можно почитать тут: https://tech.yandex.ru/yobject/doc/index-docpage/.
Куда делись ответы через кнопку-треугольник? Это было гораздо-гораздо удобнее чем достаточно тупая Карточка (не в смысле плохая информация,хотя и это тоже , а в смысле плохого выбора слов к-рые Карточка подчёркивает) С треугольником же ты сам выделял непонятное тебе, что здорово экономило время... 
Света Чистякова
27 октября 2016, 16:10
Здравствуйте. Уточняющий вопрос: речь идёт о подсказках-ответах в Яндекс.Браузере, да?
Света Чистякова,
 Раньше эта функция называлась "быстрые ответы" активировалась после выделения текста и нажатия на появившуюся кнопку с треугольником выводила краткую справку, картинку иногда и видео о ВСЁМ что было выделено (а не только том что распознала Яндекс карточка)
Света Чистякова
29 октября 2016, 02:28
А попробуйте открыть страницу browser://flags и поищите в длинном списке пункт «Новое контекстное меню Браузера» — есть у вас такое? Если есть, выберите там в выпадающем меню пункт «Полное контекстное меню с богатыми ответами». И перезагрузите браузер. Сработало?
Света Чистякова,
 Спасибо, сработало.. Вы мне очень помогли..