Блог о технологиях Яндекса

Яндекс выложил в открытый доступ новую библиотеку машинного обучения

18 июля, 12:38

Яндекс разработал новый метод машинного обучения CatBoost. Он позволяет эффективно обучать модели на разнородных данных — таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost выложена в открытый доступ, её могут использовать все желающие.

CatBoost — наследник метода машинного обучения Матрикcнет, который применяется почти во всех сервисах Яндекса. Но если Матрикснет обучает модели на числовых данных, то CatBoost учитывает и нечисловые, например виды облаков или типы зданий. Его можно применять в самых разных областях — от банковской сферы до промышленности. Это первый российский метод машинного обучения, который стал доступен в open sourсe.

Новый метод сейчас тестируется на сервисах Яндекса. Так, в Дзене его задействовали для ранжирования ленты рекомендаций, а в Погоде — для расчёта прогноза с помощью технологии Метеум. Во всех случаях он показал себя лучше Матрикснета. В дальнейшем планируется расширение использования этого метода.

Команда технологий Яндекса

1 комментарий
Подписаться на комментарии к посту
ilya@internet-expert.ru
2 августа, 15:04
Круто, спасибо больше :) Думаю если такой гигант не перестанет делиться наработками и опытом с русскоговорящими любителями больших данных, то нас станет только больше!
Обновлено 2 августа, 15:04