Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя
Машинное обучение, анализ данных  · 6 мая 2022

Автоматизация экспериментов с ClearML в два клика

ClearML — это фреймворк для разработки и производства ML/DL, содержащий четыре основных модуля:
  1. управление экспериментами (Experiment Manager )— параметры, задания, артефакты, метрики, отладочные данные, метаданные и логи;
  2. MLOps — решение для управления и оркестровки GPU/CPU ресурсов, автоматического масштабирования на облачных и локальных машинах для задач ML/DL (K8s / Cloud / bare-metal);
  3. управление данными (Data-Management) — готовое решение для управления данными и контроля версий поверх объектного хранилища (S3 / GS / Azure / NAS);
  4. сервис для развёртывания моделей (Model-Serving) - готовое облачное масштабируемое решение для развёртывания сервисов с использованием моделей:
  • деплой сервиса модели за 5 минут;
  • включает в себя оптимизированную поддержку обслуживания графических процессоров при поддержке Nvidia-Triton;
  • с готовым мониторингом моделей.
Платформой для этих компонентов является ClearML-server (см. подробнее Self-Hosting & Free tier Hosting). ClearML — это решение проблемы, которую испытывают исследователи и разработчики в области машинного обучения/глубокого обучения - развёртывание и мониторинг моделей в продукции. ClearML отслеживает и контролирует процесс, объединяя контроль версий кода, исследовательские проекты, мониторинг показателей производительности и версионирование моделей и данных.
ClearML разработан для простоты интеграции существующих методов и практик команд разработчиков машинного обучения/глубокого обучения и предназначен для ежедневного использования с целью повышения эффективности совместной работы в команде и наглядности.
Он позволяет создавать удаленные задания из любого эксперимента одним нажатием кнопки, создавать и автоматизировать процессы для журналирования экспериментов, выходных и входных данных, сохранять все данные в любом объектном хранилище с максимально простым интерфейсом, делает потоки данных прозрачными, каталогизируя их изменения на платформе ClearML. Это новаторский фреймворк, который устанавливает новые стандарты настоящей бесшовной интеграции между управлением экспериментами, MLOps и управлением данными. Можно и дальше перечислять достоинства и преимущества ClearML, подробно разобрать его структуру и организацию, но перейдём к практике, поскольку "практика - критерий истины".
«Теория без практики мертва и бесплодна, а практика без теории бесполезна и пагубна». Пафнутий Чебышев, русский математик и механик, XIX в.
  1. Зарегистрируйтесь бесплатно в ClearML Hosted Service , в качестве альтернативы можно настроить свой собственный сервер (см. здесь https://clear.ml/docs/latest/docs/deploying_clearml/clearml_server).
  2. Установите у себя пакет python clearml
 pip install clearml
  1. Подключите ClearML SDK к серверу, создав учетные данные (https://app.clear.ml/settings/workspace-configuration), затем выполните приведенную ниже команду и следуйте инструкциям:
clearml-init
  1. Добавьте в свой код две строки:
from clearml import Task
task = Task.init(project_name='examples', task_name='hello world')
Всё готово! Теперь все результаты выполнения кода автоматически регистрируется в ClearML.
Пример кода здесь. Результат выполнения можно посмотреть здесь (доступ к проекту открыт для всех зарегистрированных пользователей).
Полезные ссылки:
Репозиторий: https://github.com/allegroai/clearml
Документация: https://clear.ml/docs