Openstack DevOps and IBM/Informix Certified DBA . Phd in Math (Duality of spaces of... · 4 мая 2022
Что такое ансамблевые методы?
Ансамбль состоит из вещей, сгруппированных вместе, которые выполняют определенную задачу. Этот метод объединяет несколько алгоритмов вместе, чтобы получить лучшие прогностические результаты по сравнению с использованием одного алгоритма. Цель использования метода Ensemble заключается в том, что он уменьшает дисперсию, систематическую ошибку и улучшает прогнозы в разработанной модели. С технической точки зрения, это помогает избежать переобучения.
Модели, входящие в ансамбль, называются элементами ансамбля, которые могут быть одного типа или разных типов и могут быть обучены или не обучены на одних и тех же обучающих данных.Эти ансамблевые методы значительно увеличивают вычислительную стоимость и сложность модели. Это увеличение связано с опытом и временем, необходимыми для обучения и обслуживания нескольких моделей, а не одной модели.Ансамблевые модели предпочтительны по двум основным причинам; а именно производительность и надежность. Методы ансамбля в основном сосредоточены на повышении точности модели за счет уменьшения компонента дисперсии ошибки прогноза и добавления смещения к модели.
======================
Три основных класса методов ансамблевого обучения — это бэггинг, стекирование и бустинг, и важно иметь подробное представление о каждом методе и учитывать их в своем проекте прогнозного моделирования.
Бэггинг включает в себя подгонку множества деревьев решений к разным образцам одного и того же набора данных и усреднение прогнозов.
Стекирование включает в себя подгонку множества различных типов моделей к одним и тем же данным и использование другой модели, чтобы узнать, как лучше всего комбинировать прогнозы.
Boosting включает в себя последовательное добавление членов ансамбля, которые корректируют прогнозы, сделанные предыдущими моделями, и выводят средневзвешенное значение прогнозов.
Производительность помогает модели машинного обучения делать более точные прогнозы. Надежность уменьшает разброс или дисперсию предсказания и производительности модели.
Цель алгоритма машинного обучения с учителем — иметь «низкое смещение и низкую дисперсию».
Смещение и дисперсия обратно пропорциональны друг другу, то есть, если смещение низкое, то дисперсия высокая, в противном случае смещение высокое, то дисперсия низкая.
Используя ансамблевые методы, мы добиваемся лучших результатов прогнозирования, таких как меньшая ошибка регрессии или более высокая точность классификации.