Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Каковы общие алгоритмы контролируемого обучения?

ПрограммированиеМашинное обучение+2
  · 712
Openstack DevOps and IBM/Informix Certified DBA . Phd in Math (Duality of spaces of...  · 2 февр 2022
Обучение с учителем использует обучающий набор для обучения модификациям желаемого результата. Этот обучающий набор моделей данных включает в себя входные данные и данные выходного дня, которые позволяют обучаться с течением времени. Алгоритм измеряет свою точность с помощью функции потери, подстраиваясь до тех пор, пока ошибка не будет достаточно минимизирована. При интеллектуальном анализе данных можно разделить на два типа задач — классификацию и регрессию:
Классификация использует алгоритм для точного распределения тестов по совокупности категорий. Он распознает выявленные объекты в наборе данных и пытается сделать некоторые выводы о том, как эти объекты должны быть помечены или важны. Распространенными алгоритмами возбуждения являются линейные классификаторы, машины опорных векторов (SVM), деревья решений, k-ближайший сосед и случайный лес, более подробно нижеследующие.
=========================
Регрессия используется для связи между зависимыми и свободными переменными. Она обычно используется для прогнозирования, например, доходов от продаж для данного бизнеса. Линейная регрессия, логистическая регрессия и полиномиальная регрессия являются предметом изучения алгоритмами регрессии.
=======================
Машина опорных векторов (SVM)
Машина опорных векторов — это популярная модель обучения с учителем, разработанная Владимиром Вапником и используемая как для классификации данных, так и для регрессии. Тем не менее, SVM обычно используется для задач классификации, построения гиперплоскости, где расстояние между двумя классами точек данных максимально. Эта гиперплоскость известна как граница решения, разделяющая классы точек данных (например, апельсины и яблоки) по обе стороны плоскости.
========================
K-ближайший сосед
K-ближайший сосед, также известный как алгоритм KNN, представляет собой непараметрический алгоритм, который классифицирует точки данных на основе их близости и связи с другими доступными данными. Этот алгоритм предполагает, что похожие точки данных могут быть найдены рядом друг с другом. В результате он пытается вычислить расстояние между точками данных, обычно с помощью евклидова расстояния, а затем присваивает категорию на основе наиболее часто встречающейся категории или среднего значения. Его простота использования и малое время расчета делают его предпочтительным алгоритмом для специалистов по данным, но по мере роста набора тестовых данных время обработки увеличивается, что делает его менее привлекательным для задач классификации. KNN обычно используется для механизмов рекомендаций и распознавания изображений.
=========================
Случайный лес
Случайный лес — еще один гибкий алгоритм машинного обучения с учителем, используемый как для целей классификации,
так и для регрессии. «Лес» ссылается на набор некоррелированных деревьев решений, которые затем объединяются вместе, чтобы уменьшить дисперсию и создать более точные прогнозы данных.
Примеры кода на Пайтон и его выполнения
Правильный код по ссылкам. Редактор кода на Кью дает искажения.