Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Что такое «ящик с усами», почему так называется и как это применяется?

ПрограммированиеМашинное обучение+3
  · 16,1 K
Преподаватель Data-Science в Яндекс.Практикум, ML-Engineer в СПАО «Ингосстрах»  · 26 мая 2022
Поясню об этом инструменте в контексте машинного обучения и анализа данных. Ящик с усами — способ визуализации распределения в выборке. Часто он применяется для поиска объектов-выбросов в данных. Можно заметить, что такая визуализация напоминает квадратный ящик с двумя усами, направленными в разную сторону от ящика, поэтому иногда его так называют. А вообще у него есть более строгое название — «диаграмма размаха».
По смыслу, половина значений рассматриваемого признака в выборке должна находиться как бы внутри «ящика» (с первого по третий квартили). «Усы» же визуализируют границы значений для объектов, не относящихся к выбросам — вторая половина значений рассматриваемого признака в выборке должна располагаться внутри усов. Длина усов, чаще всего, устанавливается равной полутора интерквартильным размахам (полтора размера того самого «ящика»). Вообще это некоторая эмпирика и в разных источниках могут встречаться немного отличающиеся варианты для длины «усов».
Стоит помнить, что не всегда те объекты, которые попадают за пределы усов, следует исключать из выборки, возможно это реальные выдающиеся значения. Тут важно аккуратно интерпретировать наблюдения в контексте задачи. Иногда именно такие объекты и представляют для бизнеса наибольший интерес, избавляться от них не стоит.
1 эксперт согласен
Начальник информационного отдела НЧОУ ВО "Северный институт предпринимательства"  · 25 мая 2022
Ящик с усами представляет собой  график, который используется в описательной статистике для компактного изображения одномерного распределения вероятностей. Читать далее