Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Какие формы ошибок выборки (selection bias) можно встретить в данных?

Ирина Беккер
Data Science
  · 1,8 K
младший научный сотрудник ФТИ им. Иоффе  · 18 сент 2021  ·
astropolytech
Большинство открытых экзопланет относятся к классу горячие Юпитеры. Следует ли из этого, что действительно большинство экзопланет такие? - нет, просто их проще всего обнаружить
астрофизическое образованиеПерейти на vk.com/astropolytech
Старший разработчик компании Google. Основная специальность - машинное обучение, глубокое...  · 17 сент 2021
Классификацию таких ошибок я не встречал, но приведу примеры, которые видел: 1. Компания Google пару лет назад решила внедрить автоматическую классификацию фотографий пользователей в облаке. В результате часть фотографий темнокожих людей были промаркированы "Горилла" [1]. Причина скорее всего в смещенной выборке фотографий при обучении классификатора. Результат -... Читать далее
преподавание математики, высшей математики, data science, автор бестселлера "Математика...  · 28 сент 2021
С уважением к другим ответам позвольте добавить свои 5 копеек. (1) Конечно, самая неприятная - не репрезентативность выборки. То есть 1000 штук из всей 100 000 - неправильно представляет свойства всей совокупности. Допустим, собрали по Москве 1000 бомжей. Они совсем не представляют москвичей en masse ( в массе). (2) Попроще, но тоже - ошибка размера выборки. (3) А вот... Читать далее