Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как стать специалистом в области Big Data \ Data Science самостоятельно? Что учить, с чего начинать?

ItDigital-профессии
Анонимный вопрос
  · 63,8 K
Data Scientist (Computer Vision)  · 6 июл 2019  ·
deep_nn

Известны примеры, как люди самостоятельно становились отличными дата саентистами ( https://www.kaggle.com/ppleskov ), так что особых проблем с самостоятельным обучением нет, а может быть это даже наилучший способ достичь успехов в этой области.

Довольно общий совет - явно стоит проявлять большой исследовательский интерес, и пытаться в каждой задаче извлечь из данных как можно больше полезной информации. Кажется, именно решение прикладных задач и разбор кернелов на каггл - один из самых полезных и быстрых путей стать специалистом. Но важно понимать, что реальные бизнес-задачи имеют некоторые отличия от задач на Каггл. Одно из главных - требуется не столько добиться точности модели, сколько снизить время и стоимость разработки.

Если совсем с нуля - нужно изучить курс Теории вероятностей и мат. статистики, основы языка Python, научиться работать с NumPy или подобными математическими пакетами, затем изучить основы классического машинного обучения, чтобы затем перейти к глубокому обучению. Для Big Data - стоит знать основы проектирования баз данных и выучить мощный язык, применяемый на бэкенде (например, Scala, хотя подойдет и Python) для использования Spark\или Hadoop, реализующих парадигму MapReduce для распараллеливания вычислений. На мой взгляд, такая последовательность действия довольно логичная. Но я сторонник обучения на проектах - если нужно доучить теорию, то есть смысл стараться сразу закреплять ее, хотя бы на учебных проектах поначалу. В качестве учебных проектов отлично подойдут как раз задачи на Kaggle.

Конечно, это не все, что нужно знать хорошему специалисту в Data Science, но в процессе сами поймете, чего еще именно Вам не хватает.

Сервис онлайн-образования  · 5 февр 2020  · practicum.yandex.ru
Начнём с понятий, потому что Big Data и Data Science ― это не одно и то же. Big Data [engineer] ― это инженерная профессия. Специалист по Big Data продумывает, как разработать хранилище данных, как собрать и где хранить данные, как сделать их доступными для внутренних и внешних пользователей. Чтобы работать в этом направлении, нужно знать основы баз данных, языки... Читать далее
Выбрать профессию в Яндекс Практикуме и попробовать себя в новой ролиПерейти на praktikum.yandex.ru
Сервис подбора онлайн-курсов по программированию, дизайну, маркетингу, аналитике и...  · 18 мая 2020  · kursfinder.ru
Отвечает
Елена Онопко
Чтобы стать Big Data специалистом, нужно знать математику, информатику и статистику хотя бы на базовом уровне. Вы должны не бояться работать с большим объемом информации – этот навык чаще приобретается с опытом. Нужно разбираться в новых технологиях, которые вы будете внедрять в свою работу, и в целом интересоваться всем понемногу, чтобы расширять кругозор, тренировать... Читать далее
Сравниваем 2000+ онлайн-курсов и рассказываем об этом в своём блоге :)  · 1 февр 2021  · checkroi.ru
Отвечает
Ivan Buyavets
Data Science — это процесс работы с данными: от их подготовки до очистки и анализа. Здесь нужно знать статистику, математику, машинное обучение, решение проблем и др., чтобы создавать и тестировать модели. Big Data — это различные способы анализа и систематического извлечения больших объёмов данных. Аналитика больших данных включает проверку, преобразование, очистку и... Читать далее
Посмотрите актуальные онлайн-курсы в digital 2023 года!Перейти на checkroi.ru
Можно БЕСПЛАТНО поучиться в Томском Государственном Университете по программе «Профессия data-аналитик» в... Читать дальше
Основатель ПутиХод.ру  · 27 апр 2020
Профессия предполагает хорошие знания в математике. Можно выделить три основных раздела, которые стоит изучить/подтянуть по ним знания: 1. Теория вероятности и математическая статистика 2. Математический анализ 3. Линейная алгебра Хорошую подборку учебников можно посмотреть тут. Специалисты data science "кодят" на Python. Книг по этому языку масса, однако имейте ввиду... Читать далее
Инженер данных — sashamikhailov.ru  · 27 дек 2019
Вот пример, как в 42 года можно самостоятельно освоить профессию дата саентиста: понадобится год свободного времени, 30 курсов на Coursera (список прилагается) и победа в соревнованиях по анализу данных на kaggle.com Если нет такой силы воли и мотивации, то можно пройти курсы. Есть офлайн варианты от ВШЭ и ШАД; и онлайн от Яндекс.Практикума. Упоминания о них постоянно... Читать далее

Спасибо за ваш пост. Не нашел список 30 курсов на Coursera... Не могли бы опубликовать его в ответе на мой комментарий?

Первый
Оглайн курсы по различным направлениям   · 4 нояб 2021
Big Data Analyst, или аналитик больших данных — это специалист, работает в области изучения больших массивов данных — структурированных и неструктурированных: банковские транзакции, телефонные номера в колл-центре, количество посещений клиента и сделанных им покупок и др. Аналитик больших данных ищет закономерности и связи между критериями в производственных процессах... Читать далее
2 эксперта согласныи1 эксперт не согласен
рекомендация - фактически реклама сайта с массой курсов на разные тематики
Первый

Обьеденяя данные с названием данных областей можно сделать привязку к определенному показателю в области понимания данных привязанных к определенному дню.

Радиофизик, меньше математик, радио, сетевой админ, программист. Родом из Нижнего...  · 28 июн 2019
В такой как Big Data вряд что можно сделать без образования. Как минимум, очные курсы с опытными преподавателями. Слишком велик объём того, что надо понять/поднять. Тут и графы, и тервер (теория вероятности), и способы обработки данных на массивах процессоров, и параллелизация вычисления (способы вести расчёты в параллель), и программирование. Основой является или... Читать далее