Известны примеры, как люди самостоятельно становились отличными дата саентистами ( https://www.kaggle.com/ppleskov ), так что особых проблем с самостоятельным обучением нет, а может быть это даже наилучший способ достичь успехов в этой области.
Довольно общий совет - явно стоит проявлять большой исследовательский интерес, и пытаться в каждой задаче извлечь из данных как можно больше полезной информации. Кажется, именно решение прикладных задач и разбор кернелов на каггл - один из самых полезных и быстрых путей стать специалистом. Но важно понимать, что реальные бизнес-задачи имеют некоторые отличия от задач на Каггл. Одно из главных - требуется не столько добиться точности модели, сколько снизить время и стоимость разработки.
Если совсем с нуля - нужно изучить курс Теории вероятностей и мат. статистики, основы языка Python, научиться работать с NumPy или подобными математическими пакетами, затем изучить основы классического машинного обучения, чтобы затем перейти к глубокому обучению. Для Big Data - стоит знать основы проектирования баз данных и выучить мощный язык, применяемый на бэкенде (например, Scala, хотя подойдет и Python) для использования Spark\или Hadoop, реализующих парадигму MapReduce для распараллеливания вычислений. На мой взгляд, такая последовательность действия довольно логичная. Но я сторонник обучения на проектах - если нужно доучить теорию, то есть смысл стараться сразу закреплять ее, хотя бы на учебных проектах поначалу. В качестве учебных проектов отлично подойдут как раз задачи на Kaggle.
Конечно, это не все, что нужно знать хорошему специалисту в Data Science, но в процессе сами поймете, чего еще именно Вам не хватает.
Спасибо за ваш пост. Не нашел список 30 курсов на Coursera... Не могли бы опубликовать его в ответе на мой комментарий?
Обьеденяя данные с названием данных областей можно сделать привязку к определенному показателю в области понимания данных привязанных к определенному дню.