Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

С чего начать изучать Data Science новичку?

Data science
Мария Снегова
Data Science
  · 3,1 K
На Кью задали 3 похожих вопроса
Руководитель направления моделирования банка.   · 1 нояб 2021
Добрый день
Начните с того, что задайте себе вопрос, для чего вам это надо?
Если вас привлекают высокие зарплаты в первую очередь, а потом уже все остальное, то есть смысл найти себя в другом.
DS - это многогранная специализация, которая включает в себя понимание бизнес-процессов, работу с базами данных (хранение, обработка, обновление и удаление), статистические тесты, математический функционал и программирование. И еще одно главное умение - собрать все вышеописанное в один продукт.
Если же все-таки желание развиваться в DS есть, то рекомендую начать с продуктовой аналитики. Там вы приобретете базовые понятия анализа данных, знания доменных процессов. По ходу уже поймете как и где применять статтесты, соответственно, как и с каким ЯП их делать. Ну а дальше как снежный ком понесется и не остановить.
Ну а если вы поймете, что аналитика это не для вас, то вы не потратите много усилий, в отличие от ситуации , если вы начнете свой путь в DS с изучения python или R.
Ключевое во всей этой истории ответить самому себе на вопрос: зачем мне это надо?
Специалист в области управления и информатики в технических системах. Data Engeneer, IT...  · 6 окт 2021
С программирования на Python. Если не потяните математику, сможете быть программистом))) Да и навык программирования еще никому не повредил.
Программирование. Машинное обучение.  · 9 окт 2021
Если кратко, то сначала английский, далее https://www.kaggle.com/c/titanic Изучайте данные, их взаимосвязи. Python поможет. # get titanic & test csv files as a DataFrame titanic_df = pd.read_csv("../input/train.csv") test_df = pd.read_csv("../input/test.csv") # preview the data titanic_df.head() titanic_df.info() # drop unnecessary columns, these columns won't... Читать далее
1 эксперт не согласен
Это просто реклама! Спрашивают, что изучать, а не как.
преподавание математики, высшей математики, data science, автор бестселлера "Математика...  · 29 сент 2021
Вме5сто того, чтобы посоветовать вам абстрактное чтиво, могу порекомендовать свою книгу, = Математика для DATA SCIENTIST Анализ данных и математическое моделирование (путеводитель) - так вы хоть сможете чего-то спросить. Представлен курс математики для специализации DATA SCIENTIST, включающий в себя такие разделы как Алгебра, Математический анализ бесконечно малых... Читать далее
1 эксперт не согласен
Автор вопроса спрашивает о том, с чего начать изучение Data science, а не математики!
Ответы на похожие вопросы
С чего начать изучение Data Science? — 9 ответов, задан 
Аналитик/разработчик в Яндексе, преподаватель Data Science в Яндекс.Практикум  · 22 июл 2021  · datascience.xyz

Изучение Data Science стоит начать с построения фундамента, а в фундаменте чего только нет, математика, статистика, алгоритмы, языки программирования. Собрал список курсов которые помогут заложить качественный фундамент под изучение DS.

https://yandex.ru/q/article/n_078769a5/

С чего начать изучение Data Science? — 1 ответ, задан 
Специалист в области управления и информатики в технических системах. Data Engeneer, IT...  · 26 янв 2022
Начните с программирования на Python. Далее математика.
С чего начать изучение Data Science? — 9 ответов, задан 
преподаватель, аналитик данных  · 17 сент 2021  · youtube.com/channel/UCqj7Cz7revf5maW9g5pgNcg
Я бы начал с курса, где анализ данных разбирается на визуальном языке программирования - где код рисуют, а не пишут. На таких курсах порог вхождения минимальный - с первого урока.
Сделал бы такой курс посмотрел бы и решил как продолжать дальше, и стоит ли продолжать дальше.
Если речь о материале на русском языке.
То первые шаги могут быть такие
1) курс "Анализ данных просто" на степике - бесплатно
2) учебник "Анализ данных" от профессора Стивена Скиена есть на русском и английском.
С чего начать изучение Data Science? — 3 ответа, задан 
IT-Architect( + CTO, FullStack ), свои проекты, MVP, в USA, РФ, Мире. Amazon FBA...  · 17 февр 2022
Если вкратце, то в этом направлении(в моём случае больше в сторону ML и плюс у меня уже был опыт программирования ботов в NLP) я начинал примерно так:
  1. Линейная регрессия -https://ru.wikipedia.org/wiki/Линейная_регрессия
  2. Python(лучше последнюю актуальную версию(3+) и особенно детально библиотеки numpy, pandas, sklearn и др.), Jupyter и наборы данных для тренировки, поставить и научится делать notebooks
  3. Алгоритм перцептрона - https://ru.wikipedia.org/wiki/Перцептрон
  4. Деревья решений - https://ru.wikipedia.org/wiki/Дерево_решений
  5. Наивный Байес - https://ru.wikipedia.org/wiki/Наивный_байесовский_классификатор
  6. Метод опорных векторов - https://ru.wikipedia.org/wiki/Метод_опорных_векторов
  7. Ансамбль методов - https://ru.wikipedia.org/wiki/Ансамбль_методов_(обучение_машин)
С чего начать изучение Data Science? — 9 ответов, задан 
Основатель небольшой компании аналитического программного обеспечения  · 14 мар 2016

На сегодня основная проблема Data Science - недостаток людей, которые могут её грамотно применить с прибылью для компании.

Поэтому начинать лучше с эконометрики, статистики, экономики, правовых основ работы с данными, устраиваться на работу в компании, где данные широко используются (поисковые системы, мобильные операторы, страховые компании, банки), и практиковаться, практиковаться... проверяя всё что вам говорят на прецедентах из реальной жизни.

Например, если говорят, что нужна сертификация для работы с персональными данными, нужно поинтересоваться, сертифицируется ли на эту работу соседний ларёк и почему, есть ли по этому вопросу правоприменительная практика.

Постепенно Вы (как я в своё время) поймете, что модные Big Data и Data Science - это фетиш разработчиков и айтишников в новой обертке, а проработку экономики и постановку задачи нужно делать полностью самому (либо с людьми, хорошо разбирающимися в экономике и праве конкретных отраслей и имеющих в них обширную практику). Именно к этому и нужно готовиться.

С чего начать изучение Data Science? — 9 ответов, задан 
Образовательная платформа Хекслет  · 2 мар 2023  · ru.hexlet.io
Если вы хотите начать изучение Data Science, рекомендуется следовать следующим шагам:
  • Основы математики и статистики: Чтобы стать хорошим специалистом по Data Science, необходимо хорошо понимать математические и статистические понятия. Рекомендуется изучить основные понятия линейной алгебры, дифференциального и интегрального исчисления, теории вероятностей и математической статистики.
  • Изучение программирования: Важно овладеть как минимум одним языком программирования, используемым в Data Science. Рекомендуется изучить Python, который является наиболее распространенным языком, используемым в этой области.
  • Работа с инструментарием: Изучите инструменты и библиотеки, используемые в Data Science, такие, как: NumPy, Pandas, Scikit-learn, Matplotlib и другие. Чтобы принимать бизнес решения удобно представлять данные в виде диаграмм и детальных отчетов, с которыми как раз помогают перечисленные выше инструменты.
  • Знакомство с ML: узнать про модели, датасеты, создание машин, которые могут обучаться и  предсказывать или классифицировать значения по признакам. Для этого также обычно используют Python и разные библиотеки, например, SKlearn, NumPy и matplotlib
  • Работа с базами данных: Вам также пригодится знание SQL. Язык запросов используется при выборке и анализе данных. Не лишним будет разобраться в работе одной из популярных СУБД, например, PostgreSQL, чтобы понимать как можно оптимизировать тяжелые запросы.
  • Практика и проекты: Для лучшего понимания Data Science необходимо постоянно практиковаться и создавать свои проекты. Это поможет закрепить знания и получить опыт работы с реальными данными.
  • Обучение и сертификация: Можно также пройти онлайн-курсы, почитать учебники и другие ресурсы для изучения Data Science и получения сертификата, который может улучшить ваше резюме и увеличить шансы на получение работы в этой области.
Помогаем новичкам освоить профессию веб-разработчикаПерейти на ru.hexlet.io/webinars
С чего начать изучение Data Science? — 9 ответов, задан 
Программист. Python-разработчик, занимаюсь машинным обучением и большими данными.   · 22 сент 2021  · unitbushmakov.ru
Для начала нужно постигнуть азы математики( математическая статистика и теория вероятности) , аналитике и программирования. Так же можно походить на курсы и почитать книги для углубления знаний в этой области. Ну и далее только практика и работы с данными и dataset.
С чего начать изучение Data Science? — 3 ответа, задан 
ВШЭ, Экономика. Аналитик данных   · 11 апр 2022
Техническая база. 
Математический анализ, теория вероятностей, статистика, теория алгоритмов и графов. 
Возможно, эконометрика. Но тут зависит от курсов. Нам преподавали углубленную эконометрику, которая действительно используется и в работе. Те же регрессии, временные ряды и тп. 
4 эксперта согласны
С чего начать изучение Data Science? — 9 ответов, задан 
Сотрудник группы компаний ФИНАМ  · 17 мар 2016

Я бы посоветовал заглядывать на сайт R-bloggers.com Так можно составить представление о том, чем люди вообще занимаются - и не только в какой-нибудь компании, но и в академической среде, в здравоохранении, в госуправлении и т.п. Многие авторы анонсируют там свои книжки при помощи коротких заметок. Часто предлагается решение какой-нибудь задачи, и сразу публикуется код на R. Разумеется, ограничением является использование именно R, а не, скажем, python. Но R фантастически популярен, за последние годы издано более 400 книжек, посвящённых его применению в разных областях науки и практики. Причём практически всегда к задаче прилагаются и наборы данных, и готовый код, т.е. понять, о чём идёт речь, можно довольно быстро.

С чего начать изучение Data Science? — 9 ответов, задан 

Я писала где-то ответ по тому, как научиться работать с базами данных. Копирую еще сюда: 

Есть работа с базами данных, есть визуализация баз данных, есть получение информации из баз данных.

Следовательно, начинаем с изучения SQL, чтобы можно было поковыряться в самой базе. Мне больше всего понравился учебник из серии "для чайников".

Для того, чтобы то, что мы вытащили из базы данных, можно было оформить, изучаем визуализацию. Очень круто и просто все рассказывается в учебнике Robert Spence "Information Visualization".

Теперь можно идти к чему-то более крутому - это data mining. Для этого нужно прокачать знание теории вероятности, статистики и выбрать себе язык программирования, которым вы будете пользоваться при работе с базами данных. Очень важно (!) разобраться в machine learning. Учебников и пособий тут миллиард. Я бы не стала брать что-то серьезное, если у вас нет бэкграунда, а совмещала бы этот этап с предыдущими, чтобы можно было делать крутые штуки уже с самого начала - это очень вдохновляет.