Математическое мышление - это не то же самое, что заниматься математикой - по крайней мере, не так, как математика обычно преподается в нашей школьной системе. Школьная математика обычно фокусируется на процедурах обучения для решения стереотипных задач. Профессиональные математики думают определенным образом для решения реальных проблем, проблем, которые могут возникнуть из повседневного мира, или из науки, или изнутри самой математики. Ключ к успеху в математике - научиться мыслить нестандартно.
1. Когда вы ищете в Google математические требования для науки о данных, постоянно возникают три темы: вычисления, линейная алгебра и статистика. Хорошая новость заключается в том, что для большинства должностей в области науки о данных единственный вид математики, с которым вам нужно хорошо ознакомиться, - это статистика.
Для многих людей, получивших негативный опыт математики в средней школе или колледже, мысль о том, что им придется заново изучать математические вычисления, является реальным препятствием на пути к тому, чтобы стать специалистом по анализу данных.На практике, хотя многие элементы науки о данных зависят от вычислений, Вам может не понадобиться (пере) изучать столько, сколько вы могли бы ожидать. Для большинства специалистов по данным действительно важно понимать принципы вычислений и то, как эти принципы могут повлиять на ваши модели. Если Вы понимаете, что производная функции, например, возвращает скорость ее изменения, тогда будет иметь смысл, что скорость изменения стремится к нулю по мере выравнивания графика функции. Это, в свою очередь, позволит Вам понять, как работает градиентный спуск, путем нахождения локальных минимумов функции. И это также прояснит, что традиционный градиентный спуск хорошо работает только для функций с одним минимумом. Если у вас есть несколько минимумов (или седловых точек), градиентный спуск может найти локальные минимумы без нахождения глобальных минимумов, если Вы не начнете с нескольких точек. Теперь, если вы давно не изучали математику в старшей школе, последние несколько предложений могут показаться немного скучными. Но хорошая новость в том, что Вы можете изучить все эти принципы менее чем за час. И это намного проще, чем способность алгебраически решить дифференциальное уравнение, которое (как практикующему специалисту по данным) Вам, вероятно, никогда не придется делать - для этого есть компьютеры и численные приближения!
2. Линейная алгебра
Если вы занимаетесь наукой о данных, Ваш компьютер будет использовать линейную алгебру для эффективного выполнения многих необходимых вычислений. Если вы выполните анализ главных компонентов, чтобы уменьшить размерность ваших данных, Вы будете использовать линейную алгебру. Если Вы работаете с нейронными сетями, представление и обработка сети также будет выполняться с использованием линейной алгебры. На самом деле, трудно представить множество моделей, которые не были бы реализованы с использованием скрытой линейной алгебры для вычислений.
3. Теор.Вероятностей и мат. статистика
Плохая новость в том, что Вам действительно придется изучить эту область. А если у вас нет серьезного опыта в области теории вероятностей и статистики, обучение, достаточное для того, чтобы стать практикующим специалистом по обработке данных, потребует значительного количества времени. Хорошая новость заключается в том, что в этой области нет единой концепции, которая была бы супер-сложной - Вам просто нужно потратить время на то, чтобы действительно усвоить основы, а затем отталкиваться от них.