Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Какие библиотеки Python обычно используются в машинном обучении?

ПрограммированиеData science+3
  · 1,9 K
Openstack DevOps and IBM/Informix Certified DBA . Phd in Math (Duality of spaces of...  · 22 сент 2021
Топ 10 библиотек Python для машинного обучения
1. TensorFlow
TensorFlow — это библиотека Python, созданная Google в конце 2015 года для внутреннего использования в решениях для машинного обучения. Затем он был открыт для всего сообщества и с тех пор стал одной из крупнейших библиотек Python в области открытого исходного кода. Сервис легко расширяемый и предлагает мощные функциональные возможности для тех, кто хочет начать машинное обучение.
TensorFlow также содержит важные инструменты и ресурсы сообщества для постоянного обеспечения того, чтобы пользователи получали наиболее оптимальный ответ. Даже Google использует TensorFlow для всех своих продуктов для машинного обучения, таких как Gmail, YouTube и Google Search. В экосистеме также имеется хранилище обычно используемых алгоритмов и моделей машинного обучения, которые можно использовать в режиме «подключи и работай».
TensorFlow занял полюсовую позицию, будучи наиболее используемой библиотекой Python для машинного обучения, поскольку она не только широко используется промышленными гигантами, но и активно поддерживается большим сообществом пользователей. Помимо обновления Google и создания следующих версий TensorFlow, библиотека также имеет специальное сообщество с более чем 75 000 коммитов на GitHub. По всему миру компании, специализирующиеся на машинном обучении, также используют TensorFlow для своих решений. Некоторые из названий Marquee включают Airbnb, Airbus, Dropbox, Snapchat и Uber. Google также предлагает специализированные услуги облачных вычислений для TensorFlow через Tensor Processing Unit, предоставляя компаниям еще одну причину для перехода на платформу. Основная задача: создание моделей глубокого обучения.
  1. Keras
3. NumPy
NumPy — это одна из первых библиотек, которая должна быть загружена для Python, независимо от того, будет ли пользователь использовать ее для машинного обучения или анализа основных данных. Эта библиотека машинного обучения Python предоставляет возможности для обработки данных и чисел. Библиотека создает объект N-мерного массива, в который пользователи могут помещать свои данные, и предлагает функции преобразования этих данных.
Объект массива также можно легко адаптировать к другим базам данных, что делает его естественным для машинного обучения. Помимо использования в научных и исследовательских приложениях, NumPy можно использовать для создания контейнера общих данных, которыми можно легко манипулировать. Библиотека поставляется с возможностями для решения задач, касающихся линейной алгебры, преобразований и случайных чисел.
NumPy основывается на слабых вычислительных возможностях Python, изменяя структуру данных встроенного списка в n-мерный массив, который является основной функциональностью NumPy. Обработка данных таким способом обеспечивает большую свободу с данными и позволяет массиву содержать разнородные данные. Это чрезвычайно полезно в приложениях машинного обучения, и различные функции, которые библиотека предлагает для очистки данных, также необходимы для создания хорошего алгоритма машинного обучения.
  1. Scikit-Learn
  2. Caffe
  3. PyTorch
7. Matplotlib
Matplotlib — одна из первых библиотек машинного обучения Python, которую должен установить программист, поскольку она выполняет важную часть типичного рабочего процесса машинного обучения; визуализация. Библиотека Matplotlib расширяет функциональные возможности Python, добавляя в нее мощные инструменты визуализации. Библиотека позволяет создавать несколько графиков, таких как линейные диаграммы, гистограммы, точечные диаграммы и гистограммы.
Matplotlib предлагает интерфейс, похожий на MATLAB, и позволяет легко визуализировать данные. Бэкэнд Python позволяет программистам расширять функциональные возможности библиотеки с помощью наборов инструментов. Дополнения, такие как Basemap, Cartopy, инструменты GTK, Mplot4d и Natgrid, добавляют множество функций в библиотеку matplotlib.Эти функции включают в себя картографические проекции, инструменты интерфейса Excel, 3D-графики и возможности преобразования изображений. Matplotlib может быть использован для создания 3D графиков, графиков изображений, контурных графиков, полярных графиков и линейных графиков и других. Этот тип визуализации важен, так как он может помочь программистам определить шаблоны в данных и ускорить процесс воображения. Кроме того, визуализация позволяет инженерам машинного обучения точно передавать свои результаты доступным способом.
Основная задача: визуализация данных.
  1. OpenCV
9. Pandas
Pandas — одна из наиболее интегрированных библиотек машинного обучения Python, которую должен иметь программист. Название библиотеки является аббревиатурой от термина «панель данных», а модуль обеспечивает анализ данных и статистические функции. Он также предлагает дополнительные простые в использовании структуры данных для упрощения обработки данных и предварительной обработки.
Pandas стремится добавить множество функций для анализа данных в Python и создан для того, чтобы пользователи могли выполнять сложные операции, не находя необходимости переходить на язык более конкретной цели. Pandas предлагает инструменты для чтения и записи данных в структуры данных памяти, манипулирования данными с индексированием, изменения формы наборов данных, слияния и объединения наборов данных, фильтрации данных и функциональности временных рядов.
Библиотека также высоко оптимизирована для повышения производительности, поскольку критически важный код пишется на языке Cython или C. Это позволяет оптимизировать небольшие операции, в то же время экономя время в геометрической прогрессии при выполнении более крупных задач. Это, наряду с мощными и функциональными статистическими функциями Pandas, делает его отраслевым стандартом для анализа данных в Python.
Основная задача: манипулирование данными и анализ.
  1. Natural Language Toolkit
2 эксперта согласны
В принципе вы перечислили все основные библиотеки. Все верно.
Старший разработчик компании Google. Основная специальность - машинное обучение, глубокое...  · 21 сент 2021
1. scikit-learn для использования классических методов машинного обучения (линейная и логистическая регрессии, SVM и прочие) 2. plotly и seaborn для визуализации 2. pytorch и его расширение для распределенных систем deepspeed для обучения нейронных сетей. 3. tensorflow также для обучения нейронных сетей. Список далеко не полный, здесь самые популярные библиотеки Читать далее
Keras как оболочка tensorflow очень помогает начинающим
Кандидат филологических наук, лингвист, читатель, мечтатель, работник нефтегазового...  · 24 сент 2021
sklearn (scikit-learn), tensorflow, pytorch, keras, opencv (для графики / распознавания образов), pandas + numpy, для текстов также ntlk, spacy