Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Для решения каких задач Data Science Вы бы использовали Java или C++ вместо Python?

ПрограммированиеData science
Александр
  · 1,3 K
Программист, интересуюсь физикой, математикой.  · 20 сент 2021
Как минимум C++ позволяет эффективнее обрабатывать большие объемы данных. Конечно для Python существуют такие библиотеки как pandas, которые по сути переносят часть обработки данных в компилированную библиотеку, но зачастую написать C++, C, Java, Go, Rust, ... код все же лучше.
Лично я чаще всего сейчас использую Go для предварительной обработки данный, при этом многие низкоуровневые части я пишу на C++. В частности для подготовки датасета для обучения модели предсказания цен на авиабилеты и билеты на наземный транспорт мне необходимо обработать огромный объем данных из колоночной базы данных. Использование Python'а в этом случае замедляет работу в несколько раз, прежде всего из-за глобальной блокировки, что означает необходимость использования многопроцессной архитектуры, а это в свою очередь ведет к усложнению кода.
В некоторых случаях, как например при подготовке звуковых датасетов, я делаю привязку для C++ библиотеки к Pythonу, чтобы интегрироваться в TensorFlow воркфлоу. Иногда, как например при обработке данных из Википедии, удобная библиотека для работы с форматом данных есть в С++, поэтому я использую его.
На самом деле, я бы с удовольствием использовал С++ для любых задач, вплоть до обучения нейросетей, но выбор библиотек для этого ограничен и лучшие фреймворки имеют отличные Python интерфейсы и достаточно неудобные C++. Но мое мнение нельзя назвать объективным, так как прежде всего я являюсь системным программистом на C/C++, а Data Science/ML задачами занимаюсь больше из-за того что мне это нравится и компания вполне довольна результатом.
Специалист в области управления и информатики в технических системах. Data Engeneer, IT...  · 23 сент 2021
Честно? Никаких. Проблема в том, что у этих языков ещё нет хороших библиотек для DS. Чтобы написать для Java такие библиотеки понадобится не мало времени. На C++ дела немного проще, есть поддержка от Nvidia. Но и здесь тоже дела не настолько хороши.
1 эксперт согласен
Openstack DevOps and IBM/Informix Certified DBA . Phd in Math (Duality of spaces of...  · 24 сент 2021
Принимая во внимание,что NumPy в основном написан на C. Основное преимущество Python состоит в том, что есть несколько способов очень легко расширить ваш код с помощью C (ctypes, swig, f2py) / C ++ (boost). =================================================== Matplotlib - это библиотека построения графиков для языка программирования Python и его расширения числовой... Читать далее
Метрология, линейно-угловые измерения. Python + BigData для обработки результатов...  · 24 сент 2021
У меня в прикладных задачах по метрологии важнее время. Иногда сталкиваюсь с такой проблемой, есть механический прибор который превосходит по скорости вычислений любой компьютер и при этом даёт приемлемую погрешность. Заменить его электроникой имеет смысл только при условии изменения всего технологического процесса. Первичный сбор информации особых проблем не имеет, но... Читать далее
2 эксперта согласны
1) embedded systems 2) backend Node.JS 3) frontend React/Vue/Typescript 4) DataScience  · 20 сент 2021
Я использую С++ для решения следующих задач на ограниченном железе: 1) анализ сигналов от датчиков вибрации крупных двигателей в системе предиктивной аналитики 2) анализ изображений с камер наблюдения за технологическим процессом с помощью OpenCV С++ потому что быстрее вообще всего возможного.. Я делал модуль на базе Raspberry3 и когда выбирал на чём писать (редкий... Читать далее
Люблю программировать  · 27 сент 2021
Ни для каких. Возможно, Python будет их медленнее обрабатывать, но для Python существует много, очень много библиотек для Data Science. Для Java или C++ такие не уверен, что есть.
1 эксперт не согласен
Чаще они и пишутся на Си