"Правда ли Data Science станет основной для любого бизнеса ? "
Спрос на дата-саентистов растет почти столь же стремительно, как рынок профильных платформ. На это влияет развитие отдельных технологий и потребности бизнеса в ускорении. Data Science становится новой нормальностью, частью которой смогут стать очень многие компании. Единственное, что нужно сделать уже сегодня — решить проблему с дефицитом кадров.
Еще в совсем недалеком прошлом, когда бизнес научился собирать данные, но еще не умел полноценно извлекать из них пользу, можно было часто услышать мнение о том, что большие данные под своим весом просто похоронят корпорации. Сейчас подобных возгласов все меньше, и причиной тому стало стремительное развитие Data Science («науки о данных», но этот термин в России не прижился).
Казалось бы относительно свежее понятие на самом деле присутствует в жизни почти каждого человека. Например, Data Science лежит в основе таргетинга рекламы Google, создания персонализированных рекомендаций на YouTube или Netflix. Важность этого подхода можно доказать абсолютными величинами: объем рынка платформ для Data Science в 2017 г. составлял $20,2 млрд, а темпы его среднего ежегодного роста (CAGR) в разрезе до 2025 г. будут на уровне космических 39,7%. К слову, рынок инструментов для аналитики больших данных, на котором так или иначе связанные с Data Science решения рано или поздно начнут доминировать.
Причины такого роста лежат в способности Data Science и дата-саентистов с помощью широкого набора инструментария выводить из больших данных работающие бизнес-гипотезы и искать взаимосвязанные факторы. Зависимость бизнеса от этого направления очевидно стала колоссальной и будет только увеличиваться с годами. Определение нужд потребителя и возможность предложить ему нужный товар нужным способом, устранение рутины в офисах и браков на производствах, а также относительно приемлемый ценник самого внедрения.
Основными причинами развития Data Science стали прорывы в тех или иных технологиях, которые позволили более полно, чем, например, во второй половине прошлого десятилетия, использовать потенциал этого подхода. Одной из ключевых тенденций эксперты называют стремительное увеличение числа проектов с использованием искусственного интеллекта. ИИ теперь используется практически во всех сегментах и отраслях бизнеса и постоянно развивается. Развивая попутно и бизнес: искусственный интеллект способен повышать эффективность бизнес-процессов на десятки процентов, как и прибыли. Это достигается за счет более надежного и автоматизированного управления клиентскими данными. Помимо ИИ, на Data Science сказывается и автоматизированное машинное обучение.
Свою роль сыграла и постепенное расширение границ аналитики больших данных, которая является спутником Data Science. Компании стали получать больше ценных сведений о потребителях, очищать данные и отдавать их на постобработку Data Science-платформам. Особенная роль здесь отведена прогнозной аналитике, благодаря которой дата-саентисты могут строить образы компаний на краткосрочную и даже среднесрочную перспективы. Это применимо как к глобальным историям, вроде составления маркетинговых компаний, так и к локальным бизнес-процессам, вроде наполнения складов.
Еще одним фактором, пусть и не столь очевидным, эксперты называют развитие граничных вычислений. Edge Computing решает проблемы пропускной способности каналов, не давая их перегружать и снижая задержки поступления данных. Кроме того, расширяются возможности по их хранению и предварительной обработке непосредственно в точках сбора, чем воспользовались уже даже производители видеокамер.
Единственная стоящая проблема философии Data Science — сложная кадровая ситуация. Число вакансий выросло более чем в четыре раза за последние несколько лет. Дефицит тем более удивителен, что дата саентистам готовы хорошо платить (средний уровень оклада, если верить сайтам по трудоустройству, на уровне ₽170 тыс. для middle-специалиста), а обучение профессии — интеллектуально доступно даже для людей, не имеющих профильного математического или технического образования.
=====================================================
Мое отношение к этому вопросу не столь радужно. Как DBA c достаточно большим опытом работы вне России, Я не вижу возможности в эффективной работы Пайтон, вооруженного всеми пакетами типа Numpy, Matplotlib, Pandas and etc, без коннекта к VLDB Instances with extremely high performance OLAP, использующих NOSQL Databаse servers типа ADABAS скорее чем любой элитный SQL Server основанный на реляционной структуре самой БД ( скорее оптимальной для OLTP rather then OLAP ). Я практически не сомневаюсь , что за 20 лет IBM/Informix с какой либо продвинутой версией PDQ ( Parallel Data Query ) вполне может конкурировать с NOSQL Architecture. Но стоимость такого математического обеспечения + стоимость аппаратного обеспечения ( Серверного железа ) будет чрезвычайно высока и такого рода инвестиции доступны не слишком большому числу компаний и не только в России. Мне не вполне ясно как Компании среднего ранга могут получить РЕАЛЬНУЮ Прибыль от систем , где лишь Клиентская часть математики стоит дешево в отличии от Серверов баз даннных.