Сталь, нефть и искусственный интеллект: Yandex Data Factory о новой промышленной революции

В декабре 2014 года Яндекс открыл Yandex Data Factory. К тому моменту мы уже давно использовали технологии машинного обучения внутри — и осознали, что их с не меньшим успехом можно применять и в областях, не связанных с интернетом. За два года мы реализовали несколько десятков проектов в самых разных отраслях, а рынок кардинально поменял свой взгляд на перспективы сотрудничества IT-компаний и индустрии. Искусственный интеллект перестал быть атрибутом научной фантастики и стал реальностью, которая, к тому же, даёт ощутимую экономическую выгоду. О том, как изменился мир и что будет дальше — руководитель Yandex Data Factory Евгения Завалишина.

Евгения Завалишина,
руководитель направления Yandex Data Factory

Последние годы «большие данные» были одной из самых горячих технологических тем. Без соответствующей секции не обходилась ни одна отраслевая конференция. Влияние «больших данных» на экономику обсуждали правительства, а пресса писала про волшебные новые возможности, которые big data несёт человечеству.

В конце 2014 года Яндекс открыл новое направление — Yandex Data Factory. До этого у нас было несколько экспериментальных проектов: они показали, что технологии Яндекса — в первую очередь, машинное обучение, — могут очень успешно применяться для решения практических задач в отраслях за пределами интернета.

Главной задачей Yandex Data Factory на первые два года было найти такие способы применения наших технологий, которые дали бы наибольший эффект и открыли бы бизнесу самые широкие перспективы развития. Но мы не очень-то вписывались в тему «больших данных» в том смысле, в каком её в тот момент понимал рынок.

На рынке все были озабочены конкретными задачами — как настроить Hadoop или изящно визуализировать накопленные данные. Все планировали инвестиции в «большие данные», но рассматривали их прежде всего как затраты на покупку и внедрение новых систем.

Мы предложили подойти к делу с другой стороны — отталкиваться не от затрат, а от создаваемой ценности. Чтобы не быть голословными, мы измеряли эту ценность прямо — в деньгах, которые можно сэкономить или дополнительно заработать с помощью решений на базе машинного обучения.

Конечно, наши рассказы о том, что в «большие данные» можно не только вложить кучу денег, но и с лихвой возместить инвестиции, вызвали немало интереса. Чтобы превратить этот интерес в реальные проекты, пришлось потратить немало времени и сил на образовательную часть. Мы объясняли, в чём особенности метода. Напоминали о необходимости проводить экспериментальные проверки и замеры. Рассказывали про отличия от традиционной бизнес-аналитики. Наконец, прямо говорили о неприятной особенности решений на основе машинного обучения — невозможности человекопонятно объяснить, что именно на что влияет.

В 2016 году всё резко изменилось. «Большие данные» вышли из моды, и все заговорили про машинное обучение — или, как сейчас модно называть спектр технологий анализа данных, искусственный интеллект. Последствия оказались немного неожиданными, но об этом мы расскажем чуть позже.

Первые прорывы

К счастью, на протяжении этих двух лет находились заказчики, которые были открыты для экспериментов и ещё до начала всеобщего ажиотажа распознали потенциал применения машинного обучения в бизнесе. С ними нам удалось реализовать несколько десятков успешных проектов в разных отраслях.

Мы выглядели «странными», но делали то, чего в то время почти никто не делал (все занимались внедрением бигдаты!). Поэтому заметный интерес вызывал каждый кейс, о котором мы рассказывали публично. Вот лишь несколько свежих примеров:

Новая промышленная революция

Особняком среди всех отраслей стоит промышленность. В 2015 году мы впервые рассказали о работе Yandex Data Factory с Магнитогорским металлургическим комбинатом (ММК). Тогда многим показалась забавной идея сотрудничества интернет-компании с металлургами. Но промышленность для нас — совсем не случайный выбор. У этой отрасли есть сразу несколько важных особенностей, которые позволяют эффективно применять наши технологии.

Во-первых, промышленные компании давно отладили процессы и накопили большое количество исторических данных, которые необходимы для машинного обучения. Кстати, данным необязательно быть «большими». Да, если везде повесить датчики — их часто показывают в презентациях про промышленный «интернет вещей», — можно собрать терабайты информации. Но в случае с тем же ММК речь шла всего лишь о десятке гигабайт — именно столько весит история плавок за последние годы.

Во-вторых, промышленные компании — это компании с инженерной культурой. Они умеют внедрять новые технологии в существующие процессы и хорошо знают, что такое эксперименты и как их проводить. Именно это, как показывает опыт Yandex Data Factory, является одним из критически важных факторов успешности проекта.

Наконец, промышленность знает цену оптимизации. Экономия на производстве в единицы процентов даётся промышленникам очень нелегко. Это капитальные затраты: денег — на новое оборудование и времени — на внедрение. На этом фоне наши решения, которые предлагают получить оптимизацию в 5-10% за несколько месяцев и без капитальных инвестиций, выглядят действительно революционно.

Спектр возможных применений очень широк — особенно в процессном производстве, когда выпускаются не отдельные товары (автомобили или платья), а материалы, смеси и тому подобное.

Листовая сталь

Например, для ещё одной металлургической компании мы делаем прогноз дефектов проката на ранних этапах производства. Модель учится предсказывать, из каких слябов (это такие огромные стальные слитки) получится листовая сталь с дефектом. Заранее зная, где возникнут дефекты, можно своевременно отправить сляб по другому маршруту для производства другого сорта листовой стали. Так можно избежать значительных затрат на высокотехнологичную обработку.

Для другой компании, из нефтехимической отрасли, мы оптимизируем работу установки, которая выполняет газофракционирование — разделяет смеси газов на отдельные фракции. Наше решение рекомендует параметры работы установки — это ещё один пример сложного процесса, где анализ исторических данных позволяет сократить общие издержки.

Газофракционирующая установка

Промышленность существует сотни лет. Именно там работают компании, которые внедрили принцип постоянных улучшений и знают цену каждому проценту эффективности. Традиционными методами в промышленности уже оптимизировано всё, что можно было оптимизировать, и именно применение технологий машинного обучения и искусственного интеллекта может обеспечить следующий прорыв.

Эра искусственного интеллекта

Сегодня (внезапно!) все вдруг поняли, о чём мы говорим. То, что мы рассказывали ещё в 2014 году, в 2016 году стало регулярно попадать в заголовки.

В январе 2016 года Всемирный экономический форум объявил главной темой на следующие несколько лет четвёртую промышленную революцию. Утверждается, что важнейшую роль в ней сыграют технологии машинного обучения и искусственный интеллект. Правительства тоже переключились на эту тему: в администрации президента США подготовили большой доклад о влиянии искусственного интеллекта на будущее экономики, а премьер-министр Великобритании Тереза Мэй объявила о новой стратегии британского правительства, где ИИ обозначен как одно из ключевых направлений.

Технологические компании одна за другой объявляют о своей приверженности искусственному интеллекту и машинному обучению. Стратегии, в основе которых лежит ИИ, формулируют и игроки в других отраслях. Пресса, вплоть до женских журналов, рисует картины светлого будущего, которое принесёт нам искусственный интеллект. Аналитики перестали прятать когнитивные сервисы внутри решений для бизнес-аналитики и стали выделять их в отдельный миллиардный рынок.

То, о чём мы одними из первых рассказывали не вполне понимающему нас рынку несколько лет назад, буквально у нас на глазах превращается в мейнстрим.

Конечно, это хорошие новости для Yandex Data Factory — мы оказались среди немногих игроков, обладающих практическим опытом применения искусственного интеллекта в традиционных отраслях. Сделанные за это время проекты, а также наши выступления на конференциях, статьи в отраслевых изданиях и прочая пропагандистская работа во второй половине 2016 года стала приносить плоды.

Начался резкий рост спроса на наши услуги. Только за IV квартал мы подписали соглашений примерно на ту же сумму, что за предыдущие три, а по итогам 2016 года сумма подписанных контрактов оказалась почти в три раза выше, чем в 2015 году.

Но, как ни странно, у этого взлёта есть и обратная сторона. Мы стремительно теряем фору. Недаром один из основателей Wired Кевин Келли заявил: «Биз­нес-пла­ны сле­ду­ю­щих 10 тысяч стар­та­пов легко предсказать: берем X и до­бав­ля­ем ИИ».

Yandex Data Factory в промышленных масштабах

Для нас это означает, что ближайшие два-три года станут решающими в гонке. Будущее Yandex Data Factory напрямую зависит от того, насколько хорошо мы сможем распорядиться имеющимся у нас сейчас преимуществом.

Но одновременное присутствие повсюду означает, что нам придётся превратиться в универсальную аутсорсинговую компанию — что-то вроде индийских «фабрик кода», только в области ИИ. А это совсем не тот бизнес, который мы хотим построить.

И поэтому мы решили сосредоточиться на главном: пойти туда, где мы нащупали наибольшой потенциал, где у нас сейчас лидирующие позиции и где мы заметны на международном уровне — в ту самую промышленность, где революция уже началась на наших глазах и при нашем участии.

Рынок промышленного ИИ растёт и формируется на наших глазах. Это огромная новая история, в которой Яндекс намерен сыграть свою роль — примерно так же, как и двадцать лет назад, в эпоху зарождающегося интернета.

31 комментарий
Cпасибо огромное Евгения!
Вы так ясно и по полочкам разложили и болевые места и преимущества. Будущее Yandex Data Factory напрямую зависит от того, насколько хорошо мы сможем распорядиться имеющимся у нас сейчас преимуществом. Искренне желаю Вам гармонии в процессах исследований и практического опыта. все равно чтобы ни было Яндекс занял позицию не потому, что хотел занять, а потому что делает в промышленности и то и другое (исследование и практика). И если даже не совсем хочется быть фабрикой кода - жизнь все равно даст Вам еще лучше со временем, главнее решать производственные задачи тем более в таких вещах как оптимальность там, где уже кажется все исчерпано. Главное в гармонии решать - и жизнь вам помогает!!!
Верхотуров Дмитрий
17 февраля 2017, 14:40
Спасибо, очень интересная статья!
это не ИИ, а имитационное моделирование
Ненашев Илья
20 февраля 2017, 10:40
ya.gzas,
Точно
Ненашев Илья,
Полность согласна
Обновлено 28 февраля 2017, 21:35
ya.gzas,

Имитационное моделирование призвано точно воспроизвести некий процесс. Для этого требуется детальное понимание и описание поведения всех его элементов. 



Мы делаем совсем другое: строим “чёрный ящик”, который учитывает одновременно огромное количество факторов - без упрощений, свойственных “человекопонятному” моделированию. Это позволяет с максимальной точностью предсказывать результат процесса и оптимизировать параметры для достижения заданной цели на основе анализа исторических данных - но без объяснения и описания самого процесса.
elena.samuylova,
Лучшим ответом будут книги: 1. Emel'yanov. Imitacionnoe modelirovanie e'konomicheskix processov (2002)(ru)(364s).pdf
2. Советов_Моделирование систем.pdf
Если не трудно объясните в двух словах, или напишите ссылку, в чем разница между искусственным интеллектом и big data.
"Традиционными методами в промышленности уже оптимизировано всё, что можно было оптимизировать" 
Ооочень наивное заявление, особенно когда речь идёт о российской промышленности. 


И да, согласен с комментариями выше. До ИИ как пешком до Китая. 
В остальном, осень интересная информация. Сделайте день открытых дверей или форум на эту тему. Было бы здорово 
Молодцы, так держать. 
В последнии годы занимаюсь имитациронным моделированием производственных процессов и поэтому вижу как много можно сделать в производстве используя эти современные технологии. 
Паршин Геннадий
Евгения,
вы молодцы!
 Я полагаю, что самая большая проблема с которой сталкивается Яндекс, поиск технологов, которые могут сформулировать предмет для моделирования. По моему опыту, их все меньше и меньше.  Нужны центры компетенции, научные кластеры, объединяющие разрозненные научные коллективы.
Ненашев Илья
20 февраля 2017, 10:40
Что-то как-то никакой конкретики даже в двух примерах. Истинный маркетинг! (
Света Чистякова
21 февраля 2017, 16:47
Там любой пример — это отдельный рассказ на много букв :). Если вам интересно, можем рассказать попозже.
Ненашев Илья
21 февраля 2017, 17:43
Света Чистякова,
Конечно интересно. Именно это и интересно!
Света Чистякова
22 февраля 2017, 13:12
Поняли. Расскажем.
Отличное решение! Успехов!
Юрий Свердлов
20 февраля 2017, 16:48
Большой калькулятор, на самом то деле, исходные данные = переменная, 300 переменных условно, если так то так иначе эдак, ничего нового)) В подмосковье давно уже роботы друг друга научились собирать если вы не знали, они за людей еще могут на заводах работать...

просто супер если основная масса людей это осознает а это будет и начнётся новая эпоха люди боятся перемен вот и живут в каменном веке и продолжают вкручивать в патрон лампочку Ильича
Терехов Сергей Александрович
21 февраля 2017, 00:46
Ключ - дефектоскопия.
Искусственный интеллект в будущем не отделим от технологии блокчейна и криптовалют.
молодцы! Успехов всей команде!
Алексей Михайлович
1 марта 2017, 16:31
Вопрос в том, будет ли эта новая отрасль генерить кеш, как Поиск =)
Well done, keep it up.
In recent years, I engaged imitatsironnym simulation of production processes and thus see how much you can do in the production using the latest technology.Result 2017
Gennady Parshin
Обновлено 2 марта 2017, 19:32
Нежданов Некто Ктотович
5 апреля 2017, 01:51
Так и не понятно, что же такое они делали. И кто делал? Менеджеры - они только ведь контролировать налаженные процессы могут. Кто-то должен их налаживать сначала.


Почему бы просто не описать:
а) исходную задачу и условия

б) примерный алгоритм решения
в) результат и его применение
г) улучшения, в чём они заключались , за вычетом затрат


Впрочем, почитал эти вопросы и понял , что все они - "коммерческая тайна"))) Не видать  нам при этом строе внятных сообщений. И не понять, то ли результаты скрывают с целью сокрытия прибылей (или откатов). То ли результатов нет. Мистика в жизнь!


Успехов вам, товарищи Яндексы. Я вами горжусь. Вы молодцы.
Удалённый пользователь
10 апреля 2017, 21:54
А мне совершенно не понравилось , скучно , вычурно , не по сути , один сплошной пиар .  С трудом дочитал до конца ожидая хоть какого  то  соответствия с заголовком. И в чём тут революция? Муть какая то .
Да, интересные рассуждения, спасибо.
Как мне показалось, здесь не про революцию в IT(она уже давненько началась), а про революцию в головах бизнеса, это основное сообщение и очень ценное! С удовольствием буду работать в этой сфере.
Николай А. Емец
20 декабря 2017, 10:22
Спасибо огромное. Многие компании в России уже готовы, Газпром, Роснефть, Металлинвест, Новатэк, Сибур это только малое количество предприятий, кто серьезно к теме относится, главное имеет средства, на реальные шаги в данном направлении. 
Эх, молодеж...
Прочитал - кайф! Как в детстве побывал! Как будто журнал "Техника-Молодежи" за 1974 год почитал, один в один!
Был такой научно-популярный журнал, нравился он мне, писали там еще про чудеса научно-технического прогрессу, про межгалактические космолеты и фабрики с 3 работниками - директором, технологом и бухгалтером, остальные - роботы.То, что сейчас называется модным "машинным обучением", ученым известно уже 100 лет (а в природе встречается и вовсе от сотворенья мира), и называлось (и называется) "построение статистической модели объекта", того самого "черного ящика".
Большого развития это не получило, т.к. построенная таким образом модель объекта действительна лишь в том диапазоне параметров, который был в том массиве данных, на которых была построена эта модель. Стоит вам сменить поставщика сырья - и вашу высокомудрую модель приходится нести на помойку, и заново набирать данные, анализировать, "обучать" модель и т.п. И все это время производство будет работать без этой системы управления, - как бог на душу положит оператору. А потом, когда модель наконец научится, это сырье и закончится, и придет еще новое, и опять вся эта канитель сначала...
Кароче, пацаны, - бесконечная погоня за вчерашним днем получается...
И прогностические (предиктивные) возможности такой система работают только тогда, когда ничего не меняется, всё остается так, как было когда машина училась.
И это - врожденный дефект статистического моделирования, как бы оно не называлось.
Вот така фигня, малята.
В таком виде статистика - инструмент профанации: на хрена физику, химию, технологию изучать?! Возьмем десяток терабайт, загоним в Яндекс - и готово! Можно управлять заводом! )))))
Но маркетинг - рулит! Давайте исчё чёнить умное придумаем и впендюрим этим лохам на заводах! )))))
ibmt,
+100500