Мы обрабатываем несколько петабайтов в сутки в batch и microbatch-контурах, чтобы обеспечивать данными сервисы Яндекса (Поиск, Видео, Картинки и др.). От нашей работы зависит качество ответа пользователям и скорость рантайма. Мы пишем библиотеки, позволяющие эффективно и дешево строить data science процессы в продуктовых командах, чтобы легче и быстрее внедрять фичи. Стек в основном на C++, есть также Python в виде биндингов для пользователей.