Аналитики в Яндексе

Внутри Яндекса много команд аналитиков, которые отвечают за сложные и масштабные задачи. Есть разные направления: продуктовая аналитика, Data Science, Data Engineer, бизнес‑аналитика.
Направления 
Можно выделить четыре больших направления для аналитики в Яндексе с разными технологиями, задачами и вакансиями.
Data Science
Специалист в области Data Science строит на основе данных модели, которые принимают решения и делают сервис лучше.
Data Engineering
Data engineer Яндекса — это специалисты, которые проектируют хранилища, настраивают сбор данных и превращают их в понятные и эффективные инструменты для продукта и пользователей.
Продуктовая аналитика
Продуктовые аналитики работают с продукт‑менеджерами: оцифровывают изменения в сервисах Яндекса и помогают решить, принимать ли их и каким образом развивать дальше.
Бизнес-аналитика
Бизнес‑аналитики, в отличие от других направлений, работают напрямую с руководителями и вместе с ними выстраивают стратегию роста и развития всей компании — как единого организма

Технологии

Наши специалисты разрабатывают фреймворки на Python и готовят данные через YQL, внутренний адаптированный язык SQL. Они используют в работе внутренние инструменты, способные обработать десятки гигабайт данных в секунду и дать нужный результат в удобной форме.
Универсальная вычислительная облачная платформа, где приложения запускаются в порядке, указанном пользователем. В Нирване хранятся нужные процессам описания, ссылки, блоки процессов и связанные с ними данные. Процесс оформлены в виде ациклических графов.
Для визуализации данных без javascript.
Универсальный, строго типизированный язык запросов к системам хранения и обработки данных, который позволяет делать с данными практически что угодно.
Полноценная внутренняя песочница.
YT
Многокомпонентная MapReduce‑система с кластерами до 10 тысяч нодов. Так мы храним сотни петабайт данных, планируем и производим вычисления на сотнях тысяч CPU‑ядер.
Высокопроизводительная аналитическая СУБД с открытым исходным кодом. С ней можно сохранять весь поток данных без предварительной агрегации и быстро получать отчёты в любых разрезах. Внутри Яндекса самый большой кластер ClickHouse с возможностью получать ответы на вопросы за секунды вместо часов.
ML технологии Яндекса
У нас есть общие квоты с доступом к ML на свободных ресурсах кластеров и готовые кубы ML с возможностью обучения внутренних и внешних нейросетей. Помимо общеизвестных технологий мы используем и собственные разработки: у нас есть CatBoost (опенсорсная библиотека градиентного бустинга на деревьях решений) и Зелибоба (нейросеть для генерации текста).
Виртуальные машины
Мы используем свою разработку — виртуальные машины Yandex DataSphere на основе Jupyter, а также виртуальные машины с другими инструментами: бэкапами, JupyterLab и шерингом Jupyter Notebook в репозитории.
Собственные платформы
Платформы для A/B экспериментов, система опросов и  Толока.
Счётчики Рунета.
Актуальные вакансии
Mon Apr 14 2025 15:54:10 GMT+0300 (Moscow Standard Time)