Разработчик DWH и BI в команду аналитической инфраструктуры Такси

Москва, Санкт-Петербург, ЕкатеринбургБэкенд, SQLТаксиСпециалист, Старший специалист
Яндекс.Такси выходит на рынок в новых странах и городах, и за каждым новым шагом стоят конкретные люди. Люди наблюдают, сколько машин вышло в смену, как из-за дождя резко повышается спрос, как стабильно увеличивается (а иногда, увы, и уменьшается) счастье наших пользователей. Сотни наших сотрудников ежедневно смотрят на сотни дашбордов и следят за каждым из городов, где работает Яндекс.Такси. Всё это считается на мощном аналитическом кластере, ему помогает огромное хранилище Data Lake, а для визуализации используются современные средства самостоятельной бизнес-аналитики (self-service BI), и этим инженерным шедеврам нужна заботливая рука мастера.

Вам предстоит:

  • следить за балансом спроса и предложения, не допускать ни долгих ожиданий такси, ни холостых простоев водителей;
  • вовремя выявлять действия конкурентов и готовить ответные шаги;
  • видеть все KPI всех подразделений во всех регионах и определять размеры премий;
  • следить, чтобы тарифы были справедливыми и при этом приемлемыми как для клиентов, так и для водителей;
  • анализировать доходы и расходы в детальной разбивке и изучать получившиеся графики.

Мы ждем, что вы:

  • свободно владеете ANSI SQL и его прикладными диалектами;
  • умеете работать с современными аналитическими базами данных c массово-параллельной архитектурой (Greenplum, Vertica, ClickHouse, Teradata и пр.);
  • можете объяснить бабушке, чем отличаются «снежинки» от «звездочек», Data Vault от Data Mart, а Кимбалл от Инмона.

Большим плюсом будет, если вам приходилось:

  • работать конкретно с Greenplum, MS SSAS или Tableau;
  • создавать сложные дашборды и визуализации в системах самостоятельной бизнес-аналитики (self-service BI): Tableau, Power BI, QlikView и пр.;
  • разрабатывать сложные высоконагруженные ETL- и ELT-пайплайны: Hadoop, Informatica BDM, GCP Dataflow и пр.;
  • стыковать DWH с Data Lake, работать с инструментами стека Hadoop;
  • писать промышленный код на Python.