Толока — это открытая краудсорсинговая платформа, с помощью которой мы собираем данные для машинного обучения для всех проектов Яндекса. Ежедневно в Толоке размещают задания десятки заказчиков, а выполняют их десятки тысяч «толокеров». Мы ищем в команду Толоки аналитика, которому будет интересно применить свои знания в области статистики и машинного обучения для развития технологий краудсорсинга и проводить в Толоке исследования, например:
- автоматически определять читеров в системе;
- повышать качество собираемых оценок за счет умного таргетирования заданий на исполнителей;
- комбинировать человеческие оценки и результаты работы автоматических алгоритмов для повышения точности оценок или снижения затрат;
- исследовать новые способы агрегации оценок и формулировки бизнес-логики заданий;
- формулировать и проводить эксперименты по управлению спросом и предложением в системе.
====Мы ждем, что вы:
- обладаете опытом решения прикладных задач с применением математической статистики;
- можете легко обращаться с большими массивами данных;
- умеете разрабатывать дизайн экспериментов и делать выводы из полученных результатов;
- программируете на Python и знакомы с библиотеками pandas, numpy, scipy;
- знаете SQL.
====А также надеемся, что вы:
- знаете английский язык в достаточной степени для чтения научных статей и технической литературы;
- работали с инструментами, использующими принципы MapReduce (например, Hadoop);
- использовали алгоритмы машинного обучения на практике.