Толока

Как поучаствовать в создании беспилотника, не будучи разработчиком

Чтобы беспилотный автомобиль был безопасным и соблюдал правила дорожного движения, его нужно научить правильно реагировать на появление тех или иных объектов. Это могут быть дорожные знаки, пешеходы, машины, животные, деревья, неровности на дороге и так далее. В качестве «глаз» беспилотника выступают сенсоры. Чаще всего это камеры, радары и лидары.

Камеры фиксируют всё, что происходит вокруг автомобиля.  Полученная картинка позволяет определять границы проезжей части, положение других машин и людей, считывать дорожную разметку и распознавать знаки.

Радар с помощью радиоволн определяет расстояние до объектов. Лидар по принципу работы напоминает лазерный дальномер. Он сканирует пространство лазерными лучами, и на основе полученных данных вычисляется расстояние до объектов. У лидара более широкий угол обзора, чем у радара, но радар охватывает большее расстояние, что важно если автомобиль едет на высокой скорости.

Чтобы машина могла различать объекты, ей нужно показать десятки тысяч примеров размеченных изображений, где выделен каждый объект.
 

Пример разметки изображения

Размеченные изображения можно скачать из открытых датасетов, но они собираются за границей и отличаются от российской действительности: там другая дорожная разметка, другие знаки и светофоры, другой ландшафт и так далее. Здесь в дело включаются исполнители Толоки.

Интерфейс заданий

Для выполнения задач по разметке разработчики беспилотных автомобилей создали в Толоке свой уникальный интерфейс. Он представляет собой визуальный редактор, где есть слои, выделение, прозрачность, деление на классы, увеличение. Толокерам удобно работать в таком редакторе, и это улучшает качество разметки и точность выделения объектов, позволяя получать результаты быстро.

Разметка изображений — довольно сложное задание: не так просто обвести все объекты на картинке, учитывая их размеры, расстояние друг от друга и прочие нюансы. Во-первых, нужно тренироваться, чтобы набить руку. Во-вторых, даже у опытных исполнителей это занимает довольно много времени. А размеченных картинок нужно очень много. Кроме того, беспилотникам требуются разные виды разметки, и полученные картинки нужно отбирать, сортировать и корректировать.

Команда беспилотников решила эту задачу так: сложное задание по разметке дробится на множество более простых, а результат собирается из кусочков. Так можно получить результат быстрее, уменьшить вероятность ошибки и снизить требования к исполнителям. Это соответствует главному принципу работы Толоки как краудсорсинговой платформы, где большая высокоуровневая задача дробится на большое количество мелких типовых подзадач.

Обработка изображений в Толоке

Прежде чем приступить непосредственно к разметке, стоит определить, какие вообще объекты есть на изображении. Это поможет понять, на какие классы можно разметить картинку и упростить дальнейшую разметку.

После того, как толокеры определили, какие типы объектов есть на картинке, изображение можно сегментировать, то есть выделить на нем области, где находятся эти объекты.

Следующий шаг — классификация объектов. Например, толокеры, выполнявшие предыдущие задание, определили, что на картинке есть люди. Эти люди могут находиться в машине, быть велосипедистами, мотоциклистами или пешеходами. Всё это важно, так как на каждого из них беспилотник должен реагировать определенным образом.

Важная часть — проверка. Толокеры — обычные люди, они могут отвлечься или ошибиться. Поэтому задание дается на проверку другим исполнителям.

Алгоритмы постепенно обучаются и уже могут размечать изображения не хуже людей. И всё же качество их разметки тоже нужно проверять и оценивать. Поэтому в заданиях на проверку к картинкам, размеченным толокерами, подмешиваются результаты работы нейронных сетей. Это позволяет оценить качество работы алгоритма, понять, насколько хорошо он справляется с разметкой.

Людей в Толоке становится всё больше, а значит, задачи выполняются быстрее, буквально в течение одного-двух дней. Так Толока интегрируется в процесс обучения нейронных сетей и становится одним из его важных этапов. А толокеры в свою очередь получают не только возможность быстро заработать деньги, выполнив несколько несложных заданий, но и внести свой вклад в развитие беспилотных автомобилей.

Что еще почитать о беспилотных автомобилях и Толоке

Краудсорсинг и Толока

Краудсорсинг и Толока. Продолжение

Как краудсорсинговая платформа Яндекса помогает обучать беспилотники и оценивать качество сервисов