Блог API Яндекс.Карт

Интервью с Михаилом Хохловым: как разрабатывали прогнозирование для Яндекс.Пробок

Напоминаем, что 13 декабря в 19:00 московском офисе Яндекса Михаил Хохлов, разработчик инфраструктуры Яндекс.Пробок, проведет научно-технический семинар «Яндекс.Пробки: прогнозируем ситуацию на дороге».

Семинар бесплатный, но нужно зарегистрироваться.

А перед семинаром предлагаем вам почитать интервью с Михаилом о том, как разрабатывалась модель прогнозирования пробок, и какие трудности возникли в процессе.

 

Оригинал интервью размещен на страничке Яндекс.Мероприятия в фейсбуке. Для удобства читателей мы продублировали его и в нашем блоге.

Q: Миша, до изучения проблемы прогнозирования пробок, ты занимался системным анализом экономики в вычислительном центре РАН. Сложно ли было переключиться на новую тему исследований и помог ли предыдущий опыт?
 
A: Тема прогнозирования пробок меня сразу заинтересовала, поэтому переключиться было несложно. Эта область в чем-то похожа на прогнозирование в экономике, в ней ставятся похожие задачи, похожи и некоторые методы. Вообще, моделирование транспортных потоков – молодое и активно развивающееся направление, многие исследователи сейчас пытаются применять к нему подходы из самых разных областей науки. Опыт исследовательской деятельности, который я получил в ВЦ РАН, тут оказался очень кстати.
 
Q: Проводили ли вы какое-то специальное исследование, которое помогло создать математическую модель прогнозирования?
 
A: Естественно, прежде чем выбрать один из возможных подходов, мы изучили их особенности и сравнили на простых примерах. В качестве тренировки мы использовали прогноз по МКАД, взяв данные по нему за один месяц. Мы проверяли все наши модели и способы обработки данных, рисовали диаграммы и пытались понять, как устроены пробки на этой дороге. Большая часть полученных результатов оказалась применима и к другим магистралям, и даже к обычным городским улицам.
 
Q: С какими проблемами пришлось столкнуться во время разработки прогнозирования пробок?
 
A: Самым сложным, пожалуй, было выбрать наилучший метод из многих возможных. Для этого необходимо сформулировать какой-то критерий качества прогноза, а это, как оказалось, совсем не просто. Прогноз тем лучше, чем меньше его отклонение от реально наступившей ситуации, – это понятно. А вот дальше начинаются вопросы. Что лучше – точно предсказывать время поездки, но ошибаться в скорости, или наоборот? Сильно ошибаться для небольшого количества мест или умеренно ошибаться везде? Какой прогноз точнее: минимизирующий абсолютную ошибку (в секундах) или относительную (в процентах)? Каждый такой вопрос требует подробного анализа, прежде чем можно будет утверждать, что мы нашли оптимальный метод прогнозирования.
 
Q: Где-нибудь в мире еще используется прогнозирование пробок?
 
A: Сейчас во многих городах мира работают автоматические системы регулировки движения. Их задача – управлять движением с помощью светофоров, платных дорог, информационных табло так, чтобы максимально снизить нагрузку на транспортную систему и, соответственно, сэкономить время водителей. Для того чтобы делать это наиболее эффективно, им приходится учитывать не только текущую ситуацию на дорогах, но и пути ее возможного изменения. Поэтому, явно или неявно, прогноз обычно является составной частью такой системы. Кроме того, некоторые навигаторы могут давать рекомендации по выбору маршрута на основе имеющейся статистики пробок. Это тоже вариант прогноза (в Яндексе он известен под названием «пробки обычно»). Однако, по результатам наших экспериментов, при планировании поездки на ближайший час, такой прогноз дает не очень высокую точность.
 
Q: Чем отличаются от существующих аналогов Яндекс.Пробки?
 
A: Как я уже говорил, обычно системы прогнозирования пробок являются составной частью более крупных систем управления движением в городе. Они требуют тонкой подстройки под каждый конкретный город (иногда разработка такой системы с самого начала ориентирована на единственный город, в котором она будет применяться). Алгоритм прогноза, разработанный в Яндекс.Пробках, универсален в том смысле, что может без изменений применяться в любых регионах, из которых поступают данные, и как в городах, так и на междугородних трассах. Основным источником данных для него является информация, которую предоставляют нам наши пользователи. Это тоже отличает его от большинства аналогичных систем, которые требуют установки специальных детекторов транспортного потока непосредственно на дорогах.