Пробки из будущего

6 декабря 2012, 12:11

 

Сегодня, как могли заметить пользователи из Москвы, на главной странице Яндекса появился новый информер — прогноз балла пробок. Он призван помочь автомобилистам планировать свои передвижения.

Прогноз пробок

Появляется информер, когда хотя бы один раз за следующие пять часов ожидается три или больше баллов. Его показания обновляются каждые 10 минут.

Чтобы сделать такой предсказатель, мы наняли несколько финалистов «Битвы экстрасенсов» и посадили их вокруг команды Пробок — по вершинам пентаграммы.

Родилась эта функциональность, как и многие, из гипотезы — вечерние пробки напрямую зависят от дня недели, месяца и утренних пробок (большинству приехавших в центр нужно будет возвращаться обратно). Для проверки гипотезы мы решили использовать нейронную сеть. Если просто, то нейронная сеть — это некий «чёрный ящик», которому задаёшь известные факторы и условия, а он их обрабатывает и выдаёт решение задачи. Более серьёзные определения можно найти в словарях. Такие сети используются, например, для распределения веб-трафика между серверами или управления городскими светофорами.

Для эксперимента мы взяли общедоступную библиотеку искусственных нейронных сетей FANN. Мы обучили сеть при помощи двухлетнего архива Яндекс.Пробок и получили первые результаты. После сравнения прогноза с реальностью стало понятно, что гипотеза подтвердилась. И тут разговор зашёл о погоде, но не потому что все темы исчерпались.

Ни для кого не секрет, что на дорожную ситуацию в городе влияют осадки. Если идёт дождь или снег, водители ждут беды. Мы взяли архив погоды и переобучили сети с учетом данных об осадках, изменении температуры и давления за два года. Кстати, в процессе изучения предсказания балла мы заметили один удивительный на первый взгляд факт. Информация о том, выпадут осадки или нет, гораздо меньше влияет на точность прогноза, чем количество миллиметров ртутного столба и градусов по Цельсию. Что, собственно, логично, ведь осадки зависят от этих двух показателей, а сами показатели гораздо точнее, чем «местами возможен дождь».

После добавления данных о погоде точность прогноза улучшилась, и мы задумались о самом продукте. Изначально мы собирались прогнозировать только вечерние пробки утром. Но потом подумали, что это слишком узко. И решили предсказывать весь день — с самого утра и на пять часов вперёд.

Чтобы снизить вероятность ошибки, мы рассчитываем прогноз сразу в трёх независимых нейронных сетях, которые обучались отдельно друг от друга. На главной странице отображается округлённое среднеарифметическое их результатов.

Конечно, этот информер — не точный измерительный прибор. Он показывает, в каком направлении будет развиваться ситуация. Вероятность предсказания балл в балл сейчас варьируется в среднем от 60 до 77% — угадать получается тем лучше, чем ближе будущее к настоящему.

 

Команды главной страницы и Пробок,

Пять часов тому вперёд

24 комментария
Подписаться на комментарии к посту

 а я пропустил где-то или уже есть информер о среднем балле на маршрутах между точками А и Б?

Прогноз-то наверное тоже - средняя температура по больнице?

Надеюсь, этот этап - промежуточный в цепи создания венца творения - прогноза по маршруту. Иначе какой смысл?

Я к чему ..

На севере Мск. по вечерам часто наблюдается картина - МКАД стоит от Алтуфьево до Ленинградки (внешнее). А внутреннее направление худо бедно едет от Бусинова до Алтуфьево и далее свободно до Осташково (если там чего не...). И как тут учитывать Ваш прогноз, в зависимости от направления движения?

Конечно, я могу открыть карту в режиме прогноза и сам все продумать. Но у Вас же информер.

Впрочем, я и так открываю карту в реальном времени и сам все прогнозирую. Потом по дороге корректирую по ситуации. "А случаи бывают разные"(с)

http://www.yandex.ru/?add=23743 - пробки на маршруте

Mitchell Y. Yurchick
6 декабря 2012, 13:38

 

мы наняли несколько финалистов «Битвы экстрасенсов» и посадили их вокруг команды Пробок

 

Мой друг недавно приходил в Яндекс на собеседование, хотел устроиться программистом, но не срослось. Теперь понятно пощему!!

Ну вот, уже и пробки научились предсказывать, а прогноз погоды до сих пор никто не может точно предсказать ;)
Вы сейчас серьёзно?
Вполне.
Ибо вчерашний вечерний прогноз на сегодня отличается от сегодняшнего утреннего, а в течение дня он ещё и меняется.
И это только на 1 день! Я уж не говорю о неделе.

Кроме того, ошибочна практика прогноза "на город", тогда как Москва - она большая, и в разных её частях совершенно запросто может быть разная погода, что прогнозом не учитывается.
А прогноз погоды учитывается в нейронной сети?
А вчерашние пробки?

прогноз погоды - учитывается

вчерашние пробки - нет, кажется, что это мало влияющий на сегодняшние пробки фактор

про мало влияющий фактор.. иногда влияет.
Имхо вчерашние вечерние пробки в мск как-раз следствие, незагруженности города вечером позавчера.

ну, мы попробуем и измерим, спасибо за идею

Светлана Локоткова
7 декабря 2012, 03:08

правило наоборот, кстати, даже лучше действует: если в какой-то день были гигантские пробки, то на следующий день в город выезжает меньше автомобилистов. еще можно учитывать ночную активность в блогах-твиттере-итп, например; надвигающиеся праздники - при оценке загруженности дорог в аэропорты... да много еще чего, если подумать)) было бы желание))

Красные дни учитываются? Или по ним статистики мало?

Разработчикам спасибо. Автору идеи тоже.:-)

Интересная фишка. Яндекс продолжает радовать. Надеюсь, технология предсказания будет развиваться дальше.

Было бы круто если бы информер показывал не только общую ситуацию, но и прогноз по конкретному маршруту. То есть интегрировать в информер опцию "Мой маршрут"

И приложение на экран смартфона тоже было бы не лишним.

Для этого нам бы пришлось обучать по отдельному комплекту нейронных сетей для каждого возможного маршрута. Это астрономическое число комбинаций. А вот сделать прогнозы по основным магистралям - вполне реально.

А приложение, выводящее информер на рабочий стол/экран телефона, будет?

Когда ждать другие города, например Санкт-Петербург? 

И еще улучшит ситуацию анализ предыдущего дня, насколько предыдущий день (прямо по часам) отличается от прогнозов на него. Таким образом можно будет учитывать перекрытия дорог, ремонты и прочие катаклизмы. Поскольку у нас не бывает внезапного улучшения дорожных ситуаций, а только внезапное ухудшение, то можно прогнозировать длительность проблем на основе ухудшения ситуации за несколько последних часов по сравнению с прогнозом на эти часы. Например, если 2 часа назад прогнозировалось движение 5 баллов, а было 7, и тенденция сохранилась, то можно прогнозировать ухудшение до тех пор, пока баллы за предыдущие часы не выровняются со своим прогнозом (в допустимых пределах погрешности).

А вашу систему (нейронную сеть) можно натравить на финансовый рынок чтоб она на пять часов в перед курс валютных пар показывала? :)

Это уж есть давно) Места знать надо)

не только от дня недели, месяца и утренних пробок, но и от некоторых дат (на 1 января в 7,00 сложно найти живую душу на улице, хотя в обычны дни в это время как обычно), погодных условий (заметет - можно и без яндекса определить что пробка 100%; или еще с туманом тоже) и др.

нужно чтобы навигатор строил по возможности несколько равнозначных маршрутов и показывал один случайных из них. тогда по теории вероятности всем водителям достанется по равному количеству разных при том, что точка отправления и прибытия будет у всех одинаковой. если пользователю маршрут не нравится - жмет "построить другой маршрут" и ему предлагается другой случайный выбор

 

и еще не могу понять - зачем делать две разные проги, если можно сделать яндекс карты, в котором можно будет просто переключиться в режим навигатора - это сильно съэкономит место на microSD на картах

ПАРЕНЬ ТЫ КРАСАВА

Пробки возникают из-за того, что все кому не лень покупают машины. Они исчезнут только тогда, когда мы перестанем быть как стадо баранов. В конце концов за хлебушком можно пешком сходить или на велике съездить (даже зимой - есть спецшины). Тем кому тачка нужна по работе это менее 50 процентов.

Будет страшно, если эта штука лет через 15 скармлевания информации начнёт с большой точностью предсказывать аварии в конкретных зонах...