Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

В чем разница между RNN, LSTM и GRU?

ТехнологииПрограммирование+3
  · 3,6 K
Учитель - увлекаюсь нейронными сетями, создаю курс занятий по нейронным сетям не для...  · 13 нояб 2021
RNN ( рекуррентная нейронная сеть 1982)
простая, быстро обучается, затухающий градиент - слабая способность обучения.
LSTM (долгая краткосрочная память 1997). Создана для снятия проблемы затухающего градиента.
высокая сложность, долго обучается, большие возможности обучения
GRU (управляемый рекуррентный блок 2014). Создана как "упрощённая" модель LSTM.
средняя сложность, средние скорости обучения, средние возможности
Классическое объяснение работы LSTM в данной статье -
По образованию физик, работаю программистом  · 11 нояб 2021
RNN -- общее понятие, "рекуррентная" сеть, то есть, в ней есть "циклы", которые, однако, не обязательно реализуются фактически. LSTM и GRU частные случаи RNN GRU придумана позднее LSTM. В обеих сетях есть "память", то есть, вектор, который сохраняется от цикла к циклу и влияет на решения сети. Подробные схемы можно найти в интернете. Все эти модели не оказались... Читать далее