RNN -- общее понятие, "рекуррентная" сеть, то есть, в ней есть "циклы", которые, однако, не обязательно реализуются фактически.
LSTM и GRU частные случаи RNN
GRU придумана позднее LSTM.
В обеих сетях есть "память", то есть, вектор, который сохраняется от цикла к циклу и влияет на решения сети.
Подробные схемы можно найти в интернете.
Все эти модели не оказались такими успешными, как Трансформеры.