Каковы недостатки или недостатки трех функций активации Sigmoid, Tanh и ReLu? Есть ли какие-либо улучшенные функции активации?

Question

Борис Державец · Accepted Answer

Сигмовидную и гиперболическую тангенсные функции активации нельзя использовать в сетях со многими слоями из-за проблемы исчезающего градиента. Выпрямленная линейная функция активации решает проблем...

Теперь Кью работает в режиме чтения

Каковы недостатки или недостатки трех функций активации Sigmoid, Tanh и ReLu? Есть ли какие-либо улучшенные функции активации?