Я настаиваю, что процедуру правильно называть нормировкой. "Нормализация" массово вводит в заблуждение людей, мол, после нормализации данные будут нормально распределены, а это совсем не обязательно так (только если они и были нормально распределены и до процедуры). После нормировки они будут, разумеется, нормированы.
А ответ на вопрос - в целом, во всех. Иначе может понадобиться подбирать какие-то нестандартные learning rate и нестандартные начальные точки.
Кроме "целочисленных" методов, где числа отражают ранговую принадлежность, а алгоритм построен не на регрессии, а, например, на энтропии, как решающие деревья или случайный лес.