Для обучения нейронной сети необходимы обучающая, валидационная и тестовая выборки данных.
Поясню на примере разбивки данных для обучения нейронной сети предсказанию цены финансового актива.
Мы разбиваем датасет для обучения нейронки на обучающий xTrain и валидационную xVal выборки. На первой мы обучаем нейронную сеть (НС) на каждой эпохе, а на второй проверяем точность обучения. То есть, определяем насколько точно НС предсказывает цену. В процессе обучения НС меняет первоначальные веса таким образом, что бы уменьшить ошибку предсказания.
Но, в процессе такого обучения НС видит данные находящиеся в валидационной выборке и может приспосабливаться к ним (запоминать). По этому, для проверки точности обученной НС ей на предикт подают тестовые данные, которые НС не видела. Для представленной картинки это данные при времени более 65000 (их нет на рисунке).
Таким образом на тестовом наборе данных проверяется точность работы обученной сети.
История такова:
Изначально есть два набора: Тренировочный и Тестовый
- Тренировочный, чтобы обучить модель,
- Тестовый, чтобы проверить правильность работы модели до встраивания в бизнес-процесс (предсказание выдачи кредита)
Процедура обучения это творческий процесс, в котором надо чтобы модель уловила закономерности в многомерных данных. Существует эффект, когда... Читать далее