Две метрики для выбора способа разделения дерева. Измерение Джини — это вероятность того,
что случайная выборка будет классифицирована неправильно, если мы случайно выберем метку
в соответствии с распределением в ветви.
==========================
Энтропия — это измерение информации,а именно ее отсутствия. Вы рассчитываете прирост информации,
делая разделение. Какая разница в энтриях. Это измерение того,как вы уменьшаете неопределенность в отношении метки.
Это формула примеси Джини

где (pi) — вероятность класса i в узле.
Энтропия для исследовательского анализа.
