Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Можно ли просто объяснить суть алгоритма AlfaZero (шахматы)?

ПрограммированиеМатематика+4
Igor Lytkin
Шахматы
  · 2,2 K
Увлекаюсь естественными науками и математикой. Разбираюсь в производстве корпусной...  · 16 окт 2021
Алгоритм перебора позиций AlphaZero использует обход дерева ходов методом Монте-Карло в отличие от традиционного альфа-бета перебора с эвристиками. Этот метод хотя и является гораздо более слабым сам по себе (более склонен к тактической "слепоте"), однако идеально параллелится, поэтому будучи запущенным на тензорных процессорах или CUDA ядрах позволяет выигрывать у альфа-бета перебора за счёт отсутствия потери скорости на распараллеливание.
Оценочная функция представляет собой не набор весов и эвристик, а многослойную искусственную нейронную сеть, каждый слой которой занимается вычленением из позиции тех или иных паттернов и сочетаний паттернов. Качественно натренированная нейронная сеть как бы "видит" угрозы - и явные, и потенциальные, тем самым защищая алгоритм перебора методом Монте-Карло от эффектов "слепоты", способствуя построению дерева в соответствии с паттернами с минимумом "зевков" при том, что скорость оценки через нейронную сеть в десятки тысяч раз ниже скорости расчёта традиционного набора эвристик.
В наше время сильнейший шахматный движок Stockfish 14 использует перебор по принципу альфа-бета; при этом где нужна грубая оценка, оценочная функция опирается на традиционные эвристики, а где требуется точность и на что можно выделить много времени - на искусственные нейронные сети.
1 эксперт согласен
Корректно и при этом доступно
Биограф Козьмы Пруткова  · 14 янв 2022
Я, честное слово(!), ничего не могу сказать про связку шахматы-алгоритм, но так как она меня интересует очень и очень осмелюсь свои 3 копейки внести. Я общался в свое время с крупными шахматистами, не с выдающимися, а с крупными, с мастерами, с мастерами международного класса, и изредка, за рюмкой чая, возникали вопросы о процессе осмысления игры. И вот. После... Читать далее
Вопрос к месту. Никогда люди не оценивают позицию так, как мякишные алгоритмы: "так, я контролирую открытую линию... Читать дальше