Вкратце: гарвардская архитектура слишком негибкая для массового использования.
Суть различий между ними в том, что фон Неймановская (a.k.a. принстонская) архитектура хранит команды так же, как и данные, а гарвардская хранит их раздельно. Из этого проистекает такая особенность архитектуры фон Неймана, что программный код можно изменять.
С одной стороны, это минус: системы на принстонской архитектуре более уязвимые, так как злоумышленники могут подменить команды и заставить компьютер выполнять не тот код, который должен выполняться. Поэтому гарвардская архитектура до востребована в критичных системах вроде ракет, АЭС и т.п.
Однако, это так же и весьма большой бонус. Хранение кодов таким же образом как и данные позволяет пользователям самостоятельно устанавливать и обновлять программы, потому что это происходит схожим с обычной обработкой данных. Таким образом сильно упрощается конфигурирование под нужды пользователей (на одинаковом железе один может играть в игры, другой работать с офисными данными, третий записывать музыку, а четвёртый запускать сервер, причём настроить они это могут самостоятельно), исправление ошибок (не надо отзывать физические устройства, а можно просто выкатить в интернет обновление, которое клиенты сами смогут установить), добавление нового функционала.
Причём возможностью удалённой работы пользуются все: начиная от вебсайтов, которые вчера показывали клиенту одно, а сегодня другое, заканчивая обновлениями микрокода процессоров. А иногда доступно только удалённое изменение кода. Представляете, тот же зонд "Вояджер", который улетел за границы Солнечной системы, был перепрограммирован тогда, когда был в районе Плутона. https://www.popularmechanics.com/space/a17991/voyager-1-voyager-2-retiring-engineer/
В общем, дешевизна и гибкость к изменениям сделали архитектуру фон Неймана господствующей.