Я бы хотел добавить к сказанному выше, что gcc и его специфические порты имеют сотни вариантов кодогенератора под разные платформы (более 60 только в базовом коде), поэтому на вопрос в целом сложно ответить. Даже номинально архитектурно-независимые оптимизации, проводимые со внутренним представлением кода, могут иметь различную степень эффективности на разных вычислительных системах. Судя по тому, что gcc является одним из штатных компиляторов на многих суперкомпьютерных платформах, где машинное время стоит очень дорого, то, в целом, по крайней мере на некоторых архитектурах, он даёт неплохие результаты. Значительный вклад в gcc вносит, в частности, компания IBM (можно посмотреть обзор ресурсов на русском языке здесь ibm.com ) , но их, конечно, в основном интересуют архитектуры POWER и z.
Короче говоря, надо сравнивать эффективность кода на своей машине и своей задаче, чтобы получить корректный ответ.