Эта моя задача на построение клона тернарных логических операций - удобна как бенчмарка. С такой особенностью, что должна быстрее работать на 64 битах, т.к. битовые массивы влазят в регистры общего назначения (на 32 битах не влазят).
Потому я её прогнал через разные компиляторы, - отбенчил сишные компиляторы по факту. На своём камне, естественно, - амд-шном. И вот такие результаты получил. Это без заточки под камень, т.е. generic 64-битный код.

В полной оптимизации: #(gcc 14.92) #(icc 15.97) #(msvc 33.86) #(clang 21.95). Опции в gcc - "Ofast", icc - "Qstd=c99" "fast", msvc - "O2", clang - "m64" "Ofast". Пробовал ещё всякие флаги, но быстрее не стало. Гцц заюзал из mingw (mingw64, естественно).
Когда-то, 10 (или 20?) лет назад считалось, что интеловский компилятор - самый быстрый. И возможно, до сих пор кто-то считает так же. Может, так и было когда-то, но теперь видно, что он отсосал у gcc. Гэцэцэ оптимизирует код круче, и пиздец.
Миф о невъебенности интеловского говна развеялся, и поделом. Вот помню, интел выёбывался, чтоб опустить у амд продажи, и сбросил поддержку амд камней в своём канпеляторе. Даже иск был такой от амд, но интели отбрыкались, вписав пару марктетинговых строчек в канпеляторный вывод типа "этот говноканпелятор не для всех процов канпелирует". Вот и довыёбывались.
Может, он никогда и не был круче, этот icc? Видно, как они, пуская пыль в глаза, включают по умолчанию максимальную оптимизацию, и ленивому программеру кажется, что он быстрее? Пока этот быдлопрогер не научится компилить с оптимизацией по скорости, которая нигде не включена по умолчанию, кроме icc.
Тут надо бы оговорки сделать, что это у меня амд проц, и возможно, на интеловском оно бы и не отсосало. Но нахуй нахуй, реверансы эти не нужны. Интел компелятор говно, процы говно, и корпорация эта говно. Амд тоже говно, но дешевле. Да и аутсайдерам по жизни - даже сочувствия какая-то толика полагается.