В настоящее время я пытаюсь оптимизировать код, испускаемый из самодельного компилятора, для домашнего текста.Оптимизация ассемблера Intel
Я опробовал Intel VTune, чтобы увидеть, где узкие места являются: http://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png
Я нахожу это очень впечатляет, что «subl» -instruction несет ответственность за более чем 38% от clockticks в программе, работающей на 30 -90 секунд! Может ли кто-нибудь объяснить, почему?
Функция «оптимизационного отчета» в VTune, по-видимому, не существует для программ, не скомпилированных с помощью icc. Существует ли программа, которая предлагает оптимизацию для ассемблерного кода? (то есть не код, поступающий с языка высокого уровня).
Уверенный, подзаголовок должен ждать выполнения idivl ... –