2010-05-01 2 views
3

В настоящее время я пытаюсь оптимизировать код, испускаемый из самодельного компилятора, для домашнего текста.Оптимизация ассемблера Intel

Я опробовал Intel VTune, чтобы увидеть, где узкие места являются: http://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png

Я нахожу это очень впечатляет, что «subl» -instruction несет ответственность за более чем 38% от clockticks в программе, работающей на 30 -90 секунд! Может ли кто-нибудь объяснить, почему?

Функция «оптимизационного отчета» в VTune, по-видимому, не существует для программ, не скомпилированных с помощью icc. Существует ли программа, которая предлагает оптимизацию для ассемблерного кода? (то есть не код, поступающий с языка высокого уровня).

ответ

2

Мое предположение, что это инструкция idivl, которая на самом деле занимает 38% ... деление, занимающее больше времени, имеет немного больше смысла, чем вычитание нет?

+0

Уверенный, подзаголовок должен ждать выполнения idivl ... –

Смежные вопросы