У меня есть цикл, который был распараллелен OpenMP, но из-за характера задачи есть 4 critical
.Как профилировать узкие места OpenMP
Что было бы лучшим способом профилировать скорость и выяснить, какое из критических предложений (или, возможно, некритическое (!)) Занимает наибольшее время внутри цикла?
Я использую Ubuntu 10.04 с г ++ 4.4.3
I Модифицировано оригинальное сообщение с дополнительной информацией – Mikhail
Я выполнил такую задачу с изменением источников библиотеки omp и добавлением к ним rdtsc's – osgx