Я собрал данные о количестве пропусков кеша L2 с использованием PAPI. Я запустил приложение MPI с 4 потоками (mpirun -np 4), и каждый поток читает промахи кеша в L2. Каждый поток выводит данные для каждой отметки времени. например:Как интерпретировать вывод Papi
Timestamp data
xxx530 thread# 0 2136
xxx531 thread# 0 3217
.. . .
. . .
. . .
. . .
xxx550 thread# 0 412334255
xxx530 thread #1 2456
xxx531 thread#1 4243
xxx532 thread #1 4567
and so on
Теперь мой qstn, является изгоняются ли я добавить все значения промахов кэша в момент времени штемпеля xxx530 для резьбы 0,1, 2 и 3 или изгоняются я взять максимальное-значение для thrreda0,1, 2,3 для отметки времени xxx530?
Вы можете изменить свою программу и не выполнять работу с памятью в каком-то потоке. Затем вы получите счетчик из этой темы и выберите вариант («Сумма» или «Макс» - другими словами - счетчик на потоке или счетчик System/CPU-wide) – osgx