Я пытаюсь оптимизировать производительность теста MPI + CUDA под названием LAMMPS (https://github.com/lammps/lammps). Сейчас я работаю с двумя процессами MPI и двумя графическими процессорами. Моя система имеет два разъема, и каждый разъем подключается к 2 K80. Поскольку каждый K80 содержит 2 графических процессора внутри, каждый разъем фактически подключается к 4 графическим процессорам. Но я использую только 2 ядра в одном сокете и 2 GPU (1 K80), подключенные к этому сокету. Компилятор MPI - MVAPICH2 2.2rc1, а версия компилятора CUDA - 7.5.CIDA-MPI для двух графических процессоров в пределах одного K80
Это был фон. Я профилировал приложение и нашел, что сообщение было узким местом производительности. И я подозреваю, что это связано с тем, что не применялась техника GPUDirect. Поэтому я переключаюсь на MVAPICH2-GDR 2.2rc1 и устанавливаю все другие необходимые библиотеки и инструменты. Но MVAPICH2-GDR требует интерфейсной карты Infiniband, которая недоступна в моей системе, поэтому у меня ошибка времени выполнения. Ошибка инициализации канала. В системе нет активных HCAs. Исходя из моего понимания, карта Infiniband не требуется, если мы хотим использовать только графические процессоры в пределах 1 K80 на одном узле, потому что у K80 есть внутренний PCIe-переключатель для этих двух графических процессоров. Это мои сомнения. Чтобы устранить эти вопросы, я перечисляю их следующим образом:
В моей системе один разъем подключается к двум K80. Если два GPU в одном K80 должны взаимодействовать с графическими процессорами в другом K80, тогда у нас должна быть IB-карта, если мы хотим использовать GPUDirect, верно?
Если нам нужно использовать только два графических процессора в пределах 1 K80, тогда связь между этими двумя графическими процессорами не требует платы IB, правильно? Однако MVAPICH2-GDR требует, по крайней мере, одну карту IB. Итак, есть ли способ обхода проблемы? Или мне нужно подключить IB-карту в системе?
Спасибо, Роберт. Вы объясните это очень ясно. Наконец, я понимаю различия и связи между этими терминами. –