Я пытаюсь диагностировать ошибку распределения памяти, которую я использовал ibv_reg_mr() в программном обеспечении, которое я использую, и мое подозрение в том, что оно связано с известными проблемами с некоторыми картами Mellanox Infiniband, где максимальная память по умолчанию, которая может зарегистрировано около 2 ГБ (см. часто задаваемые вопросы № 18 здесь http://www.open-mpi.org/faq/?category=openfabrics).найти максимально допустимый ibv_reg_mr
Я хотел бы иметь возможность подтвердить, что это так или нет, поэтому я могу быстро обсудить решение с моими системными администраторами. Будучи незнакомым с RDMA и Infiniband, кто-то может предложить либо (a) простую программу, которая могла бы регистрировать произвольные объемы памяти, чтобы я мог вызвать ошибку с максимально допустимым значением, либо (b) предложить способ, которым я может определить способ настройки Infiniband, учитывая, что у меня нет доступа root?
Спасибо всем!
Jason
Христос, отличный ответ. Благодаря! –
Простое наблюдение за этим: Если для параметра log_num_mtt установлено значение 0 (что в моем случае), это означает, что параметр _actually_ zero? Может ли это означать, что это настройка по умолчанию? В руководстве для OFED 1.5.3 указано, что по умолчанию это значение равно 20. –
Это означает, что существует только один MTT (log2 из 1 равно 0). Вы проверяли настройки для обоих модулей? Также параметры модуля можно настроить в '/ etc/modprobe.d /' или что-то в этом роде. –