Я написал многооконный код обнаружения лица, используя opencv face detector. Я запускаю пять детекторов (обученных для разных углов позы) над изображением и беря их веса для обнаружения лиц в изображении. Я сделал код параллельным, используя TBB parallel_for, но он улучшил производительность всего за 1,7 раза. Я хотел бы спросить, есть ли лучший способ одновременного запуска пяти детекторов?TBB parallel_for с меньшим количеством потоков
Я запускаю свой код на кластере с 16-ядерными ядрами. Я думаю, что количество потоков (в моем случае 5) слишком мало, чтобы использовать полную мощность.
Любые предложения?
Спасибо,