У меня есть большая матрица - 1045506 x 3
, которую я хочу отсортировать, основываясь на 1-й колонке. Так как, это NumPy матрица, я могу использовать argsort, чтобы получить результатсортировка матрицы numpy на gpu
mat_sorted = mat[mat[:,0].argsort()]
Она занимает около 69ms
, чтобы завершить этот шаг, который, кажется, немного высоко для меня.
Вопрос в том, есть ли способ ускорить вычисление с использованием графического процессора? Я смотрел на некоторые библиотеки, такие как pycuda, theano, но мне трудно понять документацию. Специально, часть вокруг передачи numpy массивов и матриц в gpu. Любые указатели будут чрезвычайно полезны.
Интересный вопрос. Для меня не очевидно, есть ли простой способ распараллеливать операции сортировки в принципе. – roadrunner66
@ roadrunner66: google "radix sort". – talonmies