java - Быстрый параллельный сортировка для ввода целых чисел без знака?

Я нахожусь в задаче сортировки нескольких больших массивов неподписанных, 64-битных, случайных генерируемых целых чисел (более 5E7 элементов). Можете ли вы направить меня на параллельный алгоритм сортировки, который может проявлять почти линейное ускорение, по крайней мере, в случае случайных данных?java - Быстрый параллельный сортировка для ввода целых чисел без знака?

Я работаю с Java, если это имеет какое-то значение в отношении быстрой сортировки.

Редактировать: Обратите внимание, что этот вопрос в первую очередь касается параллельных сортов, способных достичь почти линейного ускорения. (Значение, когда количество исполняющих ядер растет из P к 2P, время, затраченные на параллельной сортировке падает до 55 -. 50 процентов расчета, выполненных на P ядер)

источник

2012-03-20 coderodde

Что-то, что вы хотите реализовать или уже реализовано? Бывший, может быть, слияние? – Nim

btw - этот вопрос может помочь: http://stackoverflow.com/questions/2210185/correctly-multithreaded-quicksort-or-mergesort-algo-in-java – Nim

При поиске лучшей производительности может быть полезно узнать, какая производительность у вас есть, и какова ваша цель. Можете ли вы опубликовать некоторые цифры о том, как долго, скажем, 'Arrays.sort()' принимает и какую скорость вы хотите достичь? –

Ну если вы получил много памяти, вы можете использовать Bucketsort. Еще один алгоритм, который хорошо сочетается с параллелизмом является Quicksort

источник

2012-03-20 15:02:18 nist

Из статьи Википедии на Quicksort,

Как сортировка слиянием, быстрая сортировка может быть также распараллеливание из-за его разделяй и властвуй природы. Отдельные операции с локальным разделом трудно распараллелить, но после их разделения разные разделы список можно сортировать параллельно. Ниже приведен простой подход : если у нас есть процессоры, мы можем разделить список элементов на подсписные числа в среднем времени O (n), а затем отсортировать каждое из них в среднем . Игнорируя время предварительной обработки и слияния O (n), это линейное ускорение. Если сплит слепой, игнорируя значения, слияние наивно стоит O (n). Если разделенные разделы, основанные на последовательности , поворачиваются, сложно распараллелить и наивно стоить O (n). Учитывая O (log n) или больше процессоров, требуется только O (n) время, , тогда как подход с линейным ускорением достигнет времени O (log n) для общего.

Очевидно, что объединение является другой альтернативой. I думаю, quicksort дает лучшие средние характеристики.

источник

2012-03-20 15:02:33 smessing

Быстрый сортировка и сортировка слияния довольно легко распараллеливаются. Oracle имеет целочисленное объединение типа fork/join here, которое вы, вероятно, могли бы использовать (если не как-есть, то, по крайней мере, как вдохновение).

источник

2012-03-20 15:03:04 gustafc

Эти «легко распараллеливать» версии Merge-/Quicksort «наивно» параллельны, поскольку их соответствующие процедуры слияния/раздела в конце концов серийный, и не дают хороших результатов в соответствии с моими испытаниями. – coderodde

Скажите, что у вас есть несколько компьютеров (5 на кластере Amazon?), И вы хотите восходящую сортировку. Разделите свой массив на более мелкие куски, чтобы он соответствовал каждой машине. Предполагая, что у вас есть n кусков/массивов. Попросите каждую машину быстро съесть свой кусок. Эта сортировка будет параллельна (более или менее в зависимости от размера блока и скорости машины и т. Д.).

Когда закончите сориентирование, попросите машины слить куски;

Вы можете сделать это 2 способами:

2 машины в то время (вы создаете слияние дерева). Слияние произойдет снова, параллельно.Проблема в том, что массив станет большим из-за слияния, и вам придется кэшировать на диск, поэтому, когда вы снова объединяетесь, машина читает с диска. Так что некоторые штрафы здесь.
Вы можете делать n машин за раз. У вас есть одна машина координатора, которая берет мин из всех массивов других машин. Таким образом, машина-координатор создает весь отсортированный массив, беря наименьшее число из каждого из отсортированных массивов.

источник

2012-03-20 15:10:38 Adrian

Bitonic sort - это алгоритм, предназначенный для параллельных машин. Вот вам sequential Java version и parallel C++ version, чтобы помочь вам начать работу.

источник

2012-04-28 18:17:23 shams

java - Быстрый параллельный сортировка для ввода целых чисел без знака?

ответ

Смежные вопросы