Как распараллелить вычисление суммы в python numpy?

У меня есть сумма, которую я пытаюсь вычислить, и у меня возникают трудности с распараллеливанием кода. Расчет, который я пытаюсь распараллелить, является довольно сложным (он использует как массивы numpy, так и scipy разреженные матрицы). Он выплескивает массив numpy, и я хочу суммировать выходные массивы из примерно 1000 вычислений. В идеале я бы сохранил текущую сумму по всем итерациям. Однако я не смог понять, как это сделать.Как распараллелить вычисление суммы в python numpy?

До сих пор я пытался использовать функцию параллелизма joblib и функцию pool.map с пакетом многопроцессорности python. Для обоих из них я использую внутреннюю функцию, которая возвращает массив numpy. Эти функции возвращают список, который я конвертирую в массив numpy и затем суммирую.

Однако, после того, как функция joblib завершила все итерации, основная программа никогда не запускается (похоже, что исходное задание находится в состоянии ожидания, используя 0% CPU). Когда я использую pool.map, я получаю ошибки памяти после завершения всех итераций.

Есть ли способ просто распараллеливать текущую сумму массивов?

Редактировать: Цель состоит в том, чтобы сделать что-то вроде следующего, за исключением параллелизма.

def summers(num_iters): 

    sumArr = np.zeros((1,512*512)) #initialize sum 
    for index in range(num_iters): 
     sumArr = sumArr + computation(index) #computation returns a 1 x 512^2 numpy array 

    return sumArr

источник

2012-01-30 Kevin

Вы должны попытаться опубликовать минимальный примерный код. Вы пытаетесь выполнить свертку? – Simon

Нет, я не делаю свертку. Я вращаю изображение около 1000 раз, и мне нужно суммировать результат с каждого поворота. Для pool.map я просто использую 'outputArr = np.array (pool.map (parloop, range (num_views)))' where 'parloop' возвращает массив numpy. – Kevin

Может быть, это уже параллель? «поскольку numpy знает, что вы хотите сделать продукт с матричной точкой, он может использовать оптимизированную реализацию, полученную как часть« BLAS »(подпрограммы базовой линейной алгебры). ... у многих архитектур теперь есть BLAS, который также использует многоядерную машину Если ваш numpy/scipy скомпилирован с использованием одного из них, то точка() будет вычисляться параллельно (если это будет быстрее) **, если вы ничего не сделаете **. " www.scipy.org/ParallelProgramming – endolith

я понял, как сделать параллелизовать сумму массивов с многопроцессорной, apply_async и обратные вызовы, поэтому я отправляю это здесь для других людей. Я использовал the example page for Parallel Python для класса обратного вызова Sum, хотя я фактически не использовал этот пакет для реализации. Тем не менее, это дало мне возможность использовать обратные вызовы. Вот упрощенный код для того, что я использовал, и он делает то, что я хотел.

import multiprocessing 
import numpy as np 
import thread 

class Sum: #again, this class is from ParallelPython's example code (I modified for an array and added comments) 
    def __init__(self): 
     self.value = np.zeros((1,512*512)) #this is the initialization of the sum 
     self.lock = thread.allocate_lock() 
     self.count = 0 

    def add(self,value): 
     self.count += 1 
     self.lock.acquire() #lock so sum is correct if two processes return at same time 
     self.value += value #the actual summation 
     self.lock.release() 

def computation(index): 
    array1 = np.ones((1,512*512))*index #this is where the array-returning computation goes 
    return array1 

def summers(num_iters): 
    pool = multiprocessing.Pool(processes=8) 

    sumArr = Sum() #create an instance of callback class and zero the sum 
    for index in range(num_iters): 
     singlepoolresult = pool.apply_async(computation,(index,),callback=sumArr.add) 

    pool.close() 
    pool.join() #waits for all the processes to finish 

    return sumArr.value

Я также смог получить эту работу, используя параллельную карту, которая была предложена в другом ответе. Я пробовал это раньше, но я не реализовал его правильно. Оба способа работают, и я думаю, что this answer объясняет вопрос о том, какой метод использовать (map или apply.async) довольно хорошо. Для версии карты вам не нужно определять класс Sum, а функция summers становится

def summers(num_iters): 
    pool = multiprocessing.Pool(processes=8) 

    outputArr = np.zeros((num_iters,1,512*512)) #you wouldn't have to initialize these 
    sumArr = np.zeros((1,512*512))    #but I do to make sure I have the memory 

    outputArr = np.array(pool.map(computation, range(num_iters))) 
    sumArr = outputArr.sum(0) 

    pool.close() #not sure if this is still needed since map waits for all iterations 

    return sumArr

источник

2012-02-01 20:42:40 Kevin

Я не уверен, что понимаю проблему. Вы просто пытаетесь разбить список на пул работников, заставить их сохранить текущую сумму своих вычислений и суммировать результат?

#!/bin/env python 
import sys 
import random 
import time 
import multiprocessing 
import numpy as np 

numpows = 5 
numitems = 25 
nprocs = 4 

def expensiveComputation(i): 
    time.sleep(random.random() * 10) 
    return np.array([i**j for j in range(numpows)]) 

def listsum(l): 
    sum = np.zeros_like(l[0]) 
    for item in l: 
    sum = sum + item 
    return sum 

def partition(lst, n): 
    division = len(lst)/float(n) 
    return [ lst[int(round(division * i)): int(round(division * (i + 1)))] for i in xrange(n) ] 

def myRunningSum(l): 
    sum = np.zeros(numpows) 
    for item in l: 
    sum = sum + expensiveComputation(item) 
    return sum 

if __name__ == '__main__': 

    random.seed(1) 
    data = range(numitems) 

    pool = multiprocessing.Pool(processes=4,) 
    calculations = pool.map(myRunningSum, partition(data,nprocs)) 

    print 'Answer is:', listsum(calculations) 
    print 'Expected answer: ', np.array([25.,300.,4900.,90000.,1763020.])

(статсумма исходя из Python: Slicing a list into n nearly-equal-length partitions)

источник

2012-01-31 02:12:16

Спасибо за ваш ответ, но я хотел сохранить текущую сумму за несколько итераций, не суммируя по всем спискам в конце. Я вращаю изображение около 1000 раз, и мне нужно суммировать результат вычисления от каждого поворота. Я думаю, что я понял, как это сделать, и отправил его в качестве ответа. – Kevin

Является ли один массив для каждого процессора действительно такой большой сделкой? Таким образом, это не так. –

Как распараллелить вычисление суммы в python numpy?

ответ

Смежные вопросы