Со ссылкой на following overload метода Parallel.ForEach
статического расширения:
public static ParallelLoopResult ForEach<TSource, TLocal>(
IEnumerable<TSource> source,
Func<TLocal> localInit,
Func<TSource, ParallelLoopState, TLocal, TLocal> taskBody,
Action<TLocal> localFinally
)
В вашем конкретном примере
Линия:
() => 0, // method to initialize the local variable
просто лямбда (анонимной функции), который вернет постоянное целое число.Эта лямбда передается в качестве параметра Parallel.ForEach
localInit
- с лямбдой возвращает целое число, оно имеет тип Func<int>
и тип TLocal
может быть выведена, как int
компилятором (аналогично, TSource
может быть выведен из типа коллекции, переданный в качестве параметра source
)
Возвращаемое значение (0) затем передается как 3-й параметр (с именем subtotal
) на taskBody
Func
. Это (0) используется начальное семя для контура тела:
(j, loop, subtotal) =>
{
subtotal += nums[j]; //modify local variable (Bad idea, see comment)
return subtotal; // value to be passed to next iteration
}
Этот второй лямбда (передаваемый taskBody
) называется N раз, где N является количество элементов, выделенных для этой задачи с помощью секционирования TPL.
Каждый последующий вызов второго taskBody
лямбда будет проходить новое значение subTotal
, эффективного вычисления работает частичной общей сложности, для выполнения этой задачи. После того, как все элементы, назначенные этой задаче, будут добавлены, будет вызываться третий и последний параметр функции localFinally
, опять же, передав окончательное значение subtotal
, возвращенному с taskBody
. Поскольку несколько таких задач будут работать параллельно, также необходимо будет сделать заключительный шаг, чтобы скомпоновать все частичные итоги в итоговую итоговую сумму. Однако, поскольку несколько одновременных задач (в разных потоках) могут конкурировать за переменную grandTotal
, важно, чтобы изменения в ней выполнялись поточно-безопасным образом.
(я изменил имена переменных MSDN, чтобы сделать его более ясным)
long grandTotal = 0;
Parallel.ForEach(nums, // source collection
() => 0, // method to initialize the local variable
(j, loop, subtotal) => // method invoked by the loop on each iteration
subtotal + nums[j], // value to be passed to next iteration subtotal
// The final value of subtotal is passed to the localFinally function parameter
(subtotal) => Interlocked.Add(ref grandTotal, subtotal)
В примере MS, модификация параметра итога внутри тела задачи является плохой практикой, и ненужным. т.е. код subtotal += nums[j]; return subtotal;
будет лучше, как только return subtotal + nums[j];
, которые могут быть сокращены до проекции лямбды сокращенного (j, loop, subtotal) => subtotal + nums[j]
В общем
В localInit/body/localFinally
перегруженных Parallel.For/Parallel.ForEach позволяют один раз на задачу инициализации и коды очистки в (до) и после (соответственно) итерации taskBody
выполняются Задачей.
(отмечая Для диапазона/перечислимых передается параллельно For
/Foreach
будет разделена на партии IEnumerable<>
, каждый из которых будет выделена задача)
В каждой задаче, localInit
будет вызываться один раз , код body
будет повторно вызываться, один раз за элемент в партии (0..N
раз), а localFinally
будет вызываться один раз после завершения.
Кроме того, вы можете передать любое состояние, необходимое для длительности задачи (т.е. к делегатам taskBody
и localFinally
) с помощью общего TLocal
возвращаемого значения из localInit Func
- Я назвал эту переменную taskLocals
ниже.
Общие использования «localInit»:
- Создание и инициализация дорогостоящих ресурсов, необходимых тела цикла, как соединение с базой данных или подключения веб-службы.
- Ведение Task-Локальные переменных для хранения (uncontended) погонных итогов или коллекций
- Если вам нужно возвратить несколько объектов из
localInit
в taskBody
и localFinally
, вы можете использовать строго типизированный класс, а Tuple<,,>
или, если вы используете только lambdas для localInit/taskBody/localFinally
, вы также можете передавать данные через анонимный класс. Обратите внимание, если вы используете возврат из localInit
, чтобы поделиться ссылочным типом между несколькими задачами, вам нужно будет рассмотреть проблему безопасности потоков на этом объекте - неизменность предпочтительнее.
Общие использования акции "localFinally":
- освободить ресурсы, такие как
IDisposables
, используемые в taskLocals
(соединений например, баз данных, файловых дескрипторов, клиентов веб-служб и т.д.)
- Чтобы агрегировать/объединить/сократить работу, выполняемую каждой задачей, обратно в общую переменную (ы). Эти общие переменные будут рассмотрены, поэтому проблема безопасности потоков является проблемой:
- , например.
Interlocked.Increment
на примитивных типов, таких как целые числа
lock
или подобное будет требоваться для операций записи
- воспользоваться concurrent collections, чтобы сэкономить время и усилия.
taskBody
является tight
части операции петли - вы хотите, чтобы оптимизировать это для повышения производительности.
Это все лучше суммированы с комментариями, например:
public void MyParallelizedMethod()
{
// Shared variable. Not thread safe
var itemCount = 0;
Parallel.For(myEnumerable,
// localInit - called once per Task.
() =>
{
// Local `task` variables have no contention
// since each Task can never run by multiple threads concurrently
var sqlConnection = new SqlConnection("connstring...");
sqlConnection.Open();
// This is the `task local` state we wish to carry for the duration of the task
return new
{
Conn = sqlConnection,
RunningTotal = 0
}
},
// Task Body. Invoked once per item in the batch assigned to this task
(item, loopState, taskLocals) =>
{
// ... Do some fancy Sql work here on our task's independent connection
using(var command = taskLocals.Conn.CreateCommand())
using(var reader = command.ExecuteReader(...))
{
if (reader.Read())
{
// No contention for `taskLocal`
taskLocals.RunningTotal += Convert.ToInt32(reader["countOfItems"]);
}
}
// The same type of our `taskLocal` param must be returned from the body
return taskLocals;
},
// LocalFinally called once per Task after body completes
// Also takes the taskLocal
(taskLocals) =>
{
// Any cleanup work on our Task Locals (as you would do in a `finally` scope)
if (taskLocals.Conn != null)
taskLocals.Conn.Dispose();
// Do any reduce/aggregate/synchronisation work.
// NB : There is contention here!
Interlocked.Add(ref itemCount, taskLocals.RunningTotal);
}
И еще примеры:
Example of per-Task uncontended dictionaries
Example of per-Task database connections
() => не инициализирует ничего, возвращаемое значение этой функции будет использоваться для инициализации локальной переменной (промежуточный итог в вашем примере). –