У меня есть генератор Python, который тянет в довольно огромную таблицу из хранилища данных. После ввода данных я обрабатываю данные с использованием сельдерея распределенным образом. После тестирования я понял, что генератор является узким местом. Он не может создать достаточные задачи для работы сельдерей. Это когда я решил оптимизировать свой генератор питона.Доступ к генераторам python параллельно с использованием модуля многопроцессорности
Более подробная информация о генераторе
Генератор попадет в хранилище данных с куском запросами и данными результатов запроса в основном независима друг от друга и лиц без гражданства. Поэтому я подумал, что это хороший кандидат для параллельного использования модуля multiprocessing
. Я посмотрел, как распараллелить генераторы без особого направления.
Так что, если мой генератор Python генерирует нечеткие куски данных, это должно быть хорошим кандидатом для многопроцессорной обработки? Есть ли способы распараллеливать генераторы python? Также есть ли какие-либо побочные эффекты, которые я должен знать об использовании параллелизма в генераторах Python?