Я пытаюсь запустить некоторые контролируемые эксперименты с помощью простого текстового классификатора, но у меня возникают проблемы с памятью при использовании генератора K Fold
в Sklearn
. Ошибка, которую я получаю, гласит: «В вашей системе закончилась память приложения», но мой набор данных составляет всего ~ 245 тыс. Строк х ~ 81 тыс. Столбцов. Большой, правда, но не огромный. Программа никогда не заканчивается, а скорее «зависает», пока я вручную не закрою приложение терминала. Я позволил ему работать примерно так 30 минут, без каких-либо успехов.Sklearn K-Fold Cross Validation Memory Issues
Я также написал в print
утверждениях, чтобы увидеть, где в перекрестной проверке for-loop код застревает. Похоже, что генерируются индексы для тренировочных и тестовых наборов, но код никогда не доходит до того, чтобы нарезать фактические обучающие и тестовые наборы для функций и меток, используя эти индексы. Я запускаю это на Macbook Pro, работающем 10.9.5. Я запустил это закрытие всех других приложений, кроме приложения Terminal, без каких-либо успехов. У кого-нибудь еще были проблемы с этим или это, вероятно, что-то специфическое для моей машины?
EDIT: Я выполнил это с 10-кратной и 5-кратной проверкой креста и каждый раз сталкивался с теми же проблемами.
Простой вопрос: вы используете 64-битную версию и сколько памяти у вас на вашем ноутбуке? – EdChum
Спасибо, что посмотрели @EdChum. Я запускаю 64-битную версию и имею 8 ГБ памяти. – kylerthecreator
Еще один простой вопрос - можете ли вы запустить его на тренировочном наборе с CV? То есть, CV является причиной проблемы? –