2016-01-23 3 views
-1

Я следую примеру в this tutorial.Загрузка набора данных из моей локальной папки

Вместо загрузки набора данных следующим образом:

dataset = datasets.fetch_mldata("MNIST Original") 

Как я могу загрузить мой набор данные из моей «местной» папки? Существует ли конкретная структура данных для использования в этом примере?

Спасибо.

ответ

0

Я думаю, что ответ уже найден на странице вы предоставили

Мы делаем вызов к fetch_mldata функции на линии 13, которая загружает оригинального MNIST набора данных из mldata.org хранилища.

. Размер фактического массива примерно 55mb, так что это может занять некоторое время до . Однако после того, как набор данные загружаются кэшируются локально на вашей машине, так что вы не должны будете загрузить его снова

Это будет загрузить набор данных один раз, а затем использовать локально сохраненную копию.

Источник: http://www.pyimagesearch.com/2014/09/22/getting-started-deep-learning-python/

EDIT: Там некоторая информация о http://scikit-learn.org/stable/datasets/mldata.html, например,

В базе данных MNIST содержит в общей сложности 70000 примеров рукописных цифр размер 28x28 пикселей, помеченных от 0 до 9

и

После первой загрузки, набор данных кэшируется локально в пути , указанном аргументом ключевого слова data_home, который по умолчанию равен ~/scikit_learn_data/

+0

Спасибо за ваш ответ. Я хотел сказать свой «собственный» набор данных, а не MNIST. Это более ясно? Спасибо – Simplicity

+0

Затем используйте аргумент ключевого слова data_home. – zebralove79

0

Документация fetch_mldata состояний для параметра data_home:

указать другую загрузку и папку кэша для наборов данных. По умолчанию все данные изучения scikit хранятся в подпапках '~/scikit_learn_data'.

Он должен скачать там файл .mat, предположительно. Вы можете найти, как открыть .mat файлов в this question.

Смежные вопросы