У меня есть таблица в mysql db, которая содержит 312 миллионов строк и 10 полей/столбцов. Я пытаюсь импортировать эти данные в R, используя библиотеку («RMySQL»), но это убивает мой рабочий стол (config 8 ГБ ОЗУ 64-разрядный двухъядерный процессор AMD под управлением Linux Mint 15) Есть ли эффективный способ импортировать все эти данные в Р ? Как использовать библиотеку «ff» и т. Д.?Импорт огромных данных из MySQL в R с помощью RMySQL
-2
A
ответ
3
Это не поместилось бы в вашу оперативную память без использования пакета «bigdata». Быстрая демонстрация с матрицей из 1 миллиона строк и 10 колоний:
> m <- matrix(runif(1e7), 1e6, 10)
> object.size(m)/1024/1024
76.2941360473633 bytes
Так что это занимает около 76 МБ ОЗУ. Ваши 312 миллиона строк будут примерно такими:
> object.size(m)/1024/1024 * 312
23803.7704467773 bytes
Так что около 24 ГБ ОЗУ.
Вам действительно нужно иметь все эти данные в ОЗУ? Почему не подмножество или агрегат внутри MySQL и не переходят к R, что действительно необходимо? Попробуйте dplyr.
Смежные вопросы
- 1. Импорт огромных данных в SQL с помощью .net
- 2. Подключиться к базе данных MySQL с помощью RMySQL
- 3. Rmysql dropping tables R language
- 4. Соединение с базой данных RMySQL
- 5. Импорт MySQL дампа в R (без сервера MySQL)
- 6. R dbBuildTableDefinition mysql rmysql ошибка записи таблицы
- 7. Запись дат с помощью RMySQL
- 8. RMYSQL- Insert Ignore, Replace -R
- 9. Импорт огромных музыкальных файлов в базу данных
- 10. Вставить в RMySQL из фрейма данных
- 11. R библиотека RMySQL не запускается
- 12. Mysql дамп с помощью R
- 13. ЗЕЬЕСТ из двух dataframes с помощью RMySQL
- 14. Импорт данных MySQL из xampp
- 15. Многобитовая строковая ошибка при записи в MySQL из R с помощью RMySQL dbWriteTable
- 16. Импорт данных из Excel в Mysql Python
- 17. Импорт данных с помощью MySQL Administrator
- 18. R и RMySQL, как получить имя базы данных для соединения?
- 19. Подключение к базе данных через пакет RMySQL в R 3.0.2
- 20. Импорт данных из Excel в MySQL с помощью C#
- 21. Импорт данных из Excel в MySql с помощью VB
- 22. Импорт данных в R
- 23. Импорт данных в R
- 24. Импорт огромных записей из Excel в MsAccess - ошибка подстрочного индекса
- 25. Добавить столбец в существующую таблицу mysql с помощью RMySQL
- 26. Экспорт/Импорт данных в MySQL с помощью MySQL Workbench
- 27. Импорт данных из Sybase в MySQL
- 28. Для R, ошибка в установке RMySQL пакет
- 29. Импорт данных из XML-файла в R
- 30. Импорт данных из файла JSON в R
Используйте read.dbi.ffdf из пакета ETLUtils. Он точно делает это, получает все ваши данные из SQL-запроса в ffdf (поэтому хранится на диске, а не в ОЗУ). В качестве примера с MySQL следуйте [этой ссылке] (http://bnosac.be/index.php/blog/21-readodbcffdf-a-readdbiffdf-for-fetching-large-corporate-sql-data). Если вы пробовали это, вы можете попытаться изменить свой вопрос на вопрос программирования - для чего нужен stackoverflow. – jwijffels