Я работаю над приложением, которое необходимо хранить большой 2GB + файл XML для обработки, и я столкнулся с двумя проблемами:Хранение и обработка больших файлов XML с помощью Heroku?
- Как обработать этот файл? Загрузка всего файла в Нокигири сразу не сработает. Он быстро поглощает память, и, насколько я могу судить, процесс сбрасывается с орбиты. Существуют ли совместимые с Heroku способы быстрого/легкого чтения большого XML-файла, расположенного на сервере без Heroku, в небольших кусках?
- Как сохранить файл? Сайт настроен на использование S3, но провайдеру данных необходим FTP-доступ для загрузки XML-файла в ночное время. S3 через FTP, по-видимому, не работает, и сохранение файла на Heroku тоже не будет работать, так как это будет видно только дино, которому принадлежит его, и подвержено случайному удалению. Кто-нибудь сталкивался с этим типом ограничений раньше, и если да, то как вы его обходите?
Используйте расширенный VTD-XML, вы можете сделать xpath (полный набор) по XML-файлам размером до 256 ГБ. –