У меня очень большой xml-файл на s3 (50gb). Я хотел бы передать этот файл в синтаксический анализатор sax xml для дальнейшей обработки с использованием ruby. Как я могу сделать это в среде, где я cannon загружать весь файл локально, но только передавать его по tcp из s3?Sax синтаксический анализ большого файла с S3
Я думаю об использовании https://github.com/ohler55/ox для его разбора и https://github.com/aws/aws-sdk-ruby для доступа к файлу на S3. Я просто не знаю, как соединить фрагменты с использованием потокового подхода?
https://amolnpujari.wordpress.com/2012/03/31/reading_huge_xml-rb/ –