3
ОК, так это то, что мне нужно:Получение конкретная «страница» из XML Википедии дампа
- Я скачал и извлек полную Википедия XML дампа (> 40GB, один файл XML)
- Мне нужно получить один конкретный элемент
<page>
(например, страница для записи «Италия»)
Как это сделать? (Желательно с помощью PHP-кода или какого-либо существующего инструмента)
@ Dagon Ну, очевидно. Точка * как *? Видите ли, я действительно боюсь иметь дело с таким огромным количеством данных: как насчет скорости? (поиск, учитывая, что сортировки нет, определенно займет довольно много времени, нет?) Кроме того, как насчет памяти? (Очевидно, не загружать весь документ в память) –
Любые обновления по этому вопросу? – user86895