Я хочу прокрутить дамп Википедии в формате XML и для каждой ревизии хочу сохранить временную метку и комментарий, если ревизия производится определенным именем пользователя. Это возможно? Я пытаюсь ознакомиться с lxml.Извлечь данные из XML-файла, если аргументы имеют определенные значения.
<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.org/xml/export-0.10.xsd" version="0.10" xml:lang="en">
<siteinfo>
<sitename>Wikipedia</sitename>
<dbname>enwiki</dbname>
<base>https://en.wikipedia.org/wiki/Main_Page</base>
<generator>MediaWiki 1.27.0-wmf.18</generator>
<case>first-letter</case>
<namespaces>...</namespaces>
</siteinfo>
<page>
<title>Zhuangzi</title>
<ns>0</ns>
<id>42870472</id>
<revision>
<id>610251969</id>
<timestamp>2014-05-26T20:08:14Z</timestamp>
<contributor>
<username>White whirlwind</username>
<id>8761551</id>
</contributor>
<comment>...</comment>
<model>wikitext</model>
<format>text/x-wiki</format>
<text xml:space="preserve" bytes="41">#REDIRECT [[Zhuang Zhou]] {{R from move}}</text>
<sha1>9l31fcd4fp0cfxgearifr7jrs3240xl</sha1>
</revision>
<revision>...</revision>
<revision>...</revision>
<revision>...</revision>
<revision>...</revision>
<revision>...</revision>
</page>
<page>...</page>
</mediawiki>
Какие инструменты вы нашли для чтения XML-данных и какого кода вы пытались использовать для выполнения своих задач? –