Я собираюсь разбирать файл Викисловаря на многих языках (английском, японском и т. Д.). Отсюда (Parse Wiktionary XML data dump into MySQL database using PHP) Я вижу основную структуру. Но мой вопрос в том, что означают эти элементы?Кто-нибудь знает о структуре XML-файла Wiktionary?
Например, я думаю, что название под элементом страницы - это слово в словаре. Но где его перевод на другие языки? Где его синонимы?
Ниццы! Надеюсь, поможет! Теперь я просто читаю каждую строку в Python и извлекаю информацию. Но кажется, что исключения существуют повсюду, и трудно использовать правило для их извлечения. Хм ... – Shudong