Я буду первым, кто признает, что я не самый умный человек в мире, но я нахожусь в убытке от этого.wiktionary - я не могу получить местную рабочую копию
Я хочу иметь доступ к словам и деталям каждого слова английского проекта Викисловаря. Я видел, как они делают дампы данных, и все взволнованы. Это продолжалось всего 3 секунды. С тех пор все, что я сделал, это клятвенно и дым в приступах разочарования и раздражения.
Я использую окна 7.
Я установил последнюю версию xampp (64 бит, установленную под root).
Я установил последнюю версию Java DK.
Я установил Xampp и JDK для запуска в качестве администратора.
Я захватил файлы статей.
Я распаковал их.
Я использовал инструмент mwxml2sql.
Я не мог заставить его работать (независимо от того, какие настройки/флаги я пытался).
Я использовал GUI-версию инструмента mwxml2sql.
Он бежал - и затем ошибся в 4300 строк.
Ошибка была связана с двойными ключами в name_title.
Я посмотрел на викокит, но это кажется несколько лет назад.
Я в затруднении.
Я просмотрел данные, которые попали в БД до ошибки с ошибкой.
Я могу видеть некоторые данные в формате Blob.
Как я могу получить доступ к этой информации через php?
Нет ли приличного (как в «идиотах»: D) руководство для этого?
Неужели мне нужно захватить все файлы, установить вики, проанализировать файлы?
Как я должен обрабатывать проблемы с обманом (не так, как я могу открыть файл sql и найти соответствующую строку!)?
Итак, пожалуйста - кто-нибудь сделал это или знал, как это сделать?
Единственное, что я могу придумать, это попробовать и очистить сайт, который я бы предпочел не делать (и не будет вики-группы).
В случае, если это уместно - я специально после словоформы, PoS, произношения, определения, любые фразы и связанные слова. Такие вещи, как этимология и т. Д., Были бы приятными, но не столь важными.
Если да, я просмотрел WordNet (удалось найти дамп mysql и получил эту работу). Я также видел такие ресурсы, как MRC и диплом CMU, но ни один из них не имеет правильных разрешений. Вот почему Викисловарь выглядел так привлекательно. Но, кажется, что формат/отвалы далеки от дружественных :(
Таким образом, любая помощь или идеи? Альтернативные источники, гиды, проходных ... все это поможет.
С другой стороны, если вы можете сказать мне, что вызывает ошибку и как ее обойти, и как получить доступ к данным слова, что было бы превосходно.
Sincerley yours - разочарование.
Привет, Андрей, и спасибо за ответ. || Я пытаюсь использовать файл 20150413.sql. Я создал пустой db, отключил автоматическую фиксацию, уникальные проверки и внешние ключи, я увеличил пределы mem для innodb. Но это ошибка (что-то о вводе нулевого значения). || Я пытаюсь снова проверить, могу ли я скопировать полное сообщение об ошибке. –
Хорошо, 2 часа; 10.1Gb (4.5Gb data/5.6Gb index) - он в последний раз разбился на 11.9Gb (5.2Gb/6.7Gb) ... так близко ... как только это будет ошибкой, я отправлю сообщение об ошибке (я не могу верю, что мне нужно потратить 2 часа, чтобы получить ошибку!) –
Хорошо - поэтому cmd crashed @ 11.5Gb (5/6.5) ... нет сообщения об ошибке, всего лишь тонны звуковых сигналов. Нет ли альтернативного метода, кроме этого? Хотя мне нужны эти данные, я могу лучше соскоблить Викисловарь, который растрачивает дни, обмахивающие огромными глоссами данных, которые просто приводят к ошибкам. –