2015-10-11 3 views
0

Я буду первым, кто признает, что я не самый умный человек в мире, но я нахожусь в убытке от этого.wiktionary - я не могу получить местную рабочую копию

Я хочу иметь доступ к словам и деталям каждого слова английского проекта Викисловаря. Я видел, как они делают дампы данных, и все взволнованы. Это продолжалось всего 3 секунды. С тех пор все, что я сделал, это клятвенно и дым в приступах разочарования и раздражения.

Я использую окна 7.
Я установил последнюю версию xampp (64 бит, установленную под root).
Я установил последнюю версию Java DK.
Я установил Xampp и JDK для запуска в качестве администратора.
Я захватил файлы статей.
Я распаковал их.
Я использовал инструмент mwxml2sql.
Я не мог заставить его работать (независимо от того, какие настройки/флаги я пытался).
Я использовал GUI-версию инструмента mwxml2sql.
Он бежал - и затем ошибся в 4300 строк.
Ошибка была связана с двойными ключами в name_title.

Я посмотрел на викокит, но это кажется несколько лет назад.

Я в затруднении.

Я просмотрел данные, которые попали в БД до ошибки с ошибкой.
Я могу видеть некоторые данные в формате Blob.
Как я могу получить доступ к этой информации через php?

Нет ли приличного (как в «идиотах»: D) руководство для этого?
Неужели мне нужно захватить все файлы, установить вики, проанализировать файлы?
Как я должен обрабатывать проблемы с обманом (не так, как я могу открыть файл sql и найти соответствующую строку!)?

Итак, пожалуйста - кто-нибудь сделал это или знал, как это сделать?
Единственное, что я могу придумать, это попробовать и очистить сайт, который я бы предпочел не делать (и не будет вики-группы).

В случае, если это уместно - я специально после словоформы, PoS, произношения, определения, любые фразы и связанные слова. Такие вещи, как этимология и т. Д., Были бы приятными, но не столь важными.

Если да, я просмотрел WordNet (удалось найти дамп mysql и получил эту работу). Я также видел такие ресурсы, как MRC и диплом CMU, но ни один из них не имеет правильных разрешений. Вот почему Викисловарь выглядел так привлекательно. Но, кажется, что формат/отвалы далеки от дружественных :(

Таким образом, любая помощь или идеи? Альтернативные источники, гиды, проходных ... все это поможет.
С другой стороны, если вы можете сказать мне, что вызывает ошибку и как ее обойти, и как получить доступ к данным слова, что было бы превосходно.

Sincerley yours - разочарование.

ответ

0

Я посмотрел на wikokit - но кажется, что через несколько лет позади.

Нет, wikokit проект жива :) ссылка: https://github.com/componavt/wikokit

Вы можете скачать разобранную базу данных Английского Приложения: http://whinger.krc.karelia.ru/soft/wikokit/index.html загрузить файл SQL дампа MySQL и играть с определениями, синонимами и переводами извлеченными из английской Викисловарь.

+0

Привет, Андрей, и спасибо за ответ. || Я пытаюсь использовать файл 20150413.sql. Я создал пустой db, отключил автоматическую фиксацию, уникальные проверки и внешние ключи, я увеличил пределы mem для innodb. Но это ошибка (что-то о вводе нулевого значения). || Я пытаюсь снова проверить, могу ли я скопировать полное сообщение об ошибке. –

+0

Хорошо, 2 часа; 10.1Gb (4.5Gb data/5.6Gb index) - он в последний раз разбился на 11.9Gb (5.2Gb/6.7Gb) ... так близко ... как только это будет ошибкой, я отправлю сообщение об ошибке (я не могу верю, что мне нужно потратить 2 часа, чтобы получить ошибку!) –

+0

Хорошо - поэтому cmd crashed @ 11.5Gb (5/6.5) ... нет сообщения об ошибке, всего лишь тонны звуковых сигналов. Нет ли альтернативного метода, кроме этого? Хотя мне нужны эти данные, я могу лучше соскоблить Викисловарь, который растрачивает дни, обмахивающие огромными глоссами данных, которые просто приводят к ошибкам. –

Смежные вопросы