Это «большой» вопрос, который я не знаю, с чего начать, поэтому я надеюсь, что некоторые из вас могут дать мне направление. И если это не «хороший» вопрос, я закрою поток с извинениями.Как анализировать базу данных статьи Википедии с помощью R?
Я хочу пройти через базу данных Википедии (скажем, на английском) и делать статистику. Например, меня интересует, сколько активных редакторов (которые должны быть определены) Wikipedia имели в каждый момент времени (скажем, за последние 2 года).
Я не знаю, как создать такую базу данных, как получить к ней доступ, узнать, какие типы данных она имеет и так далее. Итак, мои вопросы:
- Какие инструменты нужны для этого (помимо базового R)? MySQL на моем компьютере? Подключение базы данных RODBC?
- Как вы начинаете планировать такой проект?
Является ли википедия «базой данных» как свалка базы данных? – SeanJA
Привет, похоже, это выглядело бы так ... –