В настоящее время я разрабатываю систему, которая следит за рангами/видами видео YouTube. из LOTS видеороликов youtube (> 500 000 и растущих) на ежедневной основе.Хранение и анализ исторических данных - какая база данных?
В настоящее время я рассматриваю возможность хранить это в базе данных MySQL, но меня беспокоит то, что таблица будет расти в миллиарды и триллионы строк, что, я думаю, не будет хорошо работать.
Мне нужно анализировать эти данные, например:
- Каких видео выросло много в период между X и Y
- Plot щелчков в день
- Plot щелчков в неделю .. .
- еще некоторые вещи, которые я не знаю еще о
Итак, что пришли в мой веб-2,0 ум был, есть способ базы данных NoSQL может справитесь с этим лучше? Я не совсем изучил эти (почти) новые базы данных и не знаю, на что они способны.
Каким будет ваш совет, какую базу данных использовать? Реляционные или нет? Если нет, то какая база данных NoSQL?
PS: первый приоритет является быстрая оценка и вставка результатов, вторая высокая доступность (или просто репликация)
с учетом производительности, побочный эффект: знаете ли вы, что facbeook построен на MySQL? – Chris
Да, я думаю, что прочитал это в какой-то момент. моя мотивация этого вопроса была в первую очередь моей заботой о «слишком больших таблицах» (не сгруппирована) и быстрой оценке этих исторических данных. Я в настоящее время экспериментирую на mysql, но я не уверен, правильно ли это выбрать. – Stefan
честно, если только слишком большие таблицы являются вашей прежней заботой, я не думаю, что вам придется беспокоиться, если: вы можете использовать индексы, чтобы сузить результаты поиска. Индексы используются как указатели строк, поэтому количество строк не повредит индекс, а просто указывает на эти строки справа ... – Chris