Мне нужно сохранить количество воспроизведений на каждую секунду подкаста/аудиофайла. Это приведет к простому графику временной шкалы (например, графу «хиты» в Google Analytics) с секундами по оси х и воспроизведет по оси Y.Хранение огромного количества (простых) данных графика временной шкалы в БД
Однако эти подкасты могут продолжаться до 3 часов, а 100 000 пьес за каждую секунду нереальны. Это 10 800 секунд до 100 000 игр каждый. Очевидно, что сохранение каждого второго в своей строке нереалистично (это приведет к 1 миллиарду строк), поскольку я хочу иметь возможность быстро извлекать эти необработанные данные.
Итак, мой вопрос: как мне лучше всего хранить эти огромные объемы данных временной шкалы?
Одна из моих идей заключалась в том, чтобы использовать столбец text/blob, а затем запятую - разделить пьесы, каждая запятая представляющая новую секунду (последовательно), а затем число для количества раз, которое было воспроизведено. Так что если во второй секунде 100 000 пьес во втором 1 и 90 000 играх во втором 2 и 95 000 играх, я бы сохранил их так: «100000,90000,95000, [...]» в столбце text/blob.
Является ли это возможным способом хранения таких данных? Есть ли способ лучше?
Спасибо!
Редактировать: данные отслеживаются другим источником, и мне нужно обновлять необработанные данные графика каждые 15 минут или около того. Следовательно, быстрое чтение является основной задачей.
Примечание: из-за природы этого проекта, каждый из которых играет второй, нужно будет отследить индивидуально (другими словами, я не могу просто отслеживать «начало» и «конец» каждого воспроизведения).
Спасибо за это плюсы/минусы - очень полезно! Я смогу получить данные отслеживания в пакетах с интервалом 15 минут (= легко 1000 обновлений), поэтому это определенно плюс для подхода blob. Кроме того, мне нужно использовать эти данные только для графика временной шкалы, поэтому возможность запроса данных неважна. При этом я нахожу гибкость отдельных строк привлекательной (и, глядя на ответы, многие люди, похоже, чувствуют то же самое). Кажется, что blob-подход возможен, поэтому, я сделаю некоторое тестирование на обоих подходах и посмотрю, какой из них лучше всего работает на практике. –