У меня есть текстовые файлы с множеством одинаковых строк, которые я бы хотел загрузить в базу данных mysql, но файлы не полностью однородны. В начале есть несколько строк для некоторой различной информации, и есть временные метки примерно каждые 6 строк.Загрузите неравномерные данные из txt-файла в базу данных msql
«LOAD DATA INFILE» не похоже на ответ здесь из-за моего формата файла. Это не кажется достаточно гибким.
Примечание: заголовок файла занимает предопределенное количество строк. Временная метка предикативна, но есть и другие случайные заметки, которые могут появиться, что нужно игнорировать. Они всегда начинаются с нескольких ключевых слов, которые я могу проверить.
Образец моего файла в середине:
103.3 .00035
103.4 .00035
103.5 .00035
103.6 .00035
103.7 .00035
103.8 .00035
103.9 .00035
Time: 07-15-2009 13:37
104.0 .00035
104.1 .00035
104.2 .00035
104.3 .00035
104.4 .00035
104.5 .00035
104.6 .00035
104.7 .00035
104.8 .00035
104.9 .00035
Time: 07-15-2009 13:38
105.0 .00035
105.1 .00035
105.2 .00035
От этого мне нужно загрузить информацию на три поля. Первым полем должно быть имя файла, а другое - в примере. Я мог бы добавить имя файла перед каждой линией данных, но это может быть необязательно, если я использую скрипт для загрузки данных.
При необходимости я могу изменить формат файла, но я не хочу потерять информацию о времени и заголовке.
SQLAlchemy кажется хорошим выбором для python, с которым я довольно хорошо знаком.
У меня есть тысячи строк данных, поэтому загрузка всех моих файлов, которые у меня уже есть, может быть медленной сначала, но потом я просто хочу загрузить в новые строки файла. Итак, мне нужно будет выбирать, что я загружаю, потому что я не хочу дублировать информацию.
Любые предложения по методу выборочной загрузки данных из текстового файла в базу данных mysql? И помимо этого, что вы предлагаете для загрузки только в строках файла, которые еще не находятся в базе данных?
Спасибо всем. Между тем, я рассмотрю SQLAlchemy немного больше и посмотрю, смогу ли я где-нибудь с этим справиться.
Это может работать для загрузки файла в первый раз, но как бы вы прочитали только последние несколько строк для обновления базы данных? – mouche
Используйте IGNORE LINES? – oggy