У меня есть файл со следующими данными:Чтение в повторяющихся блоков данных с помощью панд и питона
2008 1 1 ATMOS CO2 = 382. ppm
SOIL LAYER NO
1 1 2 3 4 TOT
DEPTH(m) 0.01 0.10 0.33 0.64 0.81
BD 33kpa(t/m3) 1.48 1.48 1.48 1.50 1.53
SAND(%) 82.2 82.2 82.2 66.9 67.4
SILT(%) 5.3 5.3 9.8 23.1 19.6
CLAY(%) 12.5 12.5 8.0 10.0 13.0
WHSC(kg/ha) 525. 4729. 4480. 6119. 1114. 16968.
WHPC(kg/ha) 1123. 10104. 9572. 13076. 2381. 36256.
WOC(kg/ha) 1717. 15455. 14638. 19995. 3641. 55.
2008 12 31 ATMOS CO2 = 382. ppm
SOIL LAYER NO
1 1 2 3 4 TOT
DEPTH(m) 0.01 0.10 0.33 0.64 0.81
BD 33kpa(t/m3) 1.48 1.48 1.48 1.50 1.53
SAND(%) 81.4 81.4 81.4 67.7 67.4
SILT(%) 6.5 6.5 10.3 22.3 19.6
CLAY(%) 12.1 12.1 8.2 10.0 13.0
WHSC(kg/ha) 499. 4559. 4291. 6017. 1117. 16483.
WHPC(kg/ha) 1123. 10109. 9576. 13081. 2382. 36271.
WOC(kg/ha) 1633. 14757. 13993. 19316. 3601. 53.
Каждый блок начинается с даты года, например 2008 1 1
обозначает 1 января 2008 года и 2008 12 31
обозначает 31-е декабря 2008 года.
В каждом блоке имеются значения для нескольких параметров, например. DEPTH, SAND (%), WOC и т. Д. Я хочу извлечь значения для WOC для пользователя в этом году и день и месяц, например. 2008 12 31 и для конкретной колонки, например. TOT. Я могу читать dataframe, но не уверен, что это лучший способ, чтобы продолжить после этого:
df = pandas.read_csv('data.txt')
Я не думаю, что вы в конечном итоге читать это все на одном дыхании с пандами. Вам, вероятно, нужно открыть файл, он может идти по очереди. –
Вам нужен год, месяц и день до 3 столбцов или один в качестве даты? – jezrael