Как выбрать несколько строк, сравнив два столбца из файла hdf5 с помощью Pandas? Файл hdf5 слишком велик для загрузки в память. Например, я хочу выбрать строки, где столбец A и столбцы B равны. Файловый кадр сохраняется в файле 'mydata.hdf5'. Благодарю.выбирать строки, сравнивая столбцы с помощью HDFStore
import pandas as pd
store = pd.HDFstore('mydata.hdf5')
df = store.select('mydf',where='A=B')
Это не работает. Я знаю, что store.select ('mydf', где = 'A == 12') будет работать. Но я хочу, чтобы сравнить столбец A и B. Пример данных выглядит следующим образом:
A B C
1 1 3
1 2 4
. . .
2 2 5
1 3 3
Это опечатка: 'df = store.select ('mydf', где = 'A = B')'? не должно быть: 'df = store.select ('mydf', где = 'A == B')' i.e. 2 '==' s? – EdChum
@EdChum, спасибо за ваш быстрый ответ. Но оба «A = B» и «A == B» в порядке. Ошибка следующая: c: \ python33 \ lib \ site-packages \ pandas \ computation \ pytables.py в convert_value (self, v) 184 return TermValue (int (v), v, kind) 185 elif kind == u ('integer'): -> 186 v = int (float (v)) 187 return TermValue (v, v, kind) 188 elif kind == u ('float'): ValueError: не удалось преобразовать строку в float: 'chr_b' – Lee