Когда Pandas считывает ваш файл (например, с использованием pd.read_csv
) для построения DataFrame, он автоматически выбирает соответствующий тип данных (dtype
) для хранения данных по столбцам по столбцам. Это означает, что столбец десятичных чисел будет иметь тип float64
и т. Д.
Если у вас целых 236 столбцов, то, вероятно, проще всего позволить Pandas определить лучшие типы данных.
Даты могут быть более сложными для обработки, поэтому вам может потребоваться более четко указать, какие столбцы Pandas должны анализировать для типа datetime
. Вы можете сделать это после того, как вы построили DataFrame с помощью pd.to_datetime(df["System Time"])
.
Если же вы хотите, чтобы контролировать тип данных каждого столбца во время строительства, многие методы панды позволяют передать список или словарь имен столбцов и каковы их типы должны быть.
Например, если вы используете pd.read_csv
, вы можете использовать аргумент dtype
ключевого слова:
dtype
: имя Тип или Dict колонки -> Тип
тип данных для данных или колонны. Например. {'a': np.float64, 'b': np.int32}
Например, вы можете выбрать, чтобы построить вам DataFrame способом, подобным этому:
df = pd.read_csv('file.txt', names=["Temperature", "Alarm"],
dtypes=[np.float64, object])
нотабене В Pandas нет типа string
; такие значения обычно имеют тип данных object
.