2015-02-28 2 views
1

Как создать data.frames, содержащие несколько типов данных (строки, int, логические) и как непрерывные, так и факторы в Python Numpy?Data.Frames в Python Numpy

Следующий код делает мои заголовки Нэн и все, но мой поплавок значения Нэн

from numpy import genfromtxt 
my_data = genfromtxt('FlightDataTraining.csv', delimiter=',') 

Это ставит «b'data«»на все мои данные, например в том же году становится«b'year»»

import numpy as np 
d = np.loadtxt('FlightDataTraining.csv',delimiter=',',dtype=str) 
+0

Возможно, вы захотите ознакомиться с ['pandas'] (http://pandas.pydata.org/) – cel

ответ

1
  • Попробуйте genfromtxt('FlightDataTraining.csv', delimiter=',', dtype=None). Это говорит genfromtxt, чтобы разумно угадать dtype каждого столбца. Если это не сработает, отправьте образец своего CSV и должен выглядеть нужный результат.

  • b в b'data' является способностью Python представлять bytes as opposed to str objects. Так что b'data' в порядке. Если вы хотите str s, вам нужно будет декодировать байты.

  • NumPy не имеет dtype для представления факторов, хотя Pandas имеет pd.Categorical type.

+0

Отличный ответ. Я бы предположил, что вы добавляете 'skip_header' в вызов' genfromtxt'. @ user3711518 говорит, что у него проблемы с заголовками. Если 'dtype = None', заголовки заставят все столбцы интерпретироваться как строки вместо типа данных. – lucianopaz

Смежные вопросы