У меня есть файл csv с миллионами строк. Я использовал для создания словаря из файла CSV, как этотКак преобразовать Pandas Dataframe в csv-ридер непосредственно в python?
with open('us_db.csv', 'rb') as f:
data = csv.reader(f)
for row in data:
Create Dictionary based on a column
Теперь, чтобы фильтровать строки на основе некоторых условий, которые я использую панд Dataframe как это супер быстрый в этих операциях. Я загружаю csv, поскольку pandas Dataframe выполняет некоторую фильтрацию. Затем я хочу продолжать делать это. Я думал об использовании pandas df.iterrows() или df.itertuples(), но он очень медленный.
Есть ли способ конвертировать файл данных pandas в csv.reader() напрямую, чтобы я мог продолжать использовать вышеуказанный код. Если я использую csv_rows = to_csv()
, он дает длинную строку. Конечно, я могу выписать csv, а затем снова прочитать его. Но я хочу знать, есть ли способ пропустить дополнительное чтение и запись в файл.
Спасибо. Это сработало. Поскольку я использовал python2.7, мне пришлось использовать BytesIO вместо StringIO(), так как у меня были некоторые проблемы с кодировкой utf-8. – Raja