У меня есть DataFrame, в котором столбец может иметь три типа значений, целые числа (12331), целые числа в виде строк ('345') или некоторые другие строки («текст»).Игнорирование нечисловых строковых значений в pandas dataframe
Есть ли способ удалить все строки с последним видом строки из dataframe и преобразовать первый тип строки в целые числа? Или, по крайней мере, каким-то образом игнорировать строки, которые вызывают ошибки типа, если я суммирую столбец.
Этот блок данных предназначен для чтения довольно большого CSV-файла (25 ГБ), поэтому я хотел бы, чтобы какое-то решение работало при чтении в кусках.
Поскольку NaN создается после чтения, будут ли эти значения удалены, если я установил na_values = 'NaN' и выполнил drop_na? – devil0150
@ devil0150 Да, делаю 'dropna()', как только вы конвертируете, не так сложно, см. Мое редактирование. – Marius
Не работает для валюты «$ 1.00». :( – xtian