Мне нужно прочитать файл и разбить его на строки, а также разделить эти строки пополам на символы табуляции, а также избавиться от всех речевых меток. На данный момент у меня есть рабочая функция. Однако он довольно медленный:Python: что такое быстрый способ чтения и разбиения файла?
temp = []
fp = open(fName, "r")
for line in fp:
temp.append(line.replace("\"","").rstrip("\n").split("\t"))
print temp
Это разделяет файл на список списков. Это действительно может быть только один список, так как было бы довольно легко переделать его на пары позже, пока порядок был сохранен.
Должен быть более быстрый способ сделать это. Может ли кто-нибудь поставить меня на правильный путь?
Спасибо!
[edit] Файл, с которым я работаю, массивный, но я добавлю что-то подобное. (Есть ли способ, чтобы загрузить файлы на переполнение стека?)
"CARMILLA" "35"
"JONATHAN R" "AA2"
"M" "3"
"EMMA" "350"
"OLD" "AA"
должен вернуться:
["CARMILLA", "35", "JONATHON R", "AA2", "M", "3", "EMMA", "350", "OLD", "AA"]
Хотя мой код возвращает его в виде списка списков 2 строк, который также хорошо.
Извините, я должен был заметить, что оператор печати стоит за оператором return - поскольку я взял это из функции, я изменил ее, чтобы печатать, поэтому здесь было бы больше смысла.
образец файла и результат помогут нам создать ответы (для тестирования) – HennyH
Конечно, я добавлю один. –
Если все, что вы хотите, это печатный результат, вы можете просто распечатать в цикле for вместо добавления в список. – Gurgeh