Я пытаюсь глотать файлы txt (весь каталог) в базу данных pandas, так что каждая строка в кадре данных имеет содержимое одного файла.Python читает txt-файлы в dataframe
Текстовые файлы, насколько я могу судить, не разделены, они являются телом сообщений электронной почты. Все файлы, кроме одного, разбиты на несколько строк. Поэтому вместо 20 строк (по одному для каждого файла) у меня более 500 строк. Я не могу сказать, как один файл отличается от остальных. Все они простые тексты.
код я использую:
import pandas as pd
for i in files:
list_.append(pd.read_csv('//directory'+i ,sep="\t" , quoting=csv.QUOTE_NONE,header=None,names=["message", "label"]))
Я установил разделитель табличной, как я думаю, что это не повлияет на прием внутрь текста вообще. Любые идеи, в чем проблема?
Как насчет белого пространства «\ s + "как аргумент разделителя? – multigoodverse