2013-11-07 2 views
0
negids = movie_reviews.fileids('neg') 
posids = movie_reviews.fileids('pos') 

for f in negids: 
    with open(fileids=[f], "rb") as infile, open(fileids=[f], 'wb') as outfile: 
    in_txt = csv.reader(infile, delimiter = '\t') 
    out_csv = csv.writer(outfile) 
    out_csv.writerow(in_txt) 

Может кто-нибудь помочь, пожалуйста, я пытаюсь прочитать каждый файл в отре папке фильм корпуса обзора и вставить полные данные этого файла в виде строки в Excel листесоздание файла CSV для обзора фильма корпуса в питоне

+0

Любые ошибки в коде выше? В чем проблема? – Hussain

ответ

0

Использование csv DictReader.

import csv 
import json 
data = csv.DictReader(open('filename.csv', 'r')) 
print data.fieldnames 
for each in data: 
    row ={} 
    # check condition code here 
    output.append(row) 
print output 

добавить выходные данные в CSV файл

+0

не может получить его с помощью этого кода – user1805250

+0

может кто угодно помочь – user1805250

0
directory = raw_input("INPUT Folder:") 
output = raw_input("OUTPUT Folder:") 

txt_files = os.path.join(directory, '*.txt') 

for txt_file in glob.glob(txt_files): 
with open(txt_file, "rb") as input_file: 
    in_txt = csv.reader(input_file) 
    filename = os.path.splitext(os.path.basename(txt_file))[0] + '.csv' 

    with open("book.csv", 'wb') as output_file: 
     out_csv = csv.writer(output_file) 
     out_csv.writerows(in_txt) 

я попробовал этот код он работает, но вопрос каждый текстовый файл в отр папке корпуса обзора фильм должен прийти как один одна строка в файле csv (т. е. папка neg содержит тысячу файлов, и я хочу, чтобы новый созданный csv должен иметь тысячу строк по одной строке для полного текста одного текстового файла), но это не происходит, поскольку последние данные файла перезаписывают предыдущий данные файла и последние данные файла появляются в нескольких строках в файле csv

+0

Когда вы пишете в файл, попробуйте использовать 'a' вместо 'w' для добавления в файл. 'w' будет перезаписано. Каков формат входных файлов? – ratatoskr

+0

Формат входного файла - текст – user1805250

Смежные вопросы