2016-06-22 2 views
0

У меня есть этот код, который я использовал на некоторое время. Интересно, есть ли способ прочитать csv-файл в строке (твиттер-каналы) и экспортировать вывод в csv.NLTK POS Теги - не удалось экспортировать CSV

Я идеально смотрю, чтобы извлекать термины существительных в строке, то есть в моем случае твиттер-канал.

Вот код. Извините, но я новичок в Python.

import nltk 
 
essays = u"""text here""" 
 
tokens = nltk.word_tokenize(essays) 
 
tagged = nltk.pos_tag(tokens) 
 
nouns = [word for word,pos in tagged \ 
 
\t if (pos == 'NN' or pos == 'NNP' or pos == 'NNS' or pos == 'NNPS')] 
 
downcased = [x.lower() for x in nouns] 
 
joined = " ".join(downcased).encode('utf-8') 
 
into_string = str(nouns) 
 

 
output = open("output.txt", "w") 
 
output.write(joined) 
 
output.close()

ответ

0

(CSV) документы https://docs.python.org/2/library/csv.html

import csv 
all_nouns = [] 
with open('twitter_feed.csv', 'rb') as csvfile: 
    tweetreader = csv.reader(csvfile, delimiter=',', quotechar='"') 
    for tweet in tweetreader: 
     tokens = nltk.word_tokenize(essays) 
     tagged = nltk.pos_tag(tokens) 
     nouns = [word for word,pos in tagged \ 
      if (pos == 'NN' or pos == 'NNP' or pos == 'NNS' or pos == 'NNPS')] 
     downcased = [x.lower() for x in nouns] 
     joined = ",".join(downcased).encode('utf-8') 
     all_nouns.append(joined) 
csv_file = csv.writer("nouns.csv") 
csv_file.writerows(all_nouns) 

Боюсь, у меня нет Python на моей машине в данный момент, чтобы проверить это, но я в основном используется Документы Python и ваш код, чтобы закрепить этот сценарий вместе, что должно помочь вам в правильном направлении для достижения того, чего вы хотите. Если вам нужна дополнительная помощь или я не понял, пожалуйста, дайте мне знать.

Смежные вопросы