У меня есть этот код, который я использовал на некоторое время. Интересно, есть ли способ прочитать csv-файл в строке (твиттер-каналы) и экспортировать вывод в csv.NLTK POS Теги - не удалось экспортировать CSV
Я идеально смотрю, чтобы извлекать термины существительных в строке, то есть в моем случае твиттер-канал.
Вот код. Извините, но я новичок в Python.
import nltk
essays = u"""text here"""
tokens = nltk.word_tokenize(essays)
tagged = nltk.pos_tag(tokens)
nouns = [word for word,pos in tagged \
\t if (pos == 'NN' or pos == 'NNP' or pos == 'NNS' or pos == 'NNPS')]
downcased = [x.lower() for x in nouns]
joined = " ".join(downcased).encode('utf-8')
into_string = str(nouns)
output = open("output.txt", "w")
output.write(joined)
output.close()