У меня есть следующий код, который попадает в твиты Twitter и должен обрабатывать данные и после этого сохранять в новый файл.Python сохранить файл в csv
Это код:
#import regex
import re
#start process_tweet
def processTweet(tweet):
# process the tweets
#Convert to lower case
tweet = tweet.lower()
#Convert www.* or https?://* to URL
tweet = re.sub('((www\.[\s]+)|(https?://[^\s]+))','URL',tweet)
#Convert @username to AT_USER
tweet = re.sub('@[^\s]+','AT_USER',tweet)
#Remove additional white spaces
tweet = re.sub('[\s]+', ' ', tweet)
#Replace #word with word
tweet = re.sub(r'#([^\s]+)', r'\1', tweet)
#trim
tweet = tweet.strip('\'"')
return tweet
#end
#Read the tweets one by one and process it
input = open('withoutEmptylines.csv', 'rb')
output = open('editedTweets.csv','wb')
line = input.readline()
while line:
processedTweet = processTweet(line)
print (processedTweet)
output.write(processedTweet)
line = input.readline()
input.close()
output.close()
Мои данные в файле ввода выглядит следующим образом, так что каждый твит в одной строке:
She wants to ride my BMW the go for a ride in my BMW lol http://t.co/FeoNg48AQZ
BMW Sees U.S. As Top Market For 2015 i8 http://t.co/kkFyiBDcaP
моя функция работает хорошо, но я не являюсь доволен результатом, который выглядит следующим образом:
she wants to ride my bmw the go for a ride in my bmw lol URL rt AT_USER Ðun bmw es mucho? yo: bmw. -AT_USER veeergaaa!. hahahahahahahahaha nos hiciste la noche caray!
поэтому он помещает все в один ряд, а не каждый твит в одну строку, был формат во входном файле.
Есть ли у кого-то идея получить каждый твит в одной строке?
http://docs.python.org/2/library/csv.html#writer-objects – dm03514
Попробуйте: 'output.write (обрабатываетсяTweet + '\ n')' –
Спасибо Ashwini! Это решило мою проблему! – Max