2013-10-13 2 views
0

Так я имею проблемы в сохранении своих твитов, когда я собрал их и применять sapply на них они появляются в таком видеR: щебет сбора твитов

some_txt = sapply(tweets, function(x) x$getText()) 


[1] "RT @JanoImLukesSlut: #HarryHas17MillionFollowParty\n♔ RT\n♔Follow me\n♔Ask4follow back\n♔Follow ALL who RTs\n♔Gain\n♔Drink pepsi feel sexyyy\n#Sto…"    
[2] "RT @abria_valerie: Pepsi is like crack to me. I gotta have it."                             
[3] "@JLinn6 having to stop for dr. Pepper bc someone doesn't like Pepsi. #picky #spoiledbrat #watchoutonlylikesdr.'s"                 
[4] "RT @cyberscott1975: The coca cola truck can bugger off! I want a Pepsi Max Xmas Truck!í ½íºš"                      
[5] "í ½í²•í ½í²•í ½í²•Mmm That Spicy Chicken Sandwich And Fries And Pepsi From Wendy's Was A1í ½í²¦"                     
[6] "@JatnnaP05 @Alexandergr_ @IannErnesto @WilberJE ENTRA dale a GALERIA luego vota por : attabeira https://t.co/hh0Q5tkHzx #HelpMe"             
[7] "RT @supersunnytime: wallowing in a sea of pop punk and self-hatred"                            
[8] "These bitches love soda Pepsi and Cola"                                   
[9] "RT @Lmao: waiter: \"what drink would you like\" \nme: \"тнє вℓσσ∂ σƒ му єηємιєѕ\" \nwaiter: \nme: \nwaiter: \nme: \nwaiter: \nme: \nwaiter: \"is pepsi o…" 

       ....................... 

Однако, когда я применить CSV-файл для записи на него. а затем прочитать его обратно он не вернулся один и тот же формат

write.csv(some_txt, file = file.choose(), row.names = TRUE, sep = ',', col.names = TRUE) 
    some_txt = read.csv(file.choose(), row.names = 1, sep = ',') 

вместо этого возвращается в

x 
1   RT @JanoImLukesSlut: #HarryHas17MillionFollowParty\n♔ RT\n♔Follow me\n♔Ask4follow back\n♔Follow ALL who RTs\n♔Gain\n♔Drink pepsi feel sexyyy\n#Sto… 
2                            RT @abria_valerie: Pepsi is like crack to me. I gotta have it. 
3                @JLinn6 having to stop for dr. Pepper bc someone doesn't like Pepsi. #picky #spoiledbrat #watchoutonlylikesdr.'s 
4                     RT @cyberscott1975: The coca cola truck can bugger off! I want a Pepsi Max Xmas Truck!í ½íºš 
5                    í ½í²•í ½í²•í ½í²•Mmm That Spicy Chicken Sandwich And Fries And Pepsi From Wendy's Was A1í ½í²¦ 
6            @JatnnaP05 @Alexandergr_ @IannErnesto @WilberJE ENTRA dale a GALERIA luego vota por : attabeira https://t.co/hh0Q5tkHzx #HelpMe 
7                           RT @supersunnytime: wallowing in a sea of pop punk and self-hatred 
8                                  These bitches love soda Pepsi and Cola 
9 RT @Lmao: waiter: "what drink would you like" \nme: "тнє вℓσσ∂ σƒ му єηємιєѕ" \nwaiter: \nme: \nwaiter: \nme: \nwaiter: \nme: \nwaiter: "is pepsi o… 

             ...... 

Любая идея о том, как вернуть его обратно то же значение? Я использую csv, потому что я хочу собирать эти твиты вручную.

это ул() пример some_txt (это 50 твитов вот почему его 1:50)

chr [1:50] "@psychicpebble AMEN THANK YOU FOR NOT TALKING ABOUT THAT PEPSI SHIT." ... 

Edit:

это ул() пример вывода после чтения (пример)

 'data.frame': 50 obs. of 1 variable: 
    $ x: Factor w/ 43 levels "$39 = Jack'n'Coke, Vodka & Pepsi, and a 24 oz.  Miller Lite. Fml.",..: 10 24 33 9 13 39 9 21 6 31 ... 

Новое обновление: Я попробовал ваш метод томас, это не совсем то, что я хотел, потому что в моей первоначальной some_txt я мог бы сделать это

> some_txt[2] 
    [1] "RT @Nada_7Q: #تابعني_اتابعك\[email protected]\[email protected]_alzuhair\[email protected] \[email protected]\[email protected]\[email protected]_FAEF\[email protected]_7Q★☆★☆\[email protected]\[email protected]\[email protected]\[email protected]_06…" 
    > some_txt[1] 
    [1] "RT @CodeClue: 50 CL Pepsi is unnecessary tbh." 
    > some_txt[3] 
    [1] "I just ate all my Dad's very expensive cheese and it's supposed to be eaten slowly with a nice glass of red not a Pepsi Max" 

После применения stringAsFactor к read.csv он по-прежнему распечатывает одно и то же, однако тип str() немного изменился. Но я бы хотел, чтобы весь список был chr [1:50], а не только один. Также он имеет только один элемент списка, не похожий на мой оригинальный some_txt выше. Я действительно надеюсь, что кто-то может мне помочь>. < Это причиняет мне головную боль

+0

Загляните в аргумент 'fileEncoding' в' write.csv', подробно описанный в ['? file'] (http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html). – Thomas

+0

Есть ли файлEncoding, который фактически возвращает его в этот формат? – Napmi

+0

Глядя на это более тщательно, вход и выход не выглядят иначе. Каковы различия, которые вы видите? – Thomas

ответ

0

Это то, что я сделал, чтобы вернуть его в список его первоначальной формы.

for(i in 1:length(some_txt[,1])){ 
    some_txt1 = c(some_txt1,some_txt[,1][i]) 
} 

Я просто создаю цикл for и просто зацикливаю их обратно в список.

Смежные вопросы