2016-10-02 2 views
1

Я знаю, что это было бы очень основным для большинства из вас, но я не нашел ответа, поэтому я должен спросить! :)рубин выход кодирования webscraping CSV

  • Дело в том, что выход я получаю в моем файле CSV CSV-файла возвращаются странные символы, такие как \ u00F3 и т. д. для испанских акцентов. Мне, вероятно, нужно будет что-то сделать в конце моего кода, где есть CSV, но я не знаю, что.

  • И еще одно, что я получаю только один массив, где должно быть по одному на каждую строку сайта.

Благодаря

КОД:

url= "(the url of th website)" 
page= Nokogiri::HTML(open(url)) 



description= page.css('div.post-body.entry-content').each do |line| 
body << line.text.strip 
end 


puts body 


# CSV 
CSV.open("hello.csv", "w") do |file| 
file << [body] 
end 

ответ

0

Я сделал это! на самом деле я должен поставить следующее:

CSV.open("hello.csv", "w+:UTF-16LE:UTF-8") do |file| 
file << body 

end