Я знаю, что это было бы очень основным для большинства из вас, но я не нашел ответа, поэтому я должен спросить! :)рубин выход кодирования webscraping CSV
Дело в том, что выход я получаю в моем файле CSV CSV-файла возвращаются странные символы, такие как \ u00F3 и т. д. для испанских акцентов. Мне, вероятно, нужно будет что-то сделать в конце моего кода, где есть CSV, но я не знаю, что.
И еще одно, что я получаю только один массив, где должно быть по одному на каждую строку сайта.
Благодаря
КОД:
url= "(the url of th website)"
page= Nokogiri::HTML(open(url))
description= page.css('div.post-body.entry-content').each do |line|
body << line.text.strip
end
puts body
# CSV
CSV.open("hello.csv", "w") do |file|
file << [body]
end