Я работаю с cheerio.js, чтобы сделать простой скребок. По какой-то причине он не отвечает на определенные теги html. Один div, который я не могу настроить, - div с классом 'dataTables_scrollBody' на веб-сайте, который я соскабливаю: http://www.caffeineinformer.com/the-caffeine-database.получение дополнительной информации, когда webscraping с cheerio js
Однако, я думаю, что нашел свою проблему для своей проблемы.
Я прочитал документацию https://github.com/cheeriojs/cheerio и я следую этот формат $ (селектор, [контекст], [корень].
$(".main, div:nth-child(3) ").filter(function(){
var data = $(this).prev().text();
console.log(data);
})
В моей консоли я получаю данные, которые я желаю, но с двумя проблемы
1. Caffeine Content of Drinks All Coffee Soda Energy Drinks Tea Shots
Loading data.../*<![CDATA[*/var totalrows=1127;
var latestdate='06/12/2015';var tbldata=
Я не вижу эту информацию на странице.
2. I am getting my data back two times.
Я установил console.log для длины данных. Я вернулся 8 разной длины. Я считаю, что есть обходной путь. Однако я не могу понять это.
У любого есть какие-либо знания по этому вопросу?
Спасибо, за отзыв. Я не мог понять этого. Я снял скриншоты с фантомными js. Мне нужно будет это проверить. – Winnemucca