Я пытаюсь получить html www.soccerway.com. В частности, это:Scrape html with js
, которые имеют label-wrapper
класс я также попытался с: select.nav-select
, но я не могу получить любую информацию. То, что я сделал это:
1) Создан PHP поданного под названием grabber.php
, этот файл имеет следующий код:
<?php echo file_get_contents($_GET['url']); ?>
2) Создан index.html
файл с таким содержанием:
<!DOCTYPE html>
<html>
<head>
<script src="http://ajax.googleapis.com/ajax/libs/jquery/1/jquery.min.js"></script>
<meta charset=utf-8 />
<title>test</title>
</head>
<body>
<div id="response"></div>
</body>
<script>
$(function(){
var contentURI= 'http://soccerway.com';
$('#response').load('grabber.php?url='+ encodeURIComponent(contentURI) + ' #label-wrapper');
});
var LI = document.querySelectorAll(".list li");
var result = {};
for(var i=0; i<LI.length; i++){
var el = LI[i];
var elData = el.dataset.value;
if(elData) result[el.innerHTML] = elData; // Only if element has data-value attr
}
console.log(result);
</script>
</html>
в div нет содержимого grabbed, я проверил мой код js для получения всей ссылки и работы, но я вставил html-страницу manually.
Ваш код потенциально очень опасен. 'grabber.php? url =/a/path/on/your/server/to/something/very/secret' не будет весело. – ceejayoz
@RoryMcCrossan Перечитайте вопрос. Они проксируют запрос через сервер, избегая проблем с одинаковым происхождением. – ceejayoz
@ceejayoz хорошо пятнистый. Моя ошибка –