2013-09-25 2 views
3

Я использую urlread в MATLAB для загрузки содержимого веб-сайтов, а затем поиска для дальнейшего использования.Загрузите контент с сайта на MATLAB, включая внутренние фреймы (iframe)

Однако я наткнулся на сайт, на котором содержимое, в котором я нуждаюсь, расположено в определенном внутреннем фрейме, который встроен в индекс index.php через .

Когда я использую urlread с URL файла, который, казалось бы, встроенный в основной файл, я до сих пор получить только содержание этого index.php вместо того, что в targetframecontent.php.

Я думаю, urlread может быть неправильным инструментом для этого, или я мог бы игнорировать другие вещи, которые делают мои попытки неудачными. Есть ли способ получить содержимое такого внутреннего кадра в MATLAB?


EDIT: Немного более точно:

я обычно использую следующие читать содержание веб-сайта в моем MATLAB рабочее пространство:

data = urlread('http://[...]index.php') 

Но делать это я только получаю содержимое родителя index.php, а не встроенный targetframecontent.php. Я понял, что, когда происходит через веб-сайты исходного кода, где часть сайта, которая включает в себя содержание я заинтересован в загружается в кадр с:

<iframe src="http://[...]targetframecontent.php" width="850px" height="1000px" border="0" frameborder="0"></iframe> 

Из-за того, что я пытался использовать urlread напрямую с URL-адресом, который загружается в конкретный целевой кадр.

Однако, когда я это сделал, у меня все еще было такое же содержимое, как если бы я все еще загружал index.php. Так, кажется, перенаправляет urlread назад index.php всякий раз, когда я пытаюсь использовать прямой URL-адрес targetframecontent.php. То же самое произошло, когда я попытался загрузить targetframecontent.php в браузере.

Спасибо за любую помощь.

+0

'urlread' будет извлекать только любой URL-адрес, который вы ему даете. Если вы открываете URL-адрес iframe в своем браузере, вы получаете встроенный контент? Если вы не можете предсказать URL-адрес 'targetframecontent.php', вам нужно будет вручную разобрать «