2011-01-15 5 views
0

Хорошо, я хочу разработать приложение для скремблирования для загрузки определенного текста внутри тега div на веб-сайте. Давайте возьмем, к примеруC# WebClient() Загрузка определенной части веб-сайта

<div class="main_content">WOTEVER GOES IN HERE, GOES IN HERE</div> 

Как будет идти о загрузке текста

WOTEVER GOES ЗДЕСЬ, GOES ЗДЕСЬ

Я понимаю, что нужно было бы использовать WebClient() с

.DownloadFile(sourceFileAddress, destinationFilePath); 

Thankyou

+0

Взгляните на [HTML Agility Pack] (http://htmlagilitypack.codeplex.com/). Создайте документ, используя загруженный источник, и вы сможете легко выбрать нужные части. На сайте есть примеры. – adrianbanks

+0

Может ли HTML Agility Pack работать с сайтом, которого у меня нет, потому что на своем сайте они говорят, что вам нужно загрузить DLL-файл на мой веб-сервер. Я хочу, чтобы я мог брать статьи с другого сайта для последующего ссылки на мой компьютерный курс. Я не хочу использовать закладки, потому что у меня более 400. Скорее загрузите статьи в .txt-файл, а затем откройте их позже. – mintuz

+0

Да. Добавьте ссылку на файл dll и используйте библиотеку из своего собственного кода. Вам нужно будет загрузить файл dll на ваш веб-сервер, если код, выполняющий загрузку, будет запущен на вашем веб-сайте. – adrianbanks

ответ

0

HTTP-запросы выполняются на основе «ресурса», и этот ресурс является файлом -> вы не можете загрузить какой-либо текст со страницы, вам необходимо загрузить файл и проанализировать его.

Если файл есть, например. очень большой, и вы знаете, что div в начале вы можете использовать сокеты TCP/IP и обрабатывать запрос и ответ вручную (синтаксический анализ на лету), но я действительно не знаю, принесет ли это вам какую-либо пользу.

+0

Вам не обязательно идти на уровень tcp - вы можете httpwebrequest/httpwebresponse открыть поток. –

Смежные вопросы