2010-02-19 7 views
0

У меня есть программа для обхода, которая извлекает URL-адреса для анализа html и натолкнулась на необычную ошибку, так как я начал это. Для определенного набора URL-адресов с сайта при выборке с использованием HTTPWebRequest и HttpWebResponse я получаю ошибкуHTTPWebREquest - возвращает ошибку WebException- (404) не найден

**> Удаленный сервер возвратил ошибку:

(404) Not Found**

Это необычно, так как он работает при вставке его в мой браузер. Любые идеи оценили. Не уверен, нужен ли код для публикации, но дайте мне знать, если это так.

ответ

1

Сайт может блокировать ваш пользовательский агент или может потребоваться куки.

+0

Я попытался сменить useragents, и это не сработало. Как включить файлы cookie из программы? – vbNewbie

+0

ok собираюсь попробовать класс cookiecontainer thingy – vbNewbie

1

Возможно, удаленный сервер обслуживает разные страницы в зависимости от User-Agent и что у него нет страницы, которая соответствует значению User-Agent, предоставленному экземпляром HttpWebRequest (по умолчанию пустой)? Просто мысль, поскольку вы говорите, что страница может быть найдена при навигации по ее адресу с браузером, но не через код.

+0

Спасибо за ответ ... не был уверен, что вы имели в виду, но я попытался переключить useragents и не работал. Он всегда получает первый URL-адрес, а затем я получаю сообщение об ошибке. Является ли сайт блокирующим меня; что смешно, так как я проверил robot.txt – vbNewbie

Смежные вопросы