2015-10-15 2 views
-1

Я пытаюсь разобрать веб-документ. Использование HtmlAgilityPack (C#) Это именно то, что ищет значение href тега.HtmlAgilityPack Различимое значение отличается

Я разбор http://www.ntis.go.kr/ThRndGateList.do

Хотя успешный синтаксический анализ, значение немного отличается. Я не знаю почему.

Фактическое значение сети выглядит следующим образом:

enter image description here

Значение, полученное через Htmlagilitypack является следующим:

enter image description here

Как вы можете видеть, это странный Отправной со значением «jsessionid» в значении href. По какой причине?

Благодарим за внимание.

+0

Можете ли вы копировать вставить HTML и результаты синтаксического анализа как текст? Я ничего не вижу из этих фотографий –

+1

Может ли быть, что вы вошли на этот сайт в своем браузере? –

+0

Фактическое значение: /ThRndGateView.do?searchType=&idx=211166&pageNumber=1&searchWord= –

ответ

0

Это, вероятно, потому, что в вашем браузере (в вашем случае Chrome) вы вошли в систему Если вы сделаете запрос через HtmlAgilityPack вы как недавно открытый браузер:.

  • не вошли в систему
  • Никогда на этой странице, перед

WebApplication вы пытаетесь использовать генерирует JSESSIONID, когда кто-то открывает страницу в первый раз, и этот идентификатор перечисляется через URL.

Этот вопрос может помочь вам понять технологию позади WebApplication: Under what conditions is a JSESSIONID created?

Смежные вопросы