2015-02-10 2 views
0

В приложении C# я хотел бы открыть URL-адрес и загрузить pdf-файл.C# скачать pdf из ajax driven url

Когда этот URL-адрес попал из браузера, страница быстро загружается и начинается то, что я считаю аякс-звонками. Через несколько секунд появится окно загрузки браузера с файлом PDF.

Я пытался открыть этот URL-адрес через WebClient. Поток, который я возвращаю, не является файлом PDF и является фактическим html страницы.

Как я могу обнаружить, что файл pdf загружен и загружен?

ответ

0

Если я не ошибаюсь, WebClient не имеет понятия о JavaScript, он вообще не будет запускать код AJAX, он просто получает HTML-страницу и оставляет ее на этом. И так как, вероятно, URL-адрес PDF обрабатывается Javascript или PDF создается по требованию или даже передается через Javascript, вам действительно нужна поддержка активного контента.

Кажется, что это похоже на Селен. http://www.seleniumhq.org/ Это порождает либо фактический браузер, и управляет этим браузером для содержимого, которое вам нужно, либо запускает безгласный браузер PhantomJS и выбирает нужный контент.

Возможно, это немного перебор, и более опытный человек может получить лучший ответ, но это то, что я использовал в приложении, которое должно извлекать файлы PDF, CSV и другие файлы с разных сайтов.

Смежные вопросы