2016-04-07 1 views
0

Я ищу для загрузки pdf-кода с помощью кода vb.net. URL-адрес возвращает страницу с встроенным PDF-плагином. Я хочу, чтобы код автоматически загружал и сохранял pdf. Вот пример URL http://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=PK&language=en&productNumber=S9888&brand=SIALЗагрузить pdf-файл с URL-адреса, который возвращает встроенный плагин

+0

Ваш вопрос, кажется, просит людей написать код для вас; это не то, что для StackOverfloew. Перейдите на страницу http://stackoverflow.com/help/how-to-ask, а затем отредактируйте свой вопрос соответствующим образом. Вы получите лучшие результаты. – DWRoelands

ответ

0
  1. Скачать исходный HTML в URL источника, используя WebClient как этот

    Dim myWebClient As New WebClient() myWebClient.DownloadFile("http://example.com/somepage.html", "downloadedpage.html")

  2. Затем запустите regular expression против этого downloadedpage.html, как это: iframe.+src\=\"(.+)\": это вернет первое совпадение в качестве источника файла PDF. Вы можете играть с помощью регулярных выражений в Интернете по адресу Regexp Hero

  3. составить окончательную ссылку на PDF-файл, добавив http://example.com плюс суб-URL вы извлеченная на этапе 2
  4. наконец, загрузите конечный файл в формате PDF по ссылке вы составленный на этапе 3
+0

Спасибо за ваш ответ. Я выполнил ваше предложение до шага 3 и получил суб-url, но когда я пытаюсь загрузить его с помощью WebClient.DownloadFile (url, filename), я получаю вместо файла файл «Мы сожалеем, файл не найден». Загрузка суб-url в браузере также создает одну и ту же страницу. – Sami

+0

@sami похоже, что исходный сервер проверяет реферальный URL или заголовок, который должен происходить с того же сервера –

Смежные вопросы