Я должен скачать (например, 1000) случайные статьи из Википедии, а затем с помощью Html Agility Pack, удалить из html-файлов/строк, удалить все теги html/scripts. Как я могу скачать его? Имеет ли эта библиотека какой-либо инструмент для загрузки статей с www? Спасибо за помощьКак я могу загружать статьи с сайтов?
-3
A
ответ
1
Использование может использовать WebClient. Например:
var site = new System.Net.WebClient().DownloadString("http://google.com");
0
Вы можете написать инструмент гусеничный захватить 1000 URLs в википедии и использовать этот HtmlWeb в HtmlAgilityPack:
string Url = "http://something";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(Url);
Смежные вопросы
- 1. загружать статьи ajaxly в joomla
- 2. Программно загружать встроенные SWF-файлы с сайтов?
- 3. Как я могу открыть несколько сайтов случайно?
- 4. Могу ли я использовать Hpricot для поиска основного текста статьи на любом/большинстве веб-сайтов?
- 5. Как я могу динамически загружать чужую библиотеку?
- 6. Как я могу загружать конструктор в Php5?
- 7. Как я могу автоматически загружать коллекцию?
- 8. Как я могу загружать RSS Feedburner динамически?
- 9. Как я могу загружать несколько ассоциаций?
- 10. Как я могу загружать только файлы jpeg?
- 11. Я не могу экспортировать статьи в Magento
- 12. Ubuntu: как массово загружать поле с нескольких сайтов?
- 13. Как динамически загружать данные с веб-сайтов в UITableViewCell?
- 14. Как я могу получить объект семейства сайтов с сервера Sharepoint
- 15. Как я могу собирать данные надежно с клиентских веб-сайтов
- 16. Где я могу получить новостные статьи за последний год?
- 17. Хорошие статьи, описывающие инфраструктуру крупных коммерческих сайтов, таких как Amazon.com?
- 18. Как я могу автоматически загружать зависимости Bower, например, с Composer?
- 19. Как я могу асинхронно загружать файлы с помощью Guzzle 6?
- 20. Как я могу синхронно загружать ресурс с помощью TypScript?
- 21. Как я могу загружать определенные страницы CodeIgniter с помощью SSL?
- 22. Как я могу загружать изображения с помощью NodeJS и выражать?
- 23. как я могу загружать изображения с помощью cloudinary в android
- 24. Как я могу заставить IE сделать Joomla статьи изображения отзывчивыми?
- 25. Как я могу получить URL статьи в плагине контента Joomla?
- 26. Почему я не могу сериализовать форму с тегами статьи внутри?
- 27. Как я могу опубликовать свои статьи в превью «Просмотр статьи» в Google Inbox?
- 28. Как я могу скрыть детали статьи в Joomla 1.7?
- 29. Как я могу весить дату создания статьи в мышлении sphinx?
- 30. Как я могу реализовать функцию записи вида статьи в Flask?
да, но я должен загрузить 1000 статей из Википедии. Например: Мне необходимо скачать статью по адресу: https://en.wikipedia.org/wiki/Sport и мне необходимо скачать статью: https://en.wikipedia.org/wiki/Basketball Случайные 1000 статей , – srzeppa