Может ли кто-нибудь помочь мне с «извлечением» материала с сайта с помощью Python? Вот информация: У меня есть имя папки с набором чисел (это идентификатор элемента), и я должен использовать этот идентификатор для ввода страницы, а затем «обрывать» информацию со страницы в своем блокноте ... Это примерно так: http : //www.somesite.com/pic.mhtml? id = [ID] ... Мне нужно, чтобы ссылка на изображение (ссылка на изображение всегда содержала ID.jpg в конце файла) и записывала его в блокнот и затем замените это имя txt на имя изображения ... Изображение всегда находится в тегах заголовков ... Спасибо заранее ...Как разобрать веб-элементы в блокнот с помощью Python?
-1
A
ответ
0
Что вам нужно - скребок данных - http://www.crummy.com/software/BeautifulSoup/ поможет вам извлечь данные с сайтов. Затем вы можете загрузить эти данные в переменную, записать ее в файл или сделать все, что вы обычно делаете с данными.
0
Вы можете попробовать разобрать источник html для изображений. Попробуйте что-то подобное:
class Parser(object):
__rx = r'(url|src)="(http://www\.page\.com/path/?ID=\d*\.(jpeg|jpg|gif|png)'
def __crawl(self, url):
images = []
code = urllib.urlopen(url).read()
for line in code.split('\n'):
imagesearch = re.search(self.__rx, line)
if imagesearch:
image = '%s.%s' % (imagesearch.group(2), imagesearch.group(4))
images.append(image)
return images
это untestet, вы можете проверить регулярное выражение
Смежные вопросы
- 1. Как создать блокнот в Python?
- 2. Как разобрать XML с помощью Python
- 3. Как разобрать этот XML с помощью Python
- 4. Как разобрать * .py файл с помощью python?
- 5. Как открыть блокнот с помощью cmd?
- 6. Создать блокнот с помощью раскадровки в Xcode
- 7. Пытается разобрать данные JSON с помощью python
- 8. Как разобрать XML в Python?
- 9. Как разобрать дерево в python?
- 10. Как разобрать XML и преобразовать в CSV с помощью Python
- 11. Помогите разобрать страницу с помощью python
- 12. Блокнот Sync Jupyter с сеансом Python
- 13. как разобрать подчеркивание с пути в python
- 14. Как разобрать текст в Python с IPWhois
- 15. Как скопировать несколько строк в блокнот ++ с помощью regex
- 16. Как разобрать XML с помощью BeautifulSoap?
- 17. Как сделать блокнот ++ функцией, как обычный блокнот в cmd?
- 18. Как построить блокнот-блокнот, используя 3 кнопки с одинаковым интервалом?
- 19. как разобрать ответ в python?
- 20. Прокрутите вниз блокнот с помощью java
- 21. Как разобрать подстроки в python?
- 22. Как разобрать строку в Python
- 23. Как разобрать динамически обновляемую форму .jsp с помощью механизации python?
- 24. Блокнот с бритвой
- 25. Как я могу разобрать заголовок электронной почты с помощью python?
- 26. * Обновление: как разобрать html с помощью python/beautifulsoup
- 27. Как разобрать грамматику Python?
- 28. Как разобрать несколько вложенных подкоманд с помощью python argparse?
- 29. Как разобрать NETSH вывода с помощью питона
- 30. Как создать блокнот с подменю с помощью jQuery UI?