Я использую питона с селеном для извлечения данных из веб-сайте ниже: http://www.worldhospitaldirectory.com/klinik-fur-anaesthesiologie-und-intensivmedizin/info/4181Selenium with Python: как вытащить данные без id и класса?
Screenshot of Page Как вы можете видеть из этой картины. Я хочу получить название больницы, категорию, адрес, страну, телефон, сайт и электронную почту.
Но когда я проверяю элементы, я обнаружил, что нет имени id или класса.
Категория: Больницы общего
Адрес: .....
Я действительно понятия не имею, как вытащить их с этого сайта. Пожалуйста, помогите мне или дайте мне несколько советов.
Попробуйте использовать Xpath –
Вы можете просто тянуть 'outerHTML' и разобрать его как строку. –
Если язык не изменяется, вы можете использовать некоторые xpaths на основе текста или если структура такая же, каждый раз то же самое, что и вы можете попробовать на основе позиции. – lauda