2013-09-10 5 views
5

Я ищу хороший способ проанализировать HTML в Clojure.Разбор HTML в Clojure

Точно, что я пытаюсь сделать, это получить содержимое веб-страницы с искателем, а затем получить содержимое некоторых тегов HTML или их атрибутов.

У меня есть URL-адрес страницы, и я получаю html как String, но как получить данные, которые мне нужны?

ответ

6

Использование https://github.com/cgrand/enlive Это позволяет вам выбирать и извлекать с помощью селекторов типа CSS.

Или https://github.com/nathell/clj-tagsoup

Я не испытывал с тегом супом, но я могу сказать, что enlive хорошо работает для большинства выскабливания.

+0

спасибо. Я уже слышал об оживлении. Попробуем попробовать –

+0

https://github.com/Raynes/laser - еще один подход, который я лично использую. – danneu