Эй, я хотел бы создать приложение, которое могло бы проанализировать веб-сайт, чтобы получить конкретную информацию. В частности, что-то, что может проанализировать http://www.fedex.com/Tracking?language=english&cntry_code=us&tracknumbers=681780934297262 для получения важной информации. Есть ли учебник, который я мог бы использовать.Как анализировать сайт?
1
A
ответ
2
В этой статье Cocoa With Love обсуждается разбор XML и HTML с библиотекой libxml2
, доступной с Xcode, с использованием XPath, чтобы вытащить интересующий узел. Посмотрите на функцию PerformHTMLXPathQuery()
.
0
Попробуйте этот инструмент: http://code.google.com/p/sitescraper/
Смежные вопросы
- 1. Как анализировать или анализировать индекс
- 2. Как анализировать производительность Objectify?
- 3. Как анализировать или анализировать это регулярное выражение?
- 4. Неопределенное свойство: DOMNodeList :: $ textContent, когда анализировать веб-сайт
- 5. Как анализировать записи?
- 6. Как анализировать архитектуру системы?
- 7. Как анализировать регулярное выражение
- 8. Как анализировать кучи кучи
- 9. Как анализировать HTML-элемент?
- 10. Как анализировать данные xml
- 11. Как анализировать журнал jmeter?
- 12. Как анализировать дамп ядра
- 13. Как анализировать файл JSON?
- 14. Как анализировать файл .mdmp?
- 15. Как анализировать «случайный» XML
- 16. Как анализировать метод «max»
- 17. Как анализировать файл .hprof?
- 18. Как анализировать GarbageCollections
- 19. Как анализировать элементы массива?
- 20. Как анализировать дизайн приложения?
- 21. Как анализировать веб-URL?
- 22. Как анализировать сложность алгоритма?
- 23. Как анализировать хромированные расширения?
- 24. Как анализировать логическую логику?
- 25. Анализировать Wordpress как SHORTCODE
- 26. Как анализировать недопустимые параметры?
- 27. Как анализировать двоичный файл?
- 28. Как анализировать переменную?
- 29. Как анализировать пространство Перменгена?
- 30. Как анализировать ошибку ODATA
универсальный консенсус по StackOverflow является то, что регулярные выражения являются лучшим решением для разбора HTML. Если вы не Джон Скит. Он не может это сделать. –
За исключением разработчиков Python, которые избегают регулярных выражений (потому что они не работают вообще для HTML) и используют пакет Beautiful Soup. –