2013-03-01 2 views
0

Я разрабатываю приложение iPhone, который в основном входит в систему на веб-сайты третьих сторон и синтаксический анализ HTML-данные для конкретной информации, как даты и времени и т.д.Скачать инструкции для разбора HTML-данных

Однако, это, очевидно, легко ломаются если веб-сайты обновляют свой шаблон HTML даже малейшим.

Я не хочу, чтобы приложение ломалось, и если это так - я не хочу каждый раз пересылать обновление для apple.

Мне нужно легкое умное средство для моего приложения для загрузки «инструкций» о том, как анализировать веб-сайт, с моего собственного сервера. Таким образом, если HTML изменяется; Я могу просто обновить инструкции на своем сервере, а не отправлять новое обновление приложения для Apple.

В настоящее время я использую XPath для поиска данных в библиотеке TFHpple, но также путем достижения детей TFHppleElements в объекте c.

ответ

1

Честно говоря, даже более разумный способ заключается не только в том, чтобы ваш сервер отправлял «инструкции» о том, как разбирать веб-сайт, но и ваш сервер выполняет всю очистку и выполняет роль «промежуточного программного обеспечения». Ваш сервер может выполнять очистку веб-страниц, преобразовывать содержимое в JSON/XML/независимо, а затем ваши устройства могут запросить его. Если веб-сайт изменяется, вам просто нужно обновить сервер, и вы можете отключить разбор с устройства на сервер (что в зависимости от содержимого, которое вы очищаете, значительно уменьшает нагрузку на очищаемый сайт).

+0

Это не вариант, так как пользователь входит в систему на веб-сайты, используя свои учетные данные для входа в систему и ни пользователь, ни сайты не хотят, чтобы я обрабатывал и хранил их данные для входа. Вход и разбор должны выполняться на клиенте –

0

Разбор HTML

Как блестящий ваш код для разбора любой веб-сайт, который включает в себя HTML, вы должны обновляться каждый момент времени. И даже если вы все уверены в безопасности с веб-сайтом. Проблема возникает при анализе веб-сайта, содержащего HTML.

Возможно, вы используете NSRegularExpression, NSPredicate и т. Д. Для использования.

Большое обсуждение здесь: Never Parse HTML using RegEx

Смежные вопросы