2010-09-21 4 views
0

Извините за длинный титул и, возможно, путайте наполовину хорошо, когда мы приходим. Я прошу совета или рекомендации о том, как я могу получить RSS-канал со страницы, которая по умолчанию не включена RSS. Но это не проблема. Проблема в том, что на этой странице меня просят ввести имя пользователя и пароль. Ну так в противном случае была бы вещь ...Получить RSS там, где их нет

ПРОБЛЕМА:

Получить RSS на форуме, который не имеет, допускающую RSS канал и увидеть «Новости» мы должны быть авторизованы.

ВОЗМОЖНЫЕ РЕШЕНИЯ, которые приходят на ум:

  1. Там находятся несколько веб-сайтов, которые предлагают услуги на английском языке, чтобы получить RSS на страницах, где они не являются. Это нормально, но проблема в том, что на этих сайтах нет возможности входа с именем пользователя и паролем на веб-страницу, где я хочу получить информацию, поэтому эти типы сайтов исключаются.
  2. Я не входил в систему по URL-адресу и поэтому размещал этот URL-адрес на перечисленных выше сайтах (пункт 1) форума с переменными имени пользователя и пароля прямо из спецификации url: www.forosinrss/login.php?usuario = me & password = your pff, и я отскакивал от форума, говоря мне, что я «Я не получу правильные данные, как мы будем. Другая проблема заключается в том, что пароль зашифрован в md5, поэтому мне не удалось войти в систему с URL-адресом (fk T_T).
  3. Попробуйте использовать «SELECT * FROM DB Internet», или, другими словами, использовать YQL. Но это получилось почти так же, как они не нашли способ вставить и войти в систему пользователя и пароль, а также для создания cookie для форума не понравилось, что я проголосовал.

Мне нужны предложения, рекомендации, советы или жалобы.

+0

Вам необходимо загрузить страницы через скрипт с библиотекой, которая может обрабатывать аутентификацию, например CURL, а затем проанализировать страницы. Если вы этого еще не знали, это будет долгий подъем в гору. – Erik

+0

Это хорошая идея. спасибо за ваше время и ваш ответ. – user453445

ответ

0

Загрузите страницу, используя что-то вроде cURL или fsockopen, если вы чувствуете себя храбрым, а затем преобразуйте страницу из html в rss с помощью стилей XSLT.

0

Однажды я написал приложение в PHP, чтобы сделать это с ОК-иш результаты:

  • использовать локон, чтобы получить страницу и сохранить копию
  • запустить регулярное выражение пользовательского фильтра для выбора бит страницы, которая на самом деле имеет значение (некоторые сайты имеют динамический текст, например рекламу или просто отображают текущую дату и время)
  • после таймаута используйте завиток, чтобы снова получить страницу и запустить на нем тот же фильтр
  • run diff old_page, new_page и передать результат в шаблон rss

Система работала нормально, но была фильтрующей страницей до содержимого, из которого я хотел получить фид, и он много ломался, потому что эти виды сайтов часто редактируются вручную, поэтому вы не можете гарантировать согласованность.