Я хочу, чтобы извлечь данные из различных видов блогов и собирается с помощью различных способов сделать это:Каков универсальный стандарт для получения данных из любого блога?
- API, который требует аутентификации пользовательскому
- XML RPC (Не знаю, которые все поддерживают его)
- RSS (Опять же, не уверен, которые поддерживают его блоги и даже если они делают, сколько может один получить от RSS-каналы.)
- Atom
Я знаю, что это не строго связанный с программированием вопрос, но я пошел вперед, спрашивая об этом, потому что есть большая путаница в отношении того, что использовать и что лучше обслуживать?
Было бы неплохо не использовать API с аутентификацией, так как вам не только придется решать различные варианты аутентификации, но также иметь дело с различными ограничениями API.
Итак, вы говорите, что если мне нужно получить все данные из блога, Atom или RSS должны делать? Что делать, если блог не поддерживает RSS или частично его поддерживает. Затем? – Hick
Ваш код должен делать все возможное, чтобы проверить, что поддерживает блог. Первый тестовый Atom, поскольку он наиболее универсален. В противном случае проверьте RSS. Для каждого из них вам также нужно будет проверить разные поля, чтобы увидеть, пусты ли они. Это может помочь прочитать официальные спецификации чтения для Atom и RSS, чтобы узнать, что такое стандартная реализация. Помните, конечно, что некоторые блоги могут неправильно кодироваться. Однако, если вы просто хотите, чтобы название, тело и временная метка, надеюсь, у вас не было бы слишком много проблем. – Jodes