Я внедряю программу чтения RSS-сообщений, такую как система, и у меня возникают проблемы с некоторыми фидами, которые меняют URL-адреса элементов через некоторое время. Когда я построил систему, я использовал md5 url как идентификатор, чтобы иметь простой и быстрый способ обнаружения дубликатов, люди не изменят URL-адрес для статей, потому что это плохо для SEO, но если они используют feedproxy или другие динамические генератор питает URLs в статьи использовать переназначение и URLs также изменяется, в качестве примера я получаю эти 3 записи в мою базу данных для того же статьиRss feed change url to items
Мой вопрос - это правильный способ сделать это, и если вы знаете какой-то открытый исходный код, который можно использовать на стороне сервера, который является стабильным, то я могу заменить мой PHP-код, который я использую сейчас (он может быть на любом языке) (я использую picofeed)
ссылка сломана в данный момент – simion314
URL фиксированным, в статью также можно найти с помощью функции поиска «RSS обнаружения повторяющихся» на Google – janih
Thnks, я буду видеть, если я найду способ для переноса данных с базой данных, чтобы использовать новые идентификаторы не получая много дубликатов, я хочу сохранить старые статьи, которые больше не находятся в фиде, поэтому я не могу удалить и запустить свежие – simion314