im using php для создания сортировщика rss, который хранит данные из нескольких rss-каналов сайта в базу данных mysql. поскольку статьи могут быть дублированы на многих веб-сайтах, я хочу избежать этого. ive было сказано, что вы можете использовать хеширование для создания уникальных хешей на основе содержимого rss [description + title]. Теперь, какой алгоритм хэширования является самым быстрым и создает меньше символов, которые я могу использовать для сравнения, чтобы избежать дублирования.php make unique hash of rss описание
Thanx заранее
Есть много доступных. Но чем меньше символов генерируется хеш-функцией, тем вероятнее, что у вас будут коллизии в ваших идентификаторах. Будьте уверены в этом. – stillstanding