Мне любопытно узнать о технологии, стоящей за поисковой системой, например torrentz.com. Из того, что я мог наблюдать, он не содержит никаких торрент-файлов, а скорее связывает вас с другими серверами, которые это делают.Как вы создаете индексатор торрентов?
- Вы ищете ключевые слова, он отображает список потенциальных названий, соответствующих вашему запросу.
- затем вы выбираете один из них, и он предоставляет вам другой список потенциальных серверов, на которых размещается соответствующий торрент-файл.
То, что я заинтересован в частности, стратегия за сбор и индексирование все, что содержание:
Как они собирают затем агрегировать данные?
Это базовая служба представления, где каждый из этих серверов отправляет свой контент для индексирования?
Это алгоритм сканирования? Если да, то как вы можете начать сканирование сайта, например, piratebay.org?
Имеют ли они доступ к базам данных этих других серверов?
Мои знания и понимание протокола bittorrent не очень сложны, но документация, которую я нашел в Интернете, указала мне больше на процессы, связанные с созданием трекер-сервиса, что не совсем то, что меня интересует. проницательность и рекомендуемый материал для чтения.