2015-07-05 1 views
2

Я делаю bittorrent трекер/сайт, похожий на The Pirate Bay, Kickass.to и т. Д. Необходимо получить статистику торрентов (сеялки, загрузки) в обоих индексах и торрент-страницу. Пример:Лучший способ получить статистику внешнего торрента на активном сайте

http://kat.cr/ubuntu-15-04-vivid-vervet-desktop-amd64-iso-final-t10550003.html
Сеялки: 3442 Личеры: 148

Если торрент использует мой трекер, это легко и быстро получить данные для обеих страниц. Однако, если торрент использует другой трекер, мне нужно будет очистить статистику от указанного трекера (делая запросы к нему), но обычно это занимает несколько секунд для каждого торрента, и, очевидно, я не могу заставить пользователей ждать, что чтобы увидеть список.

Я создал сценарий, который сбрасывает последние 90 торрентов в фоновом режиме, но я боюсь, что этого недостаточно. Веб-сайт будет расти, а общий торренты, вероятно, превысят 5000. Я не думаю, что соскабливает, что многие торренты в фоновом режиме будут работать.

Как это сделать?

ответ

2

следующие стратегии, чтобы получить статистические данные, перечисленные в порядке эффективности по убыванию:

  1. полный скрип через интерфейс соскоба - используется, чтобы быть общим, в меньшей степени, сегодня на крупных трекеров из-за трафика он вызывает
  2. полную очистку через пользовательские URL-адреса экспорта - вам нужно спросить администраторов трекера. иногда документируются на их сайтах.
  3. UDP multi-scrape
  4. HTTP multi-scrape via /scrape?info_hash=A&info_hash=B&info_hash=C - некоторые трекеры поддерживают его, некоторые - нет.
  5. HTTP одного скрести
  6. DHT scrape
  7. присоединение роя и измерения с помощью PEX
+1

Интересно. Не могли бы вы объяснить больше о # 6 и № 7? –

+2

они находятся в конце списка по причине. просто перед нами полнота. они вряд ли будут полезны для вашего дела. но я добавил ссылки. – the8472

+0

Хм. Я думаю, что это невозможно сделать, по крайней мере, непросто, поэтому я просто рекомендую пользователям использовать трекер. –

2

Когда открытые трекеры использовали http, вы могли бы выполнить полную очистку после Tracker 'scrape' Convention.
Теперь, когда трекеры используют UDP, больше невозможно выполнить полную очистку.

Как альтернатива, некоторые открытые трекеры публиковать полные потертости на своих веб-сайтах:

Другие трекеры могут или не могут предоставить доступ к такому файлу по запросу.

+0

Да, выскабливание не является проблемой. Тем не менее, соскабливание тонн торрентов для получения данных. –

+0

С полной очисткой или загрузкой выше ссылок вы получаете информацию о царапинах для всех торрентов, которые в настоящее время объявлены трекеру за один раз. Тогда вам нужно только извлечь информацию для торрентов, которые вы хотите. – Encombe

Смежные вопросы