2015-06-24 4 views
9

Возможно ли получить список пакетов pypi python, упорядоченных по популярности (количество посещений)?Пакеты PyPI по популярности

Я не могу найти способ сделать это на pypi. Может быть, pypi предоставляет свалку базы данных для этой цели?

Если я не могу найти более простой способ, я планирую очистить pypi, используя их JSON api.

ответ

4

Обновление 5/5/2018: Сайт Python Wheels содержит список «360 самых загруженных пакетов на PyPI, которые были загружены в виде колесных архивов».

https://pythonwheels.com/

Обновление 5/28/2016: Еженедельные списки на этом сайте по всей видимости, в настоящее время нарушена. Всеобъемлющий список по-прежнему является хорошим источником для списка популярных библиотек Python. Я обновлю это в будущем, если что-то изменится.

Этот веб-сайт имеет список по неделе и все время: http://pypi-ranking.info/

+1

Еженедельный список кажется полностью сломанным (вероятно, потому, что PyPI прекратил предоставлять такие подсчеты). –

+0

Спасибо. Я обновил тело своего ответа, чтобы отметить это. –

2

http://pypi-ranking.info/ в настоящее время вниз.

Другим полезным сайтом является http://pythonwheels.com/. Он показывает 360 наиболее загруженных пакетов на PyPI. Я считаю, что панель справа перечисляет эти пакеты в порядке. Зеленые пакеты - это те, которые поддерживают колеса. Белые пакеты - это те, которые еще не существуют.

2

Вот метод, используемый Python 3 Wall of Superpowers (source):

>>> import xmlrpclib 
>>> sp = xmlrpclib.ServerProxy("https://pypi.python.org/pypi") 
>>> sp.top_packages(50) 
[['simplejson', 232795919], ['setuptools', 118974021], ['six', 110953835], ['requests', 103009497], ['pip', 82348965], ['python-dateutil', 68994216], ['virtualenv', 64726493], ['boto', 60814740], ['pyasn1', 57167291], ['pbr', 53989984], ['docutils', 49645652], ['distribute', 44897377], ['pytz', 44838753], ['certifi', 44593068], ['botocore', 42494878], ['rsa', 41967257], ['PyYAML', 41735162], ['jmespath', 38164891], ['awscli', 37728925], ['colorama', 37304705], ['Jinja2', 36474201], ['wincertstore', 34934026], ['nose', 34734172], ['MarkupSafe', 33533726], ['lxml', 32610021], ['cffi', 30351084], ['selenium', 29777183], ['paramiko', 28811145], ['pycrypto', 28021855], ['argparse', 27471379], ['pycparser', 26290365], ['coverage', 25363159], ['Django', 24411024], ['ecdsa', 24180825], ['mock', 23037488], ['psycopg2', 21255512], ['pika', 20997477], ['wheel', 19900683], ['httplib2', 19624689], ['pep8', 19327352], ['Pygments', 18299401], ['enum34', 18076436], ['redis', 18068603], ['SQLAlchemy', 17997426], ['futures', 17974686], ['Werkzeug', 17965298], ['psutil', 17369779], ['pymongo', 16492527], ['cryptography', 15976239], ['Pillow', 15377835]] 

[EDIT] Этот источник данных не был обновлен в 3-х месяцев, так как я отправил свой ответ. См. Мой другой ответ для лучшего решения.

+0

Это довольно круто, вы знаете, что такое цифры? Идентификаторы? Не могу себе представить, что simplejson был загружен 237 миллионов TImes: D – user1767754

+0

@ user1767754: Я считаю, что это именно то, что это значит. – mhsmith

0

Журналы загрузки PyPI с октября 2016 года могут быть проанализированы очень подробно на BigQuery. Вот example query, чтобы получить самые загружаемые пакеты, но также доступны многие другие размеры.

Background information (может быть несколько устаревшим).

Смежные вопросы