2014-11-13 2 views
2

Кто-нибудь знает, как я могу легко загрузить все опубликованные рефераты статей? Я работаю над текстовым проектом.Загрузите все публичные тезисы

Самый близкий из них, который я могу найти, может загрузить один реферат одновременно с pmid, но это было бы слишком медленно для моей цели, так как я должен был бы загружать их по одному.

+2

Вы в конце концов создали для этого сценарий? Если да, можете ли вы поделиться им? Благодаря! –

ответ

2

Я бы использовал RESTful API provided by Europe PMC. Они позволяют загружать 25 статей на запрос в формате json или xml. Примеры запросов для статей о малярии будет выглядеть так:

Вы можете использовать другой формат поискового запроса, это зависит от того, что вы действительно хотите получить.

5

Поиск "0000/01/01"[PDAT] : "3000/12/31"[PDAT] должен получить каждую статью с самого начала.

Возможно, функция «отправлена», показанная прямо над результатами поиска, позволит вам загрузить все.

В качестве альтернативы вы можете написать сценарий и использовать программу программирования Entrez из NCBI.

Вы можете выполнить поисковый запрос, используя ESearch, который вернет все PMID. Затем вы можете использовать EFetch для возврата всех данных. Это объясняется в этой книге/руководство: http://www.ncbi.nlm.nih.gov/books/NBK25501/

Глава 3 содержит некоторые примеры скриптов, которые должны получить вы начали: http://www.ncbi.nlm.nih.gov/books/NBK25498/#chapter3

вы получите XML-файлы, содержащие абстрактные и все другие данные.

25000000 XML файлы ...

0

Я знаю, это зашло немного черствый, но у них есть процесс для вашего точно такой же вариант использования - крупных горнодобывающих проектов.

Вы можете получить данные через бесплатное лицензионное соглашение - дополнительную информацию here.

5

Вы можете получить ВСЕ данные из NLM напрямую через FTP.

https://www.nlm.nih.gov/databases/license/license.html

Скачать и работать вдали, не заботясь о е-утилитами.

+2

Хотя эта ссылка может ответить на вопрос, лучше включить здесь основные части ответа и предоставить ссылку для справки. Ответные ссылки могут стать недействительными, если связанная страница изменится. – davejal

+1

Я думаю, что эта страница предлагает MEDLINE, которая, я считаю, является (значимым) подмножеством того, что предлагает публикация. – jiggunjer

Смежные вопросы