В настоящее время я работаю webscraper, который должен извлекать все описание элемента из целой категории на Amazon. Я пишу этот скрипт с драйвером Python - Selenium - PhantomJS. Как я могу обойти ограничение на 400 страниц?Как я могу обойти результаты поиска Amazon 400 страниц?
ответ
Amazon не предоставляет доступ к этим данным в своем API. У них есть только информация для «Про продавцов» (не стандартных продавцов) и связанных с его собственными продажами, доставкой или продуктами (вы можете найти информацию в Amazon marketplace Feed API page).
Единственный способ, которым я мог бы это сделать, - перебирать страницы категорий. Чтобы сделать это, вы должны начать с интересующей вас категории, получить описание, цену ... и с помощью вашего webscraper найти элемент с идентификатором «pagnNextLink». Затем загрузите следующую страницу и повторите процесс, пока вы не сможете найти этот элемент.
И помните, что вы должны перебирать страницы один за другим (вы не можете перейти на другую страницу, изменяя параметр «sr_pg_» в ссылке), поскольку Amazon включает ссылки ссылок на сеанс, и эта ссылка созданный на каждой новой странице.
- 1. Как я могу интегрировать результаты поиска Amazon в свое приложение?
- 2. Результаты поиска приложений 400 ошибок
- 3. Как получить результаты поиска от Amazon?
- 4. Как я могу отсортировать результаты поиска Elasticsearch?
- 5. Как получить результаты поиска с нескольких страниц
- 6. Как я могу обойти UIView
- 7. Как я могу обойти ImageView?
- 8. Как я могу обойти номер?
- 9. MVC3 Сохранить результаты поиска при смене страниц
- 10. Как я могу «обойти» файл в PhpStorm?
- 11. Как я могу обойти мой сценарий входа?
- 12. Как я могу обойти асимметрию GetParent/EnumChildWindows?
- 13. Как я могу обойти ограничения размера данных?
- 14. Как я могу обойти круговое движение jquery?
- 15. Как я могу обойти эту серию
- 16. Как я могу обойти запрос аппаратной виртуализации
- 17. Как я могу обойти UIImageView в UICollectionViewCell?
- 18. Как я могу обойти проблему RefCell?
- 19. Как я могу обойти эту неудачу альфы?
- 20. Как я могу обойти ограничения ⎕CT?
- 21. Как очистить результаты поиска, охватывающие несколько страниц с помощью lxml
- 22. Как я могу перебирать результаты поиска с помощью углового?
- 23. Как я могу перевести результаты поиска в ссылки на php?
- 24. Использование инструментов GAS Как я могу отличить результаты поиска()
- 25. Как я могу получить результаты поиска на основе DuckDuckGo API?
- 26. Как я могу автоматически обновлять результаты поиска с помощью маркера?
- 27. Как я могу отсортировать результаты поиска lucene между несколькими индексами?
- 28. Как я могу сортировать результаты индекса поиска appengine по релевантности?
- 29. ASP.NET: как показать результаты поиска, разбитые на список номеров страниц
- 30. Как переопределить результаты поиска поиска
Поговорите с Amazon, запросите у них официальный доступ к данным !? – deceze
Думаю, у меня нет веских оснований для этого. Мне нужно другое решение. – python010101
Тогда, честно говоря, вам, вероятно, не повезло. – deceze