Задача состоит в том, что URL-адреса Amazon не имеют единого формата, существуют различные виды, в зависимости от типа используемого идентификатора и вида продукта.
Идентификатор или ключ могут быть ASIN или другими видами идентификаторов продуктов, например.
Действительные значения: SKU | UPC | EAN | ISBN (только для США, когда поисковым индексом является «Книги»). UPC недействительна в локали CA. (через http://docs.aws.amazon.com/AWSECommerceService/latest/DG/ItemLookup.html)
Amazon URL, часто (но не всегда) вида http://www.amazon.com/(title продукта)/дп/(идентификатор)/(более случайных символов не имеет значения здесь).
В дополнение к/dp /, вы также можете увидеть/продукт /,/ASIN /,/e /.
Лучше всего использовать регулярное выражение для извлечения (идентификатора), а затем вызвать API поиска элементов Amazon со всеми различными типами в виде IdType, передав идентификатор как ItemID и посмотреть, что соответствует.
Без дополнительной информации или конкретного варианта использования невозможно узнать, имеет ли URL-адрес ASIN, ISBN, SKU или какой-либо другой идентификатор, поэтому вам придется запрашивать их у всех, посмотреть, какие совпадения и извлечь ASIN из полезной нагрузки возврата элемента.
Просто из интереса - что означает «от вставленного URL-адреса Amazon»? Кто-то вставляет URL-адрес в текстовое поле? – Trent
Да. На моей странице есть текстовое поле, в которое кто-то может вставить URL-адрес. –
На что это похоже? Неужели вы можете получить с ним регулярное выражение? – Trent