2013-11-16 3 views
-1

Я новичок в мире python, мне интересно, есть ли способ узнать название веб-сайта для данной строки. Строкой может быть название места или места интереса.Поиск имени сайта для данной строки с использованием python

Спасибо за быстрый ответ, что я пытаюсь создать базу данных колледжей для данного места. До сих пор я получил список имен колледжей, теперь я хотел бы получить их сайты, чтобы добавить в базу данных. Например, если я ищу standford в google, я могу ссылку на сайт колледжа. Я попытался использовать xpath для первой ссылки на результаты поиска, но когда-то я заметил, что Google показывает рекламу, и я не могу это обобщить. Поэтому я ищу альтернативные способы сделать это

+1

Можете ли вы привести нам пример? Как выглядит строка? И что вы имеете в виду под названием «веб-сайт»? –

+0

Каков ваш реальный вопрос программирования? Вы говорите, что какой-то сценарий должен взять «Нью-Йорк» для ввода и возврата «www.applebeesny.com»? Какова ваша логика ввода/вывода (простой английский)? –

+0

Спасибо за быстрый ответ, что я пытаюсь создать базу данных колледжей для данного места. До сих пор я получил список имен колледжей, теперь я хотел бы получить их сайты, чтобы добавить в базу данных. Например, если я ищу standford в google, я могу ссылку на сайт колледжа. Я попытался использовать xpath для первой ссылки на результаты поиска, но когда-то я заметил, что Google показывает рекламу, и я не могу это обобщить. Поэтому я ищу альтернативные способы сделать это. – gmanjunath

ответ

0

Я думаю, что вы ищете что-то вроде Google Search API, а затем используете первый возвращенный результат.

Или вы хотите сделать это без API? Это было бы сложнее. Вероятно, вы можете использовать urllib2, чтобы проверить, существует ли сайт. Но вам нужно будет создать URL-адрес из строки самостоятельно. Это дает вам массу возможностей.

+0

Спасибо за ответ, я попытался использовать xpath, чтобы найти ссылку на первый результат в результатах поиска Google, к сожалению, иногда google отображает ссылку на некоторые из объявлений. Поэтому большую часть времени это не первый результат. Есть ли способ узнать это. – gmanjunath

+0

, поскольку вам удобно пользоваться Google. Я бы просто использовал API поиска Google. [Здесь] (https://developers.google.com/appengine/training/fts_intro/lesson2) описаны основы. [Здесь] (https://developers.google.com/appengine/docs/python/search/indexclass#Index_search) является описанием класса индекса – CML

+0

за предоставленную мне информацию. Я попытаюсь использовать API google searcg. – gmanjunath

Смежные вопросы