2013-03-11 2 views
0

Мне нужно создать файл базы данных/csv, содержащий 150 000 предложений (естественный разговор человека/думаю /), связанный с определенным ключевым словом. Например, «iphone 5».ресурс для веб-соскабливания/обхода

Я пытаюсь использовать Google для поиска ключевого слова и получения результата, выполните некоторые сканирование через Интернет, но это не сработает.

Если вы могли бы дать мне лучший совет, любое бесплатное программное обеспечение, ресурс, где я могу получить хороший результат.

Благодаря

+0

Это больше связано с SEO? Возможно, попробуем обратиться по адресу http://webmasters.stackexchange.com/ –

ответ

1

Вы не можете скоблить результаты поиска Google. (Ну, на самом деле, Google не поощряет это.) Попробуйте Google CSE для этого.

Есть некоторые рамки/сайты, которые облегчат очистку.

http://scraperwiki.com

http://scrapy.org

EDIT: 12/08/16

Scraperwiki теперь https://quickcode.io/

0

для запрошенной задачи я хотел бы предложить строить динамическую базу данных, которая содержит социальной информации от нескольких социальных сайтов (форумов, статей и т. д.).

вы можете создать свой собственный небольшой веб crawller и конфиг его, чтобы очистить только необходимое содержание или вы можете использовать wget или curl, а также (те свободные искатели).

Теперь вы можете заполнить свой дБ социальным контентом, а затем найти его по ключевым словам и найти соответствующие социальные сообщения, которые вам нужны.

+0

thanx. Это то, что я сделал. Каждый мин я посещал социальные сайты и проверял, есть ли новый пост. Если есть, он будет автоматически отправлять сообщения в базу данных. – John

+0

отлично! ключ заключается в тонкой настройке вашего скребка и сохранении только соответствующих данных ... чище лучше. удачи –

Смежные вопросы