2010-07-27 3 views
15

Я ищу твиттер или другие сайты социальных сетей для моего проекта. В настоящее время у меня есть набор данных CAW 2.0 twitter, но он содержит только твиты пользователей. Мне нужны данные, показывающие количество друзей, последователей и т. Д.Twitter (Social networking) Dataset

Это не должен быть твиттер, но я бы предпочел твиттер или facebook. Я уже пробовал infochimps, но, видимо, файл больше не загружается для twitter.

Может кто-нибудь дать мне хорошие сайты для поиска такого набора данных. Я собираюсь накормить набор данных до хаопа.

ответ

7

Попробуйте следующие три набора данных:

Содержит около 97 milllion твитов:

http://demeter.inf.ed.ac.uk/index.php?option=com_content&view=article&id=2:test-post-for-twitter&catid=1:twitter&Itemid=2

анг.ред : ранее установленный набор данных больше не доступен из-за запроса из Twitter, чтобы удалить его.

Содержит пользовательский график 47 миллионов пользователей:

http://an.kaist.ac.kr/traces/WWW2010.html

После набора данных содержит сеть, а также твиты, однако данные, собранные снежного кома или что-то, следовательно, сеть друзей не однородна. У него около 10 миллионов твитов, которые вы можете отправить исследователю за еще большим количеством данных.

http://www.public.asu.edu/~mdechoud/datasets.html

Хотя посмотреть на лицензии данные распространяется под.

Надеюсь, это поможет, Также вы можете сказать мне, какие работы планируются с помощью этого набора данных? У меня есть несколько Hadoop/свинья скрипты для использования с набором данных

+0

не уверен, но я буду использовать его для моего класса обучения. – denniss

+1

@Akshay Bhat: Кажется, они удалили данные на сегодняшний день. Не могли бы вы узнать какие-либо другие наборы данных, которые могут быть доступны? Спасибо! – Legend

5

100 миллионов страниц были взяты из Facebook: http://it.slashdot.org/story/10/07/28/1350222/100-Million-Facebook-Pages-Leaked-On-Torrent-Site?art_pos=6

Я не знаю, что они содержат, но вы могли бы посмотреть, что кажется, что это легко найти на сайтах торрентов.

Вы также можете использовать API facebook, но если вы хотите, чтобы набор данных был достаточно большим, вам нужно было бы задать facebook права доступа к нему. Он содержит ссылки на друзей, любит, группы, ...

+1

Между прочим, там также есть API Twitter. –

+0

Да, я это видел.спасибо, хотя – denniss

+0

странно, как я не выиграл бонус – 2010-08-27 07:45:07

1

Я думаю, что лучший инструмент для данных щебета сбор является http://www.followthehashtag.com, он может получить исторические или будущие данные и расширенные данные экспорта Характеристика

с разделом, где мы добавляем большие массивы данных (около 200 000 твитов) один раз в неделю

http://followthehashtag.com/datasets/

Смежные вопросы