Первичный вопрос: ограничат ли ограничения в Twitter ваши данные, необходимые для построения полного графика социальной сети со всеми направленными ребрами из примерно 600 тыс. Пользователей?Ограничения лимита Twitter позволят мне выполнить сбор данных, необходимых для построения полного графика социальной сети около 600 тыс. Пользователей?
Вот идея:
Ребра/связи/отношения в сети будет последователем/с последующим отношения.
Начните с определенного списка примерно из 600 пользователей Twitter, выбранных потому, что они все из всех новостных отделений в большом городе.
Соберите всех подписчиков и друзей (люди, которых они следуют) для всех 600 пользователей. У этих пользователей, вероятно, есть среднее число последователей по 2000 человек. У них, вероятно, есть среднее число друзей (люди, которых они следуют) из 500.
Поскольку эти последователи 600 находятся в одном городе, ожидается, что многие из этих последователей будут теми же пользователями, которые следуют за этими 600 людьми , Итак, давайте приблизиться и догадаться, что у этих 600 пользователей всего 600 000 последователей и друзей. Таким образом, это будет подграф/сеть из 600 600 пользователей Twitter.
Итак, как только я собрал всех 600 000 последователей и друзей всех этих 600 человек, я хочу иметь возможность построить социальную сеть из всех этих 600 600 человек и их последователей. Это потребовало бы, чтобы я мог по крайней мере найти все направленные ребра среди этих 600 600 пользователей (независимо от того, следуют ли каждый из этих 600 600 пользователей друг друга). С лимитом скорости Twitter, будет ли этот вид интеллектуального анализа данных осуществимым?
Возможно, вы могли бы рассказать нам о ставках в твиттере, поэтому нам не нужно искать их сами. Плюс, моя главная забота заключается в том, что получившаяся в результате сеть в значительной степени бессмысленна ... что * семантика * делает твиттер, который на самом деле имеет? Не намного больше, чем «случайно нажал неправильную кнопку», не так ли? –
Уверены ли вы, что у вас есть аппаратное обеспечение, чтобы хруст числа на графике с 600K узлами и примерно 1.2M ребрами (используя вашу оценку 2K последователей каждый)? –