13

Twitter, Google, Amazon, del.icio.us и т. д. все дают вам массу данных для игры, все бесплатно. Существует также много текстовых данных, доступных через такие инициативы, как Project Gutenberg. И это, кажется, только верхушка айсберга.Каким образом можно получать удовольствие от большого количества данных? (т. е. API-интерфейсы Twitter, del.icio.us и т. д.)

Мне было интересно, как вы можете использовать эти данные для развлечения. Я первый студент IT-класса, поэтому у меня нет знаний о статистике, машинах, совместной фильтрации и т. Д. Мой интерес к этой области был вызван книгой Программирование коллективного интеллекта от Toby Segaran, и теперь я хочу взять более глубокий взгляд на то, что вы можете делать с данными. Я не знаю, с чего начать. Есть идеи?

Я также размышлял над тем, стоит ли мне покупать и покупать что-то вроде Парадигмы программирования искусственного интеллекта. Стоит ли путешествовать по городу?

+0

Amazon продает книги :) зачем путешествовать по городу? –

+0

Не продает книги в Индии :( –

ответ

6

Попробуйте уволить книги в разных стилях от Гуттенберга через генератор цепей Маркова - есть один в Perl here, чтобы вы начали.

+0

Ударьте меня на это. Марковские машины - отличная забава :) –

+0

Опубликуйте результаты в учетной записи Twitter через свой API и посмотрите, сколько последователей вы можете получить на основе ваших твитов, созданных машиной. –

+1

Мне это нравится! Но большинство твитов, похоже, плохо программируемых ИИ. У меня есть серьезные сомнения относительно их способности пройти тест Тьюринга. – 2009-04-05 16:49:09

3

Визуализации, делать их, делиться ими.

0

Вы можете создавать головоломки, как игры в палату. Или mashup или попробуйте трубки Yahoo, чтобы присоединиться к информации.

1

Вы можете использовать некоторые из этих данных, чтобы заработать деньги (если вы действительно хороши!) http://www.netflixprize.com/ Netflix предоставил анонимный набор данных и просит улучшить алгоритмы для прогнозирования выбора клиента.

+0

Да, я собирался предложить это. Я сейчас работаю над этим. –

0

Прогнозировать будущие тенденции на рынке ценных бумаг по данным. Прибыль!

+0

Легче сказал, что сделал. – Cerin

1

Если вы знакомы с Python, попробуйте сыграть с nltk. Он имеет множество библиотек для интеллектуального анализа текста и даже машинного обучения в целом. Попробуйте проложить свой путь через nltk book.

1

Если вы хотите начать с легкой проблемы с AI, попробуйте кластеризацию.

http://en.wikipedia.org/wiki/Data_clustering

Вы можете использовать его для группы FLICKR изображений вместе по тэгу или что-то прохладное, как это.

Смежные вопросы