Я делаю проект по анализу настроений twitter, но есть некоторые вещи, над которыми я обдумываю.Техника анализа настроений в Twitter
Поскольку твиты чрезвычайно короткие (менее 140 символов), лучшая технология анализа текста. Например. Работает ли работа так же, как и в «коротких» статьях?
Что относительно n-граммов? Является ли краткость твита лучшими или худшими для них?
Будет ли k-ближайший быть более точным, чем часть тегов речи?
Будет ли мой пользовательский набор данных щебетать неактуальным/коррумпированным с течением времени? Поскольку твиттер и информация об этом меняются так быстро, что также вызывает серьезную озабоченность у меня.
Большое спасибо за ваше время.
PS: Вы имеете в виду какие-либо хорошие данные о настроениях twitter? Было бы здорово, если бы он регулярно обновлялся.
[sentiment140.com имеет технический отчет] (http://help.sentiment140.com/), который описывает свой подход. Кажется, это произошло из того же задания. Вот пример: [анализ настроений твитов с «stackoverflow»] (http://www.sentiment140.com/search?hl = en & query = stackoverflow) – jfs