2015-03-31 2 views
0

Любые книги, учебные пособия, курсовые пособия будут высоко оценены.Что мне нужно знать о НЛП, чтобы иметь возможность использовать и тренировать НЛП Стэнфорда для анализа намерений?

Мне нужно знать, на каком уровне мне нужно обращаться с НЛП, чтобы понять Стэнфордский НЛП и обучить его настройке для моего приложения анализа коммерческих настроений.

Моя цель - не карьера в НЛП или стать экспертом в области НЛП, а только для того, чтобы быть настолько опытным, чтобы правильно понимать и использовать рамки НЛП с открытым исходным кодом и обучать их для моего приложения.

Для этого уровня, какое исследование или обучение НЛП потребуется?

Я также изучаю C# и .net.

ответ

1

Во-первых: просто использовать модель настроения или обучать на основе существующих данных, есть не слишком много фона, чтобы узнать:

  • лексемизацию
  • синтаксический Представительства в Обработайте деревья и т.д.
  • Базовая машина концепции обучения (классификация, функции затрат, комплекты обучения/разработки и т. д.)

Это хорошо документированные идеи и все они от Google. Возможно, стоило бы снять Coursera Natural Language Processing course (созданный людьми здесь, в Стэнфорде!) Для вышеупомянутых идей.

После этого важной задачей является понимание того, как работает модель настроений RNTN внутри CoreNLP. Полагаю, вам не нужно полностью понимать математику, но основная рекурсивность алгоритма важна для понимания. Лучший ресурс - это, конечно, original paper (и, если честно, не так уж и много).

Для обучения вашей модели настроения вам понадобятся ваши собственные данные о настроениях. Получение этих данных - небольшая задача. Данные для модели настроения Стэнфорда были краудсорсированы, и вам может понадобиться сделать что-то подобное, если вы хотите собрать что-нибудь около того же масштаба.

В документе настроений RNTN (см. Выше) приводится подробная информация о формате данных. Я рад расширить это, если вы хотите создать свои собственные данные.

+0

Большое спасибо за ответ. То, что я хочу построить, - это алгоритм, который может анализировать данные твиттов твитов (тысячи твитов) для определенного ключевого слова и анализировать фильтры этих твитов, чтобы найти людей определенного намерения. Например, я хочу прокормить алгоритм 10K твитов, очищенных для ключевого слова «NLP» из твиттера, и я хочу, чтобы алгоритм отфильтровывался и давал мне количество твитов, которые имеют намерение «изучить NLP» (никаких маркетинговых сообщений, фактических пользователей) , У меня нет опыта работы в НЛП и обучения программированию. Как вы рекомендуете, я должен продолжить? Изучите Python, а затем stanford cors? –

+0

Получение данных не является проблемой. Проблема заключается в разработке этого алгоритма с нуля (с использованием исходных NLP-фреймворков0 для фильтрации даты для вышеупомянутой потребности. Будет ли достаточно библиотека Python NLTK для этого или Стэнфорда? Были ли упомянутые выше шаги правильными путь для проекта, о котором я упоминал выше? –

+0

ссылка, о которой вы упомянули, имеет больше анализа положительных, отрицательных или нейтральных настроений относительно определенной вещи. В этом проекте цель состоит не в том, чтобы найти позитивный, отрицательный или нейтральный. означает упоминание ключевого слова и фильтрацию через данные, чтобы найти определенное намерение для указанного ключевого слова в данных? Ключевое слово queried также может быть «learn nlp», «study nlp» и т. д.Но целью здесь является фильтрация больших данных для рекламы и людей, которые упоминают эти ключевые слова по другим причинам (например, кто-то говорит «изучать nlp» кому-то, мы этого не хотим) обнаруживаем фактических пользователей. –

Смежные вопросы