Я пытаюсь создать модель языка нейронной сети, и кажется, что инструмент word2vec от Mikolov et al - хороший инструмент для этой цели. Я пробовал это, но он просто создает представления слов. Кто-нибудь знает, как я могу создать модель языка с помощью этого инструмента или любой другой разумной основы глубокого обучения?Как вычислить языковую модель с помощью инструмента word2vec?
ответ
Doc2Vec, реализованный в Gensim, выполняет эту работу. Фокус в том, что они используют идентификатор документа как контекстное слово, которое присутствует во всех размерах окна всех слов в документе.
Кодекс here in Python/Gensim
word2vec
- инструмент для представления одного слова (группы слов) в виде числового вектора. Поэтому он не имеет прямого отношения к языковой модели.
Для создания языковой модели вы можете использовать MITLM для этого. Например, вы можете создать модель N-грамм, используя корпус Lectures.txt
с помощью этой команды:
estimate-ngram -text Lectures.txt -write-lm Lectures.lm
Отличный учебник можно найти here.
Да, но моя цель - придерживаться моделей языка нейронной сети, особенно тех, которые очень близки к современным методам и имеют простую в использовании среду. – Ash
На самом деле word2vec изучает модель нейронного языка, а затем отбрасывает свои интеллектуальные способности, сохраняя только внутренние представления (вложения) целевого слова. – cvangysel
Microsoft Research выпустила набор инструментальных средств для моделирования языков с векторами в стиле word2vec. Вы можете найти его here.
- 1. Запрос на модель Word2vec
- 2. Как загрузить языковую модель Spacy на Bluemix
- 3. Как построить языковую модель из фонетической транскрипции?
- 4. Модель Gensim Word2Vec: размеры выреза
- 5. Как импортировать word2vec в модель TensorFlow Seq2Seq?
- 6. загрузить предварительно подготовленную модель word2vec для doc2vec
- 7. Как инициализировать новую модель word2vec с предварительно обученными весами модели?
- 8. Вычислить точность модели word2vec в Python
- 9. Как создать большую языковую модель языка для CMU Sphinx?
- 10. Gensim: как переучивать doc2vec модель с использованием предыдущей модели word2vec
- 11. Word2Vec Модель Сохранение модели в одиночной части
- 12. Как найти наиболее значимые слова в тексте с помощью word2vec?
- 13. Ошибка при загрузке Word2Vec модель gensim
- 14. Как найти самое близкое слово для вектора с помощью word2vec
- 15. Как вычислить сходство косинусов между двумя словами (word2vec в matlab)?
- 16. реализация word2vec с отрицательной выборкой
- 17. Как определить языковую версию Windows
- 18. Как тренировать модель p (категория | название) с помощью слова2vec
- 19. Сохранить gensim Word2vec модель в двоичном формате .bin с save_word2vec_format
- 20. Анализ настроений с использованием word2vec
- 21. Как применить word2vec к изображениям?
- 22. Можно ли вычислить слова и предложения векторов одновременно с помощью Word2Vec или Doc2Vec?
- 23. Как вычислить перехват с помощью numpy.linalg.lstsq
- 24. deeplearning4j: online Word2Vec training
- 25. о word2vec most_similar() функция
- 26. Как автоматизировать процесс с помощью инструмента ожидания?
- 27. Можно ли обучать искровую модель word2vec в пакетном режиме
- 28. Как использовать deeplearning4j Word2vec с Spark?
- 29. Как получить векторы для списка слов с помощью Word2Vec?
- 30. Как скачать word2vec?
Я использую OpenNLP прямо сейчас. – mvw
Теперь я знаю, что вы не можете построить модель языка нейронной сети с word2vec, благодаря Phyrox. Так что мне нужен инструмент глубокого обучения с простой в использовании функцией для создания языковых моделей. – Ash