У меня есть обученные модели word2vec в geinsim с размерами 300 и хотелось бы сократить размеры до 100 (просто отбросьте последние 200 размеров). Что является самым простым и эффективным способом использования python?Модель Gensim Word2Vec: размеры выреза
0
A
ответ
1
Вы можете сохранить модель вывода в word2vec format. Обязательно сохраните его как текстовый файл (.txt). Формат слова2vec выглядит следующим образом:
Первая строка - <vocabulary_size> <embedding_size>
. В вашем случае <embedding_size>
будет 300
. Остальные строки будут <word><TAB><300 floating point numbers space separated>
. Теперь вы можете легко разобрать этот файл на питоне и отбросить последние 200 плавающих точек от каждой из строк. Обязательно обновите <embedding_size>
в первой строке. Сохраните это как новый файл (необязательно). Теперь вы можете загрузить этот новый файл в виде новой модели word2vec, используя load_word2vec_format().
Просьба не беспокоить, если это решает вашу проблему.
Смежные вопросы
- 1. Ошибка при загрузке Word2Vec модель gensim
- 2. GenSim Word2Vec неожиданно обрезка
- 3. Gensim word2vec онлайн-обучение
- 4. Gensim Word2vec: Semantic сходство
- 5. score_cbow_pair в word2vec (gensim)
- 6. gensim word2vec дает непоследовательные результаты
- 7. параметры Word2Vec и Gensim эквивалентности
- 8. gensim word2vec - размеры массива при обновлении с онлайн-встраиванием слов
- 9. Усреднение нескольких моделей Word2vec Gensim
- 10. Запрос на модель Word2vec
- 11. Gensim Word2vec хранения атрибут syn0norm
- 12. Что такое вывод Gensim word2vec
- 13. Gensim: как переучивать doc2vec модель с использованием предыдущей модели word2vec
- 14. Сохранить gensim Word2vec модель в двоичном формате .bin с save_word2vec_format
- 15. Переименовать gensim Слова Word2Vec с отображением
- 16. gensim word2vec accessing in/out vectors
- 17. Различные модели с gensim Word2Vec на python
- 18. Попытка Deepdict, запустить gensim word2vec с pyspark
- 19. Интерпретация отрицательного сходства Word2Vec с gensim
- 20. Откуда берутся размеры в Word2Vec?
- 21. Что такое параметр «null_word» в gensim Word2Vec?
- 22. Получить весовые матрицы от gensim word2Vec
- 23. gensim word2vec: Найти число слов в словаре
- 24. загрузить предварительно подготовленную модель word2vec для doc2vec
- 25. нагрузки gensim Word2Vec вычислен в Python 2, в Python 3
- 26. Gensim word2vec увеличить или объединить предварительно подготовленные векторы
- 27. Как обучать word2vec с gensim для арабского/персидского языка
- 28. Обучение Word2vec с использованием gensim начинает замену после предложений 100K
- 29. Почему я не могу воспроизвести результаты word2vec с помощью gensim
- 30. Gensim: как загрузить предварительно подготовленную модель doc2vec?