Я пытаюсь обучить свою модель данными размером 50 МБ. Мне просто интересно, существует ли правило/алгоритм для определения размера измерения для алгоритма.Какое должно быть измерение векторов для алгоритма word2vec для данных 50 мб
2
A
ответ
0
Я бы предположил, что текстовый файл размером 50 МБ содержит около 500 000 предложений или 5 миллионов токенов. Это слишком мало для обучения содержательному встраиванию, однако здесь приведены эмпирические данные (обученные 6 миллиардам токенов), о которых вы могли бы обратиться.
Источник: https://nlp.stanford.edu/pubs/glove.pdf
Смежные вопросы
- 1. html5 для хранения данных более 50 МБ?
- 2. Какое измерение должно иметь ядро инициализации cuRAND
- 3. Какое поле базы данных должно быть?
- 4. , какое поведение должно быть реализовано?
- 5. Какое должно быть отношение повторения?
- 6. Приложение Adobe AIR для Android 50 МБ
- 7. Какое лучшее измерение для приложения для Android?
- 8. Создать 50 МБ Java-объект
- 9. Какое значение имеет длина вектора Word2vec?
- 10. Какое должно быть регулярное выражение для пароля в этих условиях?
- 11. Какое имя пользователя должно быть отключено для пользователей (социальная сеть)
- 12. Какое должно быть значение моей постоянной маски для сортировки radix?
- 13. Какое должно быть начальное значение для статуса возврата в C?
- 14. какое разрешение должно быть добавлено для внешней библиотеки в android
- 15. Какое исключение должно быть выбрано для недопустимого имени файла?
- 16. Какое исключение должно быть выбрано для недопустимого идентификатора?
- 17. Какое должно быть правило .htaccess для следующего условия?
- 18. Какое должно быть это регулярное выражение для холодной инфузии?
- 19. Какое значение useragent должно быть http-заголовком для java-клиента
- 20. Какое разрешение должно быть добавлено для добавления контакта?
- 21. Измерение сжатия алгоритма Хаффмана
- 22. Какое разрешение должно быть в моем приложении?
- 23. Какое состояние должно быть завершено ByteBuffers?
- 24. Какое должно быть местоположение базы данных sqlite в приложении Android?
- 25. Какое поведение должно быть объектом тестирования?
- 26. Какое должно быть свойство связывания пути?
- 27. Какое имя пользователя должно быть разрешено?
- 28. Какое значение должно быть вместо «подчеркивания»?
- 29. Какое исключение должно быть выбрано в JavaScript?
- 30. Jsoup: какое поле ввода должно быть опубликовано?