Я разрабатываю сетевую обучающую сеть с nntool в Matlab, и у меня есть входы 11250 текстовых файлов различной длины (от 10 до 500 слов или, скажем, от 10 до 200 слов, если я удаляю избыточные слова), я не нашел хорошего метода для представления этих входных текстов в качестве цифровых данных для запуска моего алгоритма обучения. Я думал о создании словаря слов, но я обнаружил, что словарь содержит 16000 различных слов, которые огромны. Между некоторыми текстовыми файлами есть несколько слов.Текстовое представление для нейронной тренировки Сеть
0
A
ответ
0
Для быстрого усвоения вам следует искать «мешок слов» или «tfidf». Если вы не знаете, что это такое, вы должны начать здесь: https://en.wikipedia.org/wiki/Vector_space_model или https://en.wikipedia.org/wiki/Document_classification.
Вы прочитали какую-либо книгу о НЛП? Возможно, это может быть ценным: http://www.nltk.org/book/ в самом начале.
Смежные вопросы
- 1. Изменение обучаемых изображений для тренировки нейронной сети
- 2. Как получить параметр нейронной сети после тренировки?
- 3. Установка ошибки тренировки в нейронной сети
- 4. Мне нужен способ тренировки нейронной сети, отличной от backpropagation.
- 5. MSE во время тренировки нейронной сети
- 6. добавление новых выходных нейронов в нейронную сеть после тренировки?
- 7. Представление Grid World для нейронной сети
- 8. Высокая обучающая ошибка в начале тренировки Сверточная нейронная сеть
- 9. Данные последовательной тренировки для XOR Рекуррентная нейронная сеть
- 10. текстовое представление
- 11. Очень простая 3 нейронной сеть с MPICH
- 12. Как отключить окно, которое появляется после тренировки нейронной сети в MATLAB
- 13. Текстовое представление содержимого TableView
- 14. текстовое представление оси y
- 15. JSQMessages только текстовое представление
- 16. Эхо-состояние нейронной сети?
- 17. Программирование нейронной сети, поиск хорошей и простой игры для тренировки сети для
- 18. Тренировка тренировки RNN Tensorflow
- 19. Распознавание изображений с нейронной нейронной сетью?
- 20. Помощь с нейронной нейронной сетью
- 21. Целевые значения для нейронной сети
- 22. Распознавание символов нейронной сети
- 23. Очень большие наборы данных для тренировки нейронной сети с использованием имитированного отжига
- 24. Есть ли текстовое представление Thrift?
- 25. Тренировка нейронной сети для добавления
- 26. Номер для заказа нейронной сети
- 27. Правильно ли используется нейронная сеть для оптимизации?
- 28. MATLAB нейронной сеть инициализация веса в нескольких петлях
- 29. Android - обновить текстовое представление периодически
- 30. Точное текстовое представление IEEE «double»
Какова общая цель вашей нейронной сети? ... Каков ожидаемый результат? Если это, скажем, спам-классификатор, то бинарный вектор, размер вашего словаря, где 0/1 указывает на присутствие определенного слова, - это то, что обычно делается. – rayryeng