Модель суммирования текста тензорного потока, как описано здесь https://github.com/tensorflow/models/tree/master/textsum, требует многопроцессорной архитектуры для обучения. Мои неоднократные попытки обучения модели привели к исключениям в памяти, поломки машин по разным причинам. Доступна ли подготовленная модель обобщения, поэтому можно использовать модель обобщения без необходимости обучения? Модель суммирования обучается с использованием несвободного набора данных Gigaword, если обученная модель недоступна в Google, является ли это фактором, почему?Использование модели суммирования без обучения
ответ
Насколько я могу судить, никто не поставил обученную модель там, на которую ссылаются. Я тоже изначально сталкивался с проблемами памяти на моем macbook pro и, в конечном итоге, использовал свой игровой ноутбук, у которого был гораздо лучший графический процессор.
Другой вариант, конечно, состоит в том, чтобы использовать AWS и использовать что-то вроде своего экземпляра g2.2xlarge. У них также есть свои экземпляры P2, но я еще не проверил это.
Что касается набора данных Gigaword, это просто сводится к лицензированию. Это не бесплатная лицензия от НРС, и часто многие из ученых, работающих над этим, имеют набор данных, предоставляемый им через их университеты или компании. Мне не повезло найти его, однако LDC вернулась ко мне и сообщила, что у них есть другие наборы данных, в которых есть pricetag около 300 долларов США, что гораздо разумнее для тех, кто использует, просто пытаясь изучить TF. Тем не менее, если вы не хотите ничего покупать, вы всегда можете написать свой собственный скребок страницы и отформатировать данные для модели textum. https://github.com/tensorflow/models/pull/379/files
Надеюсь, это поможет некоторым. Удачи!
- 1. Использование GPU для обучения модели
- 2. Использование нейронных сетей без обучения
- 3. Модели обучения в Caret без настройки R
- 4. Использование суммирования Excel для суммирования элементов матрицы
- 5. Использование Guardian без модели
- 6. Ошибка суммирования и модели lm
- 7. Использование django-tastypie без модели
- 8. Rails - Использование скрепки без модели?
- 9. Использование RapidMiner для обучения модели из нескольких файлов
- 10. Как обновлены модели машинного обучения?
- 11. Расширение обучения модели организации OpenNLP
- 12. Использование Excel для суммирования позиций
- 13. Сохранение модели тензорного потока после обучения завершено
- 14. Выбор модели с нейронной сетью отсева обучения
- 15. Использование dplyr для суммирования несколькими группами
- 16. Укрепление обучения без состояния преемника
- 17. Цель обучения C без Mac
- 18. Классификация текста без машинного обучения
- 19. Различное использование классификаторов машинного обучения
- 20. Использование cloud9 для обучения php
- 21. Использование JavaScript для машинного обучения
- 22. Использование архитектуры компьютерной системы обучения?
- 23. Использование backbone-validation.js на модели без просмотров
- 24. Использование EF7 с необработанными запросами без модели
- 25. Использование переменного для представления без изменения модели
- 26. Использование светильников без соответствующей модели в Rails
- 27. Использование помощников формы Rails без модели
- 28. Использование концепции модели backbone.js без просмотров/маршрутизации
- 29. Как сохранить модели машинного обучения в R
- 30. Как запустить перевод после обучения модели?