В plone я загрузил только 800 ГБ данных (в основном pdf), он занял уже 2 ТБ места на жестком диске. Где именно находится пространство? Я использую коллективный.documentviewer с настройками по умолчанию. и plone 4.3. Сохраняются ли файлы, хранящиеся в documentviewer, на различные размеры изображений, например, эскизы, большие изображения и т. Д. И хранятся в папке blobstorage?Где основное пространство, затраченное на загрузку файла Plone?
ответ
С коллективным.documentviewer, пространство почти удваивается (или больше) для каждого PDF.
Чтобы collect.documentviewer выполнял то, что он делает, он преобразует каждый документ в ряд изображений, которые хранятся в дополнение к оригинальному PDF. Он создает 2 набора из них - один меньший размер и один больше. Он делает это, потому что онлайн-просмотрщик использует изображения для отображения документов вместо исходного PDF. Затем он также записывает документ, сохраняет этот текст и создает локальный индекс текста, чтобы его можно было искать.
2TB для 800 ГБ PDF-файлов, вероятно, прав.
Thx @vangheem для быстрого ответа! – user956424
как упомянутый выше @Martijn Pieters, необходимо также рассмотреть пространство, используемое для SearchableTextIndex. однако изображения предварительного просмотра будут намного тяжелее. – fRiSi
- 1. Время, затраченное на загрузку uiscrollview
- 2. Время, затраченное на загрузку функции в C#
- 3. Вычислить время, затраченное на загрузку весенних фасоли
- 4. Время, затраченное на чтение файла
- 5. Время, затраченное на чтение из файла
- 6. Время, затраченное на выделение битмапа
- 7. Запрос на загрузку файла
- 8. Время, затраченное на процедуру
- 9. Изменить максимальную загрузку файла на godaddy cpanel
- 10. Как ограничить расширение файла изображения на Plone?
- 11. PHP форсирует загрузку файла. Не показывать, какое пространство было загружено
- 12. Имя файла изменено на загрузку
- 13. GWT запрос на загрузку файла
- 14. Разрешение на загрузку файла php?
- 15. apache storm wordcount: как оценить время, затраченное на обработку файла
- 16. Время, затраченное на синтаксический анализ и упрощение CNF-файла
- 17. Как распечатать среднее время, затраченное на открытие файла для чтения?
- 18. LFTP: Как узнать время, затраченное на перенос файла?
- 19. Завершить загрузку файла SFTP
- 20. Время, затраченное на загрузку изображения 1M ~ 5M с iPhone на Google AE или Amazon S3
- 21. Время, затраченное на выполнение цикла
- 22. Время, затраченное на консоль win32
- 23. Время, затраченное на операцию MongoDB
- 24. получить Время, затраченное на метод
- 25. Время, затраченное на создание RDD
- 26. Время, затраченное на выполнение%/* + - операции
- 27. Время, затраченное на выполнение Javascript
- 28. Разрешить загрузку файла PHP
- 29. dlopen и dylib: основное приложение и адресное пространство dylib
- 30. Где я могу настроить сообщение приветствия Plone?
ZODB хранит старые версии, пока вы не упакуете. Изменили ли какие-либо из этих PDF-файлов другие PDF-файлы? Затем старая ревизия все еще присутствует на вашем диске. –
Я не обращал внимания на то, чтобы установить дни для упаковки, но означает ли это, что он сохраняет все изменения с самого начала? И что, если не было изменений для pdf-файлов? – user956424
Я думаю, что упаковка без параметра days означает, что вы отбрасываете все недостижимые записи, но сначала создается резервная копия. Plone также индексирует вещи, в зависимости от того, какие внешние инструменты у вас есть, PDF-текст мог быть извлечен и проиндексирован в каталог. –