2015-06-10 3 views
2

В plone я загрузил только 800 ГБ данных (в основном pdf), он занял уже 2 ТБ места на жестком диске. Где именно находится пространство? Я использую коллективный.documentviewer с настройками по умолчанию. и plone 4.3. Сохраняются ли файлы, хранящиеся в documentviewer, на различные размеры изображений, например, эскизы, большие изображения и т. Д. И хранятся в папке blobstorage?Где основное пространство, затраченное на загрузку файла Plone?

+1

ZODB хранит старые версии, пока вы не упакуете. Изменили ли какие-либо из этих PDF-файлов другие PDF-файлы? Затем старая ревизия все еще присутствует на вашем диске. –

+0

Я не обращал внимания на то, чтобы установить дни для упаковки, но означает ли это, что он сохраняет все изменения с самого начала? И что, если не было изменений для pdf-файлов? – user956424

+1

Я думаю, что упаковка без параметра days означает, что вы отбрасываете все недостижимые записи, но сначала создается резервная копия. Plone также индексирует вещи, в зависимости от того, какие внешние инструменты у вас есть, PDF-текст мог быть извлечен и проиндексирован в каталог. –

ответ

5

С коллективным.documentviewer, пространство почти удваивается (или больше) для каждого PDF.

Чтобы collect.documentviewer выполнял то, что он делает, он преобразует каждый документ в ряд изображений, которые хранятся в дополнение к оригинальному PDF. Он создает 2 набора из них - один меньший размер и один больше. Он делает это, потому что онлайн-просмотрщик использует изображения для отображения документов вместо исходного PDF. Затем он также записывает документ, сохраняет этот текст и создает локальный индекс текста, чтобы его можно было искать.

2TB для 800 ГБ PDF-файлов, вероятно, прав.

+0

Thx @vangheem для быстрого ответа! – user956424

+2

как упомянутый выше @Martijn Pieters, необходимо также рассмотреть пространство, используемое для SearchableTextIndex. однако изображения предварительного просмотра будут намного тяжелее. – fRiSi

Смежные вопросы