У нас есть большое количество документов и метаданных (xml-файлов), связанных с этими документами. Каков наилучший способ их организовать?Как организовать большое количество объектов
В настоящее время мы создали иерархию каталогов:
/repository/category/date(when they were loaded into our db)/document_number.pdf and .xml
Мы используем путь в качестве уникального идентификатора документа в нашей системе. Наличие плоской структуры не кажется хорошим вариантом. Также использование пути в качестве идентификатора помогает сохранить наши данные независимо от нашей логики базы данных/приложения, поэтому мы можем легко их перезагрузить в случае сбоя, и все документы сохранят свои старые идентификаторы. Тем не менее, это вводит некоторые ограничения. например, мы не можем перемещать файлы, как только они были помещены в эту структуру, также требуется работа, чтобы поместить их таким образом. Что такое лучшая практика? Как такие сайты, как Scribd, справляются с этой проблемой?
Спасибо Matt. То, как мы в настоящее время обрабатываем большое количество документов за один день, состоит в том, чтобы разбить их на подпапки: 1/2/3/..., что является еще одной причиной, которая заставляет меня думать, что должен быть лучший способ ... – shane