Естественная парадигма в теории хранения XBRL в базе данных будет OLAP, поскольку XBRL - это кубы данных. OLAP поверх реляционной базы данных будет называться ROLAP.
Это не тривиальная проблема, поскольку факты, взятые из большого числа таксономий, могут образовывать очень большой и разреженный куб (для заявок SEC - это размеры 10k +), а также потому, что для создания схемы SQL требуется знание таксономий до Импортировать. Если появятся новые таксономии, нужно снова пересмотреть ETL. Это не делает реляционные базы данных подходящими в качестве общего решения.
Если заявки имеют одинаковую таксономию, и таксономия очень проста, хотя (как и в случае: не слишком много измерений), можно создать ad-hoc-карту для хранения всех фактов в одной таблице со многими строки в смысле ROLAP (факты для строк, аспекты для столбцов). Некоторые поставщики специализируются на хранении нестандартных фактов XBRL, и в этом случае традиционные SQL (или «пост-SQL», которые масштабируются с помощью рядов), работают хорошо.
Некоторые производители создают таблицу для каждого гиперкабеля XBRL в таксономии со схемой, полученной из сети определения, но различной для каждого гиперкуба. Это может привести к большому количеству таблиц в базе данных и требует большого количества объединений для запросов с участием нескольких гиперкубов.
Некоторые другие поставщики делают предположения о базовой структуре XBRL или о типах запросов, которые должны выполнять их пользователи. Ограничение объема проблемы позволяет найти определенные архитектуры или схемы SQL, которые также могут выполнять работу для этих конкретных потребностей.
Чтобы импортировать большое количество заявок (например, все заявки SEC), мы (мой работодатель) построили generic mapping поверх хранилищ данных NoSQL, а не реляционных баз данных. Большое количество фактов с различным количеством измерений вписывается в большие коллекции полуструктурированных документов, а сети хорошо вписываются в иерархический формат.
Я не думаю, что есть какие-либо, я пытался сделать то же самое о два года назад, кроме места назначения, был SQL Server. Какие типы файлов у вас есть? –
Вместо баз данных SQL для баз данных NoSql с точки зрения производительности и масштабируемости –