2011-05-31 3 views
15

Кто-нибудь знает инструмент, который может проверять указанную схему и генерировать случайные данные на основе таблиц и столбцов этой схемы?Как генерировать случайные данные образца в моей базе данных Oracle?

+0

+1, хороший вопрос, голосов, чтобы закрыть несмотря; -) На самом деле, все вокруг для хорошей информации. – DCookie

ответ

4

Другой альтернативой является Swingbench Data Generator

Полезно использовать предложение SAMPLE (например, образующим порядка для случайной комбинации заказов и продуктов)

3

У устройства PL/SQL Developer Allround Automation имеется инструмент для генератора данных. Но будьте осторожны: это немного шелушатся - кажется, что он работает нормально на одной таблице, но сработает, когда есть зависимости между таблицами.

Я признаю, что в конечном итоге я начал писать собственные сценарии SQL для генерации данных. Оказалось, что он намного более стабилен.

2

Немного дикой карты, но я подумал, что хотел бы упомянуть об этом.

Если у вас есть данные в рабочей среде, которую вы не можете использовать, поскольку она может содержать конфиденциальную информацию, Oracle имеет продукт под названием «Oracle Data Masking», который заменит чувствительную информацию реалистичными значениями.

Я не знаю, стоимость этого продукта, но если вы хотите получить дополнительную информацию, вы можете найти here.

+0

Data Masking является дополнительной платой для Enterprise Edition, т.е. очень дорогой. – APC

3

Посмотрите на Databene Benerator.

Немного сложно сделать первоначальную настройку, но достаточно мощным.

4

Это интересный вопрос. Достаточно легко генерировать случайные значения - простая петля вокруг словаря данных с вызовами в DBMS_RANDOM сделала бы трюк.

За исключением двух вещей.

Один из них, так как @FrustratedWithForms указывает, что существует сложность ограничений внешнего ключа. Давайте укажем значения поиска (справочные данные) в микс.

Во-вторых, случайный не очень реалистичен. Основным драйвером для использования случайных данных является потребность в больших объемах данных, возможно, для тестирования производительности. Но реальные наборы данных не являются случайными, они содержат перекосы и сгустки, переменные длины строк и шаблоны (особенно в тех случаях, когда они относятся).

Итак, вместо того, чтобы пытаться генерировать случайные данные, я предлагаю вам попробовать получить реальный набор данных. В идеале ваш пользователь/клиент сможет предоставить один, предпочтительно анонимный. В противном случае попробуйте взять что-то, что уже находится в общественном достоянии, и массируйте его в соответствии с вашими конкретными требованиями. Info Chimps - это верхние бананы, когда дело доходит до этих вопросов. Check them out.

+1

+1 Дополнительные осложнения возникают с ограничениями CHECK и NULL. – DCookie

Смежные вопросы