Я не прошу мнения, но больше о документациях.Сохраненная процедура или код
У нас есть много файлов данных (XML, CSV, Plantext и т. Д.), И их нужно обрабатывать, данные их несут.
Руководитель базы данных предложил использовать хранимую процедуру для выполнения задачи. В основном у нас есть промежуточная таблица, в которой файл становится сериализованным и сохраняется в столбце clob или XML. Затем оттуда он предложил продолжить использование хранимой процедуры для обработки файла.
Я разработчик приложений с фоном db, тем более на разработку приложений, и я могу быть предубежденным, но использование этой логики в БД кажется плохой идеей, и я не могу найти документацию, подтверждающую или не одобряющую что я называю помещением автомобиля на поезде, чтобы тянуть груз грузов.
Итак, мои вопросы: Насколько хорошо работает БД (Oracle, DB2, MySQL, SqlServer), когда мы говорим о поиске регулярных выражений, поиске и замене данных в clob, dom traversal, recursion? По сравнению с языком программирования, таким как Java, PHP или C#, по тем же проблемам.
Редактировать
Так что я ищу, документация по сравнение/выполнения анализа конкретного языка программирования по сравнению с СУБД, в частности, для строки поиска и замены, регулярные выражения поиска и замены. Прохождение XML-сайта. Использование памяти при вызовах рекурсивных методов. И, в частности, насколько они масштабируются при столкновении с 10 - 100 ГБ данных.
SP: s подходят для выбора и агрегации. Они легко становятся недостижимыми, когда участвует другая обработка (строка, синтаксический анализ, математика и т. Д.). Является ли производительность действительно проблемой? – adrianm
Обслуживание не является одной из моих проблем, потому что если мы будем следовать пути использования SP, то я не поддерживаю систему, DBA. Но я не хочу стоять без дела, когда вижу, что что-то глупое делается, поэтому только аргумент для меня, который для него верен, я могу сделать это лучше и эффективнее, поскольку переменная обслуживания выходила из моего уравнения. – Churk
«data mining» - очень перегруженный термин. Это может означать что угодно: от вычисления средних до сложных статистических методов $ O (n^3) $ или худшего времени исполнения. Пожалуйста, уточните. Потому что некоторые вещи, очевидно, будут легко выполняться с использованием хранимых процедур. Другие будут больно делать это! –