2010-09-11 2 views
1

У меня есть файл размером в 60 ГБ, и я хочу разбить базу данных на отдельные электронные письма. У меня нет какой-либо исходной информации о домене, поэтому я не могу просто запустить сервер 2k8 vm и снова подключить его там. Я сделал некоторый прогресс с наивным подходом к удалению двоичных данных (байты не 0x09, 0x0a, 0x0d и 0x20 через 0x7f) из файла (от 60 до 30 ГБ), а затем разделить это на очевидные заголовки SMTP. Этот подход, похоже, не работает, потому что Exchange не сохраняет всю электронную почту вместе в непрерывном блоке и, похоже, дублирует много электронной почты (это, вероятно, артефакт обработки всего файла как файловой системы, а не что-то более разумное, как позволить файловой системе быть файловой системой и просто хранить электронные письма в/var/mail или тому подобное).Exchange edb on Linux

Итак, вопрос в том, какие инструменты и документы для формата файла базы данных Exchange скрыты в мире, который Google не может или не хочет показывать мне?

+0

Вы идете, брат! –

ответ

2

Посмотрите на работу Иоахима Меца. Он обратил внимание на формат edb и проанализировал базу данных обмена в ограниченной степени. Это открытый исходный код и есть даже некоторые документы о таблицах и столбцах:

http://sourceforge.net/projects/libesedb/files/

Однако это не делает больше, чем вы, казалось бы, достигнуты. Он экспортирует все таблицы edb в отдельные файлы. Вам придется использовать предоставленную документацию и самостоятельно составлять электронные письма из битов и байтов, которые вы экспортируете из базы данных. Имейте в виду, что информация об электронных письмах и прикреплениях довольно разбросана, и все столбцы являются довольно загадочными в их именах. Вы должны сделать некоторые исследования и реконструировать себя, чтобы пройти через эти джунгли данных.

Поскольку проект является открытым исходным кодом, вы можете настроить или расширить код и добраться до того места, где хотите получить «легко».