2012-06-06 3 views
2

При попытке прийти вверх с приложением сервлета основой для чтения файлов и манипулировать ими (изображения типа преобразования) вот вопрос, который подошел ко мне:Как узнать тип файла без расширения

  1. ли можно проверить содержимое файла и узнать тип файла?
  2. Есть ли стандарт, который указывает, что каждый файл ДОЛЖЕН предоставить некоторый тип маркера в своем контенте, чтобы приложение не могло полагаться на ограничения расширения файла?

Рассмотрим сценарий приложения:

Я создаю приложение, которое будет иметь возможность конвертировать различные форматы файлов для набора выходных форматов. Скажем, пользователь загружает PDF-файл, мое приложение может предположить, что возможные форматы конвертации - это слово Microsoft или TIFF или JPEG и т. Д.

Поскольку мое приложение будет постепенно поддерживать разные форматы файлов (в течение определенного периода времени), я хочу, чтобы мое приложение проверьте входной файл вместо того, чтобы пользователь указал формат. И предложите пользователю возможные форматы вывода.

Я понимаю, что это открытый, широкий вопрос. Пожалуйста, дайте мне знать, нужно ли его модифицировать.

Спасибо, Ayusman

ответ

3

Yeap вы можете выяснить тип без расширения с помощью magic number. Кроме того, путь цифры командный файл это, на самом деле через 3 этапа проверки: с

  1. Проверьте свойства файловой системы в identifie пустых файлов, папок и т.д. ...
  2. Упомянутый магическое число
  3. в текстовых файлах, проверьте язык в нем

Вот библиотека, которая поможет вам с Magic Numbers: jmimemagic

Смежные вопросы