воскресенье, 26 апреля 2015 г.

В свободном доступе выложен инструмент для идентификации файловых форматов Siegfried


Данная заметка Ричарда Лехейна (Richard Lehane) была опубликована 25 марта 2015 года на его блоге «Richard's Blog» (см. http://openpreservation.org/knowledge/blogs/author/richardlehane/ ), расположенном на сайте Фонда «Открытая сохранность» (Open Preservation Foundation, OPF), под названием «Выпущена первая версия инструмента для идентификации файловых форматов «Зигфид»» (Siegfried v 1.0 released (a file format identification tool).

Программа «Зигфрид» (Siegfried) представляет собой инструмент идентификации файловых форматов на основе реестра форматов PRONOM. Её первая версия Siegfried v. 1.0 теперь доступна по адресу http://www.itforarchivists.com/siegfried .

Основные отличительные особенности программы следующие:
  • Полная реализация PRONOM (байтовые и контейнерные сигнатуры)

  • Надежные результаты (Siegfried на тестах сравнивался со «скелетным» пакетом Росса Спенсера (Ross Spencer) и прошёл тестирование на качество в сопоставлении аналогичными по назначению пакетами DROID и FIDO)

  • Быстрое нахождение соответствия без ограничения на количество просматриваемых байтов;

  • Детальная информация о том, на каком основании был сделан вывод о соответствии определённому формату;

  • Простой интерфейс командной строки с возможностью выбора вариантов вывода результатов (в формате YAML, JSON или CSV);

  • Встроенный сервер для интеграции с рабочими процессами;

  • Расширенные возможности, включающие режим отладки, модификацию сигнатур и поддержку нескольких идентификаторов.
Большое спасибо Россу Спенсеру за базовый набор функций, Мисти де Мео (Misty De Meo) Ubuntu-упаковку, а также всем тем в Национальных Архивах Великобритании, кто создал и поддерживает базу данных PRONOM.

Мой комментарий: Программы такого рода входят в число основных рабочих инструментов электронных архивистов. Они анализируют внутреннюю структуру файлов и позволяют достоверно определить использованный для его создания формат (и версию формата).

Переходя по данной Лехейном ссылке ( http://www.itforarchivists.com/siegfried ), мы попадаем на посвященную программе Siegfried страницу его личного сайта, которая вызовет ностальгию у тех, кто ещё помнит времена PC 286-х (см. рис.1).

Рис.1. Страница для загрузки и тестирования программы

На этой странице можно скачать 32- и 64-битовые версии программы. Можно также оценить, что программа умеет, просто перетащив мышкой какой-нибудь файл прямо на наковальню Зигфрида. Вот что получилось у меня (см.рис.2, в качестве примера был взят PDF-файл):

Рис.2 Пример выдаваемой о файле информации

Сама программа выдает результаты в следующем виде:


Особых «красот» здесь нет, электронным архивистам важна функциональность и возможность сопряжения с другими инструментами.

Дополнительная информация: Её можно найти в других постах Лехейна, посвященных проекту Siegfried:

1 комментарий:

  1. Спасибо за инструмент.
    Все пользовался TrID http://mark0.net/soft-trid-e.html

    Добавил в копилку

    ОтветитьУдалить