среда, 8 июня 2016 г.

Штат Виктория, Австралия: Что случилось со стандартом VERS? Часть 2


(Окончание, начало см. http://rusrim.blogspot.ru/2016/06/vers-1.html )

Одной из главных целей пересмотра и обновления стандарта VERS было улучшение обработки больших двоичных объектов (таких, как видеозаписи и базы данных). Согласно предыдущей редакции стандарта, весь двоичный контент следовало закодировать в кодировке Base64 до включения в представляющий документ XML-файл. Это на треть увеличивало объём документа, и большие объекты становились еще больше.

Чтобы избежать этого, мы отказались от использования единого XML-файла для инкапсуляции компонентов документа. Вместо этого инкапсулированный объект теперь представляет собой ZIP-файл, содержащий контент документа и XML-файлы, описывающие структуру документа и содержащие его метаданные и усиленные электронные подписи.

Мой комментарий: Возникает вопрос – не придется ли теперь электронному архиву штата Виктория проводить массовое преобразование в новый формат ранее принятых на архивное хранение электронных документов, по истечении чуть более десятилетия с момента внедрения контейнерного формата?

ZIP был выбран в качестве формата инкапсуляции (контейнерного формата – Н.Х.) в связи с тем, что он может работать с файлами очень большого размера, поддерживает сжатие и чрезвычайно широко распространен. Выбор конкретного механизма инкапсуляции не является критическим, поскольку при необходимости будет несложно повторно «переупаковать» документы.

Файловые форматы для долговременной сохранности

Ключевым элементом стратегии VERS является то, что контент документов принимается на хранение только в одобренных для целей долговременного хранения форматах. Отбираются те форматы, которые вряд ли устареют в течение очень долгого времени. Количество одобренных форматов ограничено, чтобы уменьшить в длительной перспективе расходы на поддержание доступности файлов в таких форматам. Контент в иных форматах должен быть мигрирован в одобренные форматы.

Список одобренных для долговременного хранения форматов в новой редакции стандарта VERS был расширен. Некоторые из новых форматов имеют дело с типами информации, которые ранее не были охвачены, например, с веб-архивами.

Некоторые из новых форматов, однако, были добавлены с целью уменьшить затраты государственных органов на подготовку документов. Преобразование документов в форматы для долговременного хранения – задача сложная. Проводимая должным образом  миграция обходится дорого, поскольку требует приобретения специального программного обеспечения, проведения предварительного тестирования с целью обеспечения  точности преобразования, выполнения собственно миграции и, наконец, проведения по окончании преобразования аудита полученных файлов. Важно свести миграцию к минимуму, в первую очередь из тех форматов, с которыми вряд ли возникнуть проблемы при длительном хранении.

Широко распространенные форматы, доминирующие в соответствующем сегменте рынка, вряд ли могут в обозримом будущем вызвать проблемы, связанные с обеспечением их сохранности. Примерами таких форматов являются базовые форматы Microsoft Office (Word, Excel и PowerPoint), а также звуковые файлы формата MP3. Все продукты в этих сегментах рынка, чтобы быть жизнеспособными, должны поддерживать эти распространенные форматы - объёмы унаследованного контента просто слишком велики, чтобы кто-то стал использовать неподдерживающий эти форматы продукт. По данной причине крайне маловероятно устаревание этих форматов в обозримом будущем.

Мой комментарий: Неужто здравый смысл (а также необходимость сокращать неоправданные расходы) всё-таки победил застарелую ненависть определенных групп политиков и специалистов к компании Microsoft и её продуктам? :)

И даже если эти форматы действительно устареют, объёмы устаревшего контента будут таковы, что программы преобразования для этих форматов будет жизнеспособными продуктами. По этим причинам Управление государственных документов добавило ряд таких распространенных форматов в список форматов, одобренных для целей долговременной сохранности, включая базовые форматы Microsoft Office - Word, Excel и PowerPoint. Государственные органы и поставщики, использующие предыдущую версию стандарта VERS, могут использовать этот расширенный набор форматов, так как мы пересмотрели документ PROS 99/007 Спецификация 4 «Форматы для долговременного хранения документов» (Specification 4 - Long Term Preservation Formats).

Мой комментарий: Новые спецификации, получившие номер PROS 15/03 S3, доступны по адресу http://prov.vic.gov.au/wp-content/uploads/2012/01/PROS1503S3v1.0.pdf

Упрощение стандарта

Мы упорно работали над уменьшением объёма и сложности текста стандарта VERS. Это было непростой задачей, поскольку мы также хотели сделать стандарт более мощным и гибким.

Значительные упрощения были сделаны путем:
  • Исключения редко используемых функциональных требований и метаданных;

  • Ссылок на внешние спецификации и стандарты (такие, как описание формата ZIP и два стандарта метаданных);

  • Описания процесса построения инкапсулированного объекта VEO (документа/документов в контейнерном формате – Н.Х.), а не его спецификаций.
Объём стандарта (вместе со спецификациями и вспомогательными рекомендациями) был сокращен с 401 до 64 страниц.

Государственные органы и учреждения штата Виктория могут использовать обновленный стандарт для внутренних архивных целей уже сейчас. Управление государственных документов (PROV), однако, сможет начать прием электронных документов, сформированных в соответствии с новым стандартом, лишь с 2018 года, когда будет перестроен наш электронный архив. Обновленный стандарт был опубликован заранее, чтобы помочь поставщикам и государственным органам разобраться в нём. Государственные органы также могут сразу использовать дополнительные форматы для долговременного хранения, поскольку мы соответствующим образом обновили и предыдущую версию стандарта.

До ввода в эксплуатацию нового электронного архива государственные органы должны для передачи электронных документов на архивное хранение в PROV использовать старый формат VERS.

Поскольку государственные органы и поставщики уже сделали значительные инвестиции в формат VERS, Управление государственных документов продолжит принимать документы из систем, которые были сертифицированы на соответствие предыдущей версии VERS.

Обновленный стандарт VERS доступен на веб-сайте PROV по адресу  http://prov.vic.gov.au/government/vers/implementing-vers/standard-2 . На этой же странице  доступны инструменты для создания и проверки VEO-объектов нового формата. Эти инструменты написаны на Java и могут быть использованы поставщиками и государственными органами на условиях лицензии CC-BY.

Эндрю Во (Andrew Waugh)

Источник: сайт Image and Data Manager (IDM)
http://idm.net.au/article/0011016-what-s-happened-vers-standard

Комментариев нет:

Отправить комментарий