понедельник, 16 июля 2012 г.

Обеспечение долговременной сохранности в облаке? Первый взгляд на систему Preservica


Данная заметка сотрудника Национальной библиотеки Нидердандов Джефри ван дер Хёвена (Jeffrey van der Hoeven – на фото) была опубликована 6 июля 2012 года на блоге голландской Национальной коалиции по обеспечению сохранности электронных материалов (Nationale Coalitie Digitale Duurzaamheid, NCDD).

5 июля компания Tessella Technology & Consulting организовала веб-семинар (вебинар), на котором представила свой только что запущенный сервис «долговременная созранность как услуга» под названием Preservica. Я принял участие в этом вебинаре, поскольку меня интересуют  последние достижения компании, которая сделала ясный выбор в пользу серьёзных инвестиций в архивирование на ближайшие годы - как это она делала и в прошлом. Вот мои впечатления:

Насколько мне известно, Preservica является первым решением для архивирования, которое перенесено в облако и предлагает пользователям те же возможности, что и современное решение фирмы Tessella для автономных систем архивации под названием «Сейф» (Safety Deposit Box, SDB). Говорят, тем не менее, что облачное решение более гибкое и не требует развертывания на месте ИКТ-инфраструктуры, поскольку всем можно управлять дистанционно.

Программное обеспечение, обеспечивающие специфические функциональные возможности электронного архива, разработано фирмой Tessella, в то время как базовая инфраструктура хранения и вычислений обеспечивается облачным сервисом Amazon. За один час команда Tessella помогла участникам вебинара получить хорошее представление о возможностях и workflow-процессах системы Preservica, и даже рискнула продемонстрировать её работу в реальном времени.

По существу Preservica работает следующим образом: Вы вводите файлы в систему,  просто загружая их в неё. Формат файлов автоматически идентифицируется с помощью инструмента «Друид» (Droid, рис. 1). Это операция может быть выполнена в пакетном режиме.

Рисунок 1 (Источник: Tessella)

После этого к файлу применяется политика, содержащая информацию о том, что должно быть сделано перед отправкой файла на длительное хранение. Технический реестр содержит указания о том, что должно быть сделано с файлом определенного формата. Например, может потребоваться конверсия в другой формат (рис. 2).


Рисунок 2 (Источник: Tessella)

Для каждого пакета информации формируется сдаточный SIP-пакет (используется терминология стандарта OAIS – Н.Х.). Это можно сделать как используя заготовленный шаблон, так и «с нуля»; в последнем случае пользователь должен вручную ввести метаданные для данного конкретного пакета. Таким образом можно подготовить специфические для конкретной коллекции документов SIP-файлы, имеющие собственные метаданные.

Если все параметры заданы, то процесс ввода файлов в систему запускается в рамках авторизованной сессии. Автоматически выполняется целый ряд шагов, что хорошо показано на рис. 3.


Рисунок 3 (Источник: Tessella)

Все загруженные SIP-пакеты можно просматривать с помощью встроенного файл-браузера. Это, как мне кажется,  практичное решение для небольших коллекций, но навигация может стать проблемой, когда речь пойдёт о миллионах объектов. Тем не менее, такой инструмент имеется и обеспечивает базовые возможности интерфейса пользователя по работе с данными.

Планы и действия по обеспечению сохранности

Одной из ключевых особенностей системы Preservica является её способность осуществлять выполнять действия, необходимые для обеспечения долговременной сохранности электронных объектов. Это означает, что систему можно настроить на реагирование в определенных ситуациях, когда форматы данных могут морально устареть. Для этого нужно составить план обеспечения сохранности (preservation plan), предусмотренные которым действия могут по расписанию выполняться над определенными наборами данных (определяемых форматом файлов, типом коллекции и т.д.). Tessella продемонстрировал это на примере преобразования «на лету» файлов формата JPEG2000 в формат PDF/A, которой прекрасно сработало (рис. 4).

Рисунок 4. Источник: Tessella

Заключение

В целом, я думаю, Tessella создала хорошую возможность для малых и средних предприятий поднять на качественно новый уровень их деятельность по обеспечению долговременной сохранности электронных коллекций, используя на порядок более совершенные методы, чем те, что они  применяют сейчас. Поскольку в таких организациях может не быть масштабируемой технической инфраструктуры, то теперь они могут использовать систему Preservica для обеспечения сохранности электронных материалов. Ни один другой коммерческий поставщик, насколько мне известно, не предлагает аналогичного готового к использованию решения.

Тем не менее, следует сказать несколько слов предостережения. Как и при использовании любых других облачных решений, нужно понимать риски, о которых я писал в своём предыдущем посте (  http://www.ncdd.nl/blog/?p=2347 ). Я высказал представителям Tessella мои сомнения относительно выбора Amazon в качестве поставщика облачных услуг. В 2009 году Amazon пережил крупный технический сбой ( http://articles.businessinsider.com/2011-04-28/tech/29958976_1_amazon-customer-customers-data-data-loss ), который привёл не только к недоступности услуг в течение определенного времени, но и к  тому, что часть данных была потеряна навсегда!

Tessella же считает, что сейчас Amazon стабилен и защищён, и что вряд ли такие события повторятся в будущем. Однако при долговременном хранении «будущее» очень, очень длительное ...

Кроме того, имеется ряд юридических вопросов. Поскольку Amazon базируется в США, то все сохраняемые в системе Preservica данные автоматически загружаются на американские сервера – подпадая под американский, а не под европейский правовой режим (на практике это означает, что может не обеспечивать уровень защиты персональных данных, предусмотренный европейским законодательством, существенно более строгим в этом отношении, чем американское. В случае судебных споров или расследований, американские суды могут потребовать раскрытия данных по американским правилам – Н.Х.).

Наконец, когда данные уже сохранены в Preservica, то вытащить их из системы обратно непросто. На данный момент нет простых способов переноса большого количества контента на другие платформы (если таковые появятся). Пока Preservica Вас устраивает, это, конечно, не проблема, - но если у Вас могут возникнуть финансовые трудности или если может потребоваться быстро скачать данные из системы, то я советую Вам заранее оговорить особые условия на такие случаи.

Данный пост отражает личное мнение автора и ни в коей мере не отражает официальной позиции Национальной коалиции по обеспечению сохранности электронных материалов (NCDD) или какой-либо из её организаций-членов.

Джефри ван дер Хёвен (Jeffrey van der Hoeven)

Источник: блог голландской Национальной коалиции по обеспечению сохранности электронных материалов
http://www.ncdd.nl/blog/?p=2631

Комментариев нет:

Отправить комментарий