пятница, 1 сентября 2017 г.

США: Насколько важно архивировать документы в исходных форматах?


Данная статья вице-президента по маркетингу американской компании Archive360 Билла Толсона (Bill Tolson – на фото) была  опубликована на сайте компании 3 августа 2017 года. Компания Archive360 является поставщиком услуг облачного хранения на платформе Microsoft Azure, а также решений для миграции архивов сообщений электронной почты.

Многие компании, которые столкнулись с необходимостью архивирования данных (обычно электронной почты) ввиду требований законодательства, обязанностей в плане э-раскрытия (eDiscovery – обязательное раскрытие организацией всей относящейся к делу электронной информации в случае судебного спора или расследования – Н.Х.) и собственных деловых потребностей, ищут соответствующие решения, исходя их функциональных возможностей, стоимости, репутации поставщика, безопасности и нормативных требований.

В прошлом компании, нуждавшиеся в решениях для архивирования, закупали одно из многих размещаемых локально или облачных решений, которые отвечали их потребностям. Однако многие из этих решений на деле преобразовывали данные, чтобы обеспечить более эффективное хранение, индексирование и поиск. Проблема с таким преобразованием (конверсией) данных заключается в том, что данные могут быть попорчены, могут быть изменены или потеряны метаданные, обесценивая тем самым хранимый компанией «золотой экземпляр» - официальный экземпляр документа. В большинстве случаев это на самом деле не проблема ... если только Вы не ожидаете или реально не вовлечены в судебные разбирательства.

Э-раскрытие и конверсия данных

В случае реального или ожидаемого судебного разбирательства, Вы, проводя конверсию данных, можете неумышленно фактически уничтожить доказательства. С учетом этого, давайте потратим минуту времени, чтобы вспомнить обязанности, связанные с э-раскрытием.

Изменения, внесенные в 2006 году в американские Федеральные правила гражданского судопроизводства (Federal Rules of Civil Procedure, FRCP, https://www.law.cornell.edu/rules/frcp/rule_37 ) установили концепцию «ожидаемого судебного разбирательства» (anticipated litigation). Согласно правилу FRCP Rule 37(e):
«Если хранимая в электронном виде информация (electronically stored information, ESI – термин, по сути дела расширивший в рамках FRCP понятие «документ» на любую тем или иным образом зафиксированную электронную информацию – Н.Х.), которую следовало сохранить в ожидании или в течение судебного разбирательства, утрачена вследствие того, что сторона не предприняла разумных мер для обеспечения её сохранности, и эту информацию невозможно восстановить или заменить путем дополнительных усилий э-раскрытия, то суд:

(1) по установлении нарушения интересов (prejudice) другой стороны вследствие утраты информации, может распорядиться о принятии мер, но не более чем  необходимых для устранения нарушения; или

(2) только в случае выявления того, что сторона действовала с намерением лишить другую сторону возможности использования информации в судебном процессе, суд может:
(A) принять презумпцию, что утраченная информация была неблагоприятной для стороны;

(B) дать указание жюри присяжных, что оно может или обязано исходить из того, что информация была неблагоприятной для стороны; или

(C) прекратить производство по делу либо принять заочное решение в пользу истца (default judgment).
На практике компании вольны хранить или архивировать данные любым способом по своему выбору, если только выбор метода не будет очевидной попытке помешать э-раскрытию. Ответственность за приостановление уничтожения документов и информации (litigation hold) возникает тогда, когда у компаний возникают разумные основания ожидать в будущем судебных разбирательств. Вплоть до этого момента данные можно преобразовывать, удалять или изменять без риска негативных последствий для процесса э-раскрытия. Однако как только судебный спор становится ожидаемым, данные (включая все метаданные) должны быть зафиксированы в том состоянии, в котором он находились на момент возникновения обязанности приостановить уничтожение.

Всё это - довольно многословный способ сказать, что деятельность архивов, осуществляющих конверсию исходных данных в рамках процесса архивирования, должна тщательно контролироваться, и что следует подумать о её временной приостановке после возникновения обязанности приостановить уничтожение ввиду ожидаемого судебного разбирательства, если архивный экземпляр является единственным экземпляром документа.

Взаимосвязанная проблема возникает в случае, когда компания, выполняющая запрос в рамках э-раскрытия, должна мигрировать подпадающие под запрос данные из архива, который провёл преобразование данных. В целях исполнения запроса данные должны быть преобразованы обратно в исходный формат, с чем связан риск повреждения и утраты данных. Если обработку провести некорректно, то процесс миграции может нарушить требование законодательства о сохранении потенциально относящихся к делу данных без изменений т.е. в том формате, в котором они находились во время начала судебного разбирательства.

Архивы, которые хранят данные и управляют ими в их исходном первоначальном формате, сводят на нет этот риск.

Конверсия и аналитика данных

Очевидная проблема с подвергнутыми конверсии архивированными данными – это проблема выполнения процессов аналитики данных на их основе. Аналитика данных (data analytics, DA) - это процесс (выполняемый с помощью специализированных систем и программного обеспечения) изучения больших наборов данных с целью сделать выводы о содержащейся в них информации. Аналитика данных в основном выполняется в программных приложениях для взаимодействия коммерческих организации с деловыми партнерами (B2B) и клиентами (B2C). Организации собирают и анализируют данные, относящиеся к обслуживанию клиентов, такие, как сведения о покупках и данные службы поддержки, а также сведения о бизнес-процессах, рыночной экономике и другие. Большие наборы данных классифицируются, хранятся и анализируются для выявления тенденций, связанных с покупками, использованием и проблемами, а также множества других.

Проблема использованием приложений аналитики данных применительно к контенту архивов, в которых данные были преобразованы, заключается в том, что (за исключением случаев преобразования в стандартный формат, такой, как PST или EML – а большинство архивов преобразуют данные в проприетарные форматы), аналитическое приложение не сможет использовать преобразованные данные. В итоге обесцениваются как сам набор данных, так программное обеспечение для аналитики данных.

Опять же, данные, заархивированные в своем исходном формате, гораздо более пригодны для использования приложениями аналитики данных.

Конверсия данных создает условия для требований выкупа за данные

Компании, хранящие контент в проприетарных облачных архивах, больше рискуют тем, что с них могут потребовать крупные суммы денег в случае изъятия ими своих данных (по любой причине, например, из-за неудовлетворенности качеством работы поставщика). Облачные архивы оправдываются тем, что им придётся переконвертировать данные обратно в исходный формат, прежде чем они смогут их вернуть. Они уверяют, что этот процесс ре-конверсии потребует много времени и затрат. На практике некоторые поставщики услуг облачного хранения взимают огромные суммы за выполнение такого процесса обратной конверсии - иногда они превышают ежемесячную стоимость хранения в 20 или более раз. По сути же дела, они берут Ваши данные в заложники, в надежде на то, что Вы не захотите платить непомерный выкуп и продолжите пользоваться их услугами.

Очевидно, что, имея дело с поставщиками услуг облачного хранения, Вам нужно задать два вопроса:
  • Сохраняете ли вы данные в исходном формате или же преобразуете их?

  • Могу ли я в любое время вывести свои данные без дополнительно оплаты или уплаты штрафа?
Иными словами, избегайте архивов, которые не хранят ваш контент в его исходном формате берут с Вас выкуп за возврат данных.

Билл Толсон (Bill Tolson)

Источник: сайт компании Archive360
http://blog.archive360.com/does-archiving-in-native-format-matter

Комментариев нет:

Отправить комментарий