понедельник, 1 августа 2011 г.

Управление документами в облаках: Иная перспектива

Данная заметка известного в отрасли эксперта по вопросам распознавания документов, ECM, аналитических технологий и т.д. Криса Райли (Chris Riley) была опубликована 24 июля 2011 года на блоге сообщества специалистов по управлению документами и контентом, базирующемся на сайте ассоциации AIIM. 

В мире технологий сейчас определенно туманно. Отчасти это связано с принципиальным смешением терминов, используемых для описания Облака. Поэтому, прежде, чем я перейду к основной части своего рассказа, позвольте мне кое-что прояснить. Есть три основных применения Облака, - и нет, в их число не входит редактирование фотографий, в чем пытается убедить реклама от Microsoft. Первое - это облачные файловые системы, второе -  базирующиеся в Облаке программные приложений (иначе говоря, программное обеспечение как услуга, SaaS), и третье - виртуализация.

Облачные файловые системы сейчас самая популярная тема в ECM-мире. Поэтому, когда ECM-специалист использует термин «облако», он, вероятно, говорит о таких решениях, как Box.net или Dopbox, которых являются облачными файловыми системами.

Для потребителей, «Облако», главным образом, означает приложения, у которых все настройки и вся обработка происходят где-то вне их компьютеров.

Однако, если об «Облаке» заговорить с системными администраторами и руководителями ИТ-служб, они, скорее всего, будут думать о виртуализации. О том, чтобы вычислительные среды целиков взять и поместить в «Облако», и о всех тех замечательных инструментах администрирования, которые в этом случае можно будет использовать.

Я повидал все эти миры, и понял, как важно понимать, о котором из них идёт речь. Я уже как-то говорил об управлении документами в облаке, и в тот раз я имел в виду обеспечение защиты информационных объектов в облачной файловой системе. Сегодня, однако, я хочу взглянуть на вопрос с несколько иной точки зрения, и обсудить управление документами в последней категории – в мире виртуализации.

В основе «Облака» лежит виртуализация. Это технология делает Облако масштабируемым, и при этом более дешевым, чем возня, как в добрые старые времена, с горами «железа». В центре концепции виртуализации находится понятие виртуальной машины (ВМ). Виртуальная машина является представлением в виде единого объекта используемой в вычислительной среде операционной системы (ОС), программного обеспечения и всех конфигураций. Это все равно, что взять Ваш компьютер и всё «уложить» в один файл. Как и любой другой файл, при наличии подходящей программы – в данном случае, гипервизора, - его можно открыть и запустить. Проблема в том, что эти файлы очень большие, и в среднем даже в сжатом виде виртуальная машина занимает 20 гигабайт.

Помимо своего размера, ВМ ничем не отличается от любого другого файла. Часто распространяемые в форматах  .vmdk и .ova, они имеют содержание (ОС, ПО, конфигурации), метаданные, описание, версию, дату последнего изменения и т.д. И вот здесь-то и начинается самое интересное.

В не слишком отдаленном будущем, придется ли нам задуматься о применении методов управления документами к виртуальным машинам? Я подозреваю, что да. На сайте CloudShare ( http://www.cloudshare.com/ ) мы это уже делаем, фактически мы установили сроки хранения для виртуальных машин, которые были удалены из старой среды или «снимка». Но в данном случае мы думаем об отслеживании сроков хранения с точки зрения производительности системы, а не с правовой точки зрения. Что произойдёт, когда в это дело будут вовлечены юристы? Что произойдёт, когда вычислительные среды в целом начнут рассматриваться как документы в спорных случаях? Может ли судья потребовать представить суду виртуальную машину целиком, точно так же, как требуется представлять файлы?

Это на самом деле уже происходит. В мире виртуальных Java-машин, Oracle требует от Google их конфигурацию виртуальной Java-машины, лежащей в основе устройств Android. И в мире компьютерного пиратства, в случаях, когда закон нарушается внутри виртуальных машин, сдача их в руки властей не является большим сюрпризом.

Подозреваю, что когда технический мир, в основном, окажется в облаках, где-то в каких-то виртуальных машинах, то контроль над ВМ-файлами будет иметь ключевое значение. Тогда понадобятся процесс контроля версий виртуальных машин и их «снимков», процесс объявления документом (record declaration), процесс отслеживания сроков хранения и уничтожения по их истечении, и даже процесс представления в случае расследований и судебных разбирательств.

Война за контроль над виртуализацией вовсю идёт уже сейчас. Я называю её «битвой гипервизоров», основными соперниками в которой в пространстве Windows являются VMWare и, конечно же, Microsoft. Хорошей новостью является то, что теперь возможно конвертировать файл VMware в формате VMDK в среду Hyper-V от Microsoft. Станет ли этот формат когда-нибудь таким же стандартом, как PDF? Весьма вероятно.

Единственным препятствием, мешающим передавать виртуальные машины так же, как  Word-документы, является их размер и степень знакомства с ними. Обе эти проблемы со временем будут решены. Уже существуют высокопроизводительные сети, передающие  гигабайты данных в секунду по сравнению с мегабайтами в секунду в обычных сетях, и в ближайшее время они станут доступны широкой публике. Одновременно технологии сжатия и ускорения позволят уменьшить файлы и ускорить их передачу. В результате станет возможным без проблем передавать виртуальные машины. Кроме того, все больше и больше специалистов в областях права, управления документами и судопроизводства будут понимать, что такое виртуальная машина, и требовать определенного контроля над ними. Так что, специалисты по управлению документами, готовьтесь - скоро Вам придётся включать VMDK-файлы в свои номенклатуры и перечни.

Крис Райли (Chris Riley)

Источник: сайт ассоциации AIIM
http://www.aiim.org/community/blogs/community/Records-Management-in-the-Cloud-Another-perspective

Комментариев нет:

Отправить комментарий