воскресенье, 14 августа 2011 г.

Сохранение контента веб-сайтов: Обсуждение на международном онлайн-форуме

В российском законодательстве всё чаще встречаются положения, обязывающие организации сохранять информацию, размещенную на их веб-сайтах, и сроки хранения в 5 и 10 лет – не редкость. Тема документирования веб-сайтов становится всё более актуальной, но пока ещё редко обсуждается отечественными специалистами. Мне кажется, что довольно интересно послушать, что говорят по этому поводу наши североамериканские коллеги. Данный вопрос как раз обсуждался 9-10 августа на международном форуме специалистов по управлению документами (см. http://lists.ufl.edu/cgi-bin/wa?A2=ind1108B&L=RECMGMT-L&P=R213&D=0 ).

Роберт Долтон (Robert W Dalton, из фирмы Dalton Consulting) открыл дискуссию вопросом: Кто-нибудь включил веб-сайт компании в номенклатуру дел [в оригинале records series – Н.Х.] поддерживающего его подразделения, или же задача решается в рамках сохранения ИТ-системы в целом?

Том Уилсон (Tom Wilson): Я бы первым делом поинтересовался, что за контент на сайте, каким образом различаются разные типы контента, является ли контент сайта уникальным в рамках компании, известно ли о размещении на сайте каких-либо документов и т.д.

Веб-сайт – это лишь способ доставки, и именно контент сайта нужно будет проанализировать на предмет установления сроков хранения посредством включения одной или нескольких позиций в номенклатуру дел.

Александр Бабин (Alexander Babin): Думаю, есть еще и вопрос архивирования веб-сайта.

Все больше и больше организаций принимают решение использовать свои интранет-сайты в качестве внутренних газет, и в этом случае их контент подлежит довольно длительному хранению.

Ларри Медина (Larry Medina): Эта тема много раз поднималась, снова и снова. Не думаю, что на него есть окончательный ответ (готовы ли Вы поддержать точку зрения: «Ответ зависит от конкретных обстоятельств»?), есть лишь ряд обоснованных соображений.

Как правильно отметил Том, веб-сайт является  способом доставки (по большей части) контента, находящегося в другом месте, и исходным материалам, отображенным на веб-сайте, должны быть установлены собственные сроки хранения, в зависимости от ценности этого контента.

Существует, тем не менее, в ограниченный количествах и такой контент, который существует только на веб-сайте и не имеет своего «дома»... как, например, счетчик посещений, стилевые таблицы или данные, введенные в веб-форму, которые впоследствии извлекается и становятся полями информации или записями в базе данных.

Некоторые организации включают в свои перечни «снимки» веб-страниц (или целиком веб-сайта), которые выполняются периодически либо всякий раз, когда страница обновляется/переформатируется. В большинстве случаев для них либо устанавливается фиксированный срок хранения, либо они сохраняются до замены новыми.

Мне известна одна ситуация, в которой всё это становится довольно скользким и рискованным: это онлайн-приложения для обработки заявлений о приёме на работу, заполнения резюме или подачи заявок на получение кредита, когда третья сторона получает доступ к сайту, вбивает свои данные в различные поля, «видит» набранную информацию в виде заполненной формы, - но после отсылки эта форма перестает существовать.

Как отмечалось ранее, введенные данные используются для заполнения полей в базе данных, и там они сохраняются. Но если форма впоследствии модифицируется и изменяются размеры полей, или же поля добавляются или удаляются, то форма уже не может быть воспроизведена в точности в том виде, в котором её заполнил заявитель. Если заявитель захватил изображение на экране или распечатал его, то для него такие материалы могут оказаться единственным способом воспроизвести свои данные именно в том виде,  в котором они вводились ... и если впоследствии введенная информация начинает оспариваться, это может стать существенным вопросом.

Мэри Хейдер
(Mary W. Haider): Да, Ларри, эта тема, действительно, продолжает обсуждаться, и я думаю, так оно и будет продолжаться по мере эволюции способов использования веб-сайтов. Долгое время я воспринимала сайты - как в интернете, так и в интранете - в первую очередь, как доски объявлений. Однако затем в игру включилась розничная торговля, и возникла потребность в точности знать, что именно видит клиент. Иногда это становилось проблемой, - когда, например, цены или условия были введены неправильно, при том, что информация на сайте могла обновляться ежечасно.

Теперь мы сталкиваемся не только с веб-формами, которые заполняются данными, получаемыми от покупателей/клиентов, но также и с данными/информацией, которые компилируются на основе имеющихся источников и доставляются покупателям/клиентам в результате выполнения запроса. Подобные запросы и ответы не сохраняются (могут не сохраняться), однако передаваемые в обе стороны данные является подтверждение того, какая информация/данные были запрошены, и что было передано в ответ. Похоже, что компании в ходе данного процесса могут потерять часть деловых документов, и я не думаю, что «снимок» веб-страницы/сайта решит проблему.

Возвращаясь к первоначальному вопросу, я не думаю, что веб-страница или веб-сайт являются видами документов, для которых можно отвести позиции в номенклатуре дел. Нам нужно внимательно посмотреть на базы данных и другие источники «заднего плана», которые используются для создания и сбора информации.

Питер Курилец (Peter Kurilecz): Думаю, что внутренние веб-сайты отличаются от внешних. Если память мне не изменяет, несколько лет тому были судебные дела,  касавшиеся информации, размещенной на внешних сайтах. Я согласен с тем, что внутренний веб-сайт может рассматриваться как корпоративная доска объявлений. Внешние же веб-сайты, с моей точки зрения, есть нечто совершенно иное.

Вирджиния Джоунс (Virginia (Ginny) Jones): Наши городские власти начали использовать внутренний веб-сайт для публикации «официальной» версии политик и процедур. Логично было бы устанавливать сроки хранения и сохранять сами документы, однако мы понимаем, что большинство сотрудников, обосновывая свои действия или взаимодействуя с другими сотрудниками или с клиентами, цитируют то, что видят на веб-сайте. Поэтому нам приходится сохранять «снимки» всех страниц, сделанные до их изменения, с тем, чтобы знать, что работник видел в определенный момент времени.

Гэри Линк (Gary Link): Джинни, в каком формате Вы сохраняете снимки?

Вирджиния Джоунс: В формате PDF. Поясню: мы сохраняем каждую страницу в формате PDF, а также ссылки на все документы, на которые ссылается эта страница. Мы также сохраняем в формате PDF документы, взаимосвязанные с этими страницами.

Келли Гамильтон (Kelly Hamilton): Джинни, велико ли число сохраняемых веб-страниц? Меня интересует, приходится ли Вам проходить их одна за одной и сохранять их в виде PDF-файлов, или же Вы используете какой-то автоматический способ.

Вирджиния Джоунс: Не уверена насчет «механики» этого дела. По-моему, процесс довольно быстрый, потому что страниц, с которых мы делаем «снимки», немного, а документация (контент) уже существует в формате PDF - это лишь вопрос перемещения файлов из активных папок в «архивные».

Крис Фостер (Chris Foster): Библиотеки нашего университета периодически проводят полный сбор всего, что связано с доменом unt.edu. Это автоматический процесс.

Дуайт Уоллис (Dwight Wallis): Мне любопытно, почему простая процедура выверки текста при размещении материалов не может обеспечить то же самое. Разве не так поступали в течение многих лет при публикации материалов? Ещё одним способом решения этой задачи могло бы стать размещение на сайте PDF-оригиналов политик. Именно так мы поступаем с нашими административными процедурами и прочими внутренними политиками.

Источник: архив форума специалистов по управлению документами
http://lists.ufl.edu/cgi-bin/wa?A2=ind1108B&L=RECMGMT-L&P=R213&D=0

Комментариев нет:

Отправить комментарий