понедельник, 9 июня 2025 г.

ИСО: Идёт публичное обсуждение нового стандарта ISO/DIS 20271-2 «Управление контентом - Эталонная модель обеспечения долговременной сохранности текстуального контента - Часть 2: Основы»

В конце апреля 2025 года сайты Международной организации по стандартизации (ИСО) и Британского института стандартов (BSI) сообщили о начале публичного обсуждения нового стандарта ISO/DIS 20271-2 «Управление контентом - Эталонная модель обеспечения долговременной сохранности текстуального контента - Часть 2: Основы» (Document management - Reference model for long-term preservation of textual documents - Part 2: Fundamentals) объёмом 29 страниц, см. https://www.iso.org/standard/86228.html и https://www.iso.org/obp/ui/en/#!iso:std:86228:en . Публичное обсуждение завершится 15 июля 2025 года.

Стандарт разрабатывает технический подкомитет TC171/SC2 «Файловые форматы для электронного контента, системы управления контентом и аутентичность информации» (Document file formats, EDMS systems and authenticity of information). О работе над данным документом я уже рассказывала в посте по адресу http://rusrim.blogspot.com/2022/12/blog-post_23.html - с тех пор изменилась структура документа, и данная его часть, которая ранее была первой, теперь стала второй.

До 15 июня 2025 года желающие имеют возможность самостоятельно принять участие в публичном обсуждении стандарта на сайте Британского института стандартов (BSI) по адресу https://standardsdevelopment.bsigroup.com/projects/2023-00655 (требуется пройти бесплатную регистрацию на сайте).


Страница публичного обсуждения на сайте BSI

Во вводной части стандарта отмечается следующее:

«В настоящем документе описана эталонная модель для [обеспечения долговременной сохранности – Н.Х.] текстуального контента (textual documents – речь, по сути дела, идёт о файлах (текстовых документах), основной контент которых представлен в виде кодированного текста – Н.Х.) и приведены опирающиеся на эталонную модель подробные рекомендации, необходимые для обеспечения долговременной сохранения, сформулированные с учётом различных аспектов.

Стандарт ISO 20271-2 определяет основные понятия эталонной модели для текстуального контента. Он описывает составляющие эталонную модель слои; входящие в состав текстуального контента элементы; различные свойства, присущие текстуальному контенту, и их классификацию по типу.

Кроме того, стандарт определяет понятия, концепции и структуру эталонной модели обеспечения долговременной сохранности электронных документов и контента, которые могут применяться к другим типам документов и контента, помимо текстуальных.

Стандарт ISO 20271-2:
  • определяет понятие «текстуальный контент» и описывает основные свойства контента, состоящего из текстуальных материалов;

  • описывает понятия и концепции эталонной модели для текстуального контента; определяет ключевые элементы, имеющиеся в составе текстуальных материалов; и, на основе эталонной модели, предлагает рекомендации по улучшению деятельности по обеспечению долговременной сохранности; 

  • даёт рекомендации по классификации различных свойств, которые могут иметься в текстуальном контенте, как это описано в ISO 20271-3 (?) по слоям эталонной модели, - а также примеры классификации и рекомендации по улучшению деятельности по обеспечению долговременной сохранности после проведения классификации.
Стандарт ISO 20271-2 не специфицирует:
  • конкретные технические методы проверки того, имеются ли свойства у определённого текстуального контента или нет;

  • конкретные технические методы анализа форматов текстуального контента, таких как DOC, DOCX, ODT, TXT, PDF и т.д.;

  • конкретные элементы метаданных, используемых для целей обеспечения долговременной сохранности текстуального контента;

  • необходимое компьютерное оборудование и/или операционные системы;
Стандарт ISO 20271-2 также не рекомендует:
  • конкретные файловые форматы как подходящие для долговременного хранения текстуального контента;

  • какие-либо процессы, процедуры или методы управления, связанные с обеспечением долговременной сохранности и с управлением документами.
Данный документ содержит технические рекомендации для организаций, отдельных лиц, а также государственных и частных органов и организаций, которые вовлечены в проектирование электронных текстуальных материалов, занимаются оценкой существующих файловых форматов или расширением спецификаций файловых форматов. Его главная цель – обеспечение сохранения возможности технически интерпретировать и понять этот текстуальный контент несмотря на потенциальное (моральное и физическое – Н.Х.) устаревание, удовлетворяя одновременно различные требования и учитывая различные уровни информации. Эти рекомендации будут особенно ценны для пользователей, которые не вполне знакомы с техническими особенностями файловых форматов и/или с ключевыми элементами контента текстуальных материалов.»

Содержание стандарта следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Текстуальные материалы
5. Эталонная модель для текстуального контента
6. Целевой контент для применения эталонной модели
Библиография

Мой комментарий: Российские представители в разрабатывающей стандарт рабочей группе не раз высказывали своё скептическое отношение к нему. В частности, отмечалось:

  • В документе совсем не упоминается ни уже накопленный (с 1960-х годов) мировой опыт (включая опыт национальных архивов, библиотек, крупных государственных и научных учреждений), ни авторитетные международные документы, проекты и концепции (например, реестры форматов, такие как PRONOM). Иными словами, «велосипед» пере-изобретается заново :)

  • Большим недостатком проекта стандарта является отсутствие четкого определения понятия «текстуальный контент / текстовой документ» (textual document). 

    В проекте стандарта сказано следующее: «Под текстуальным документом/контентом понимается тип документов/контента, который обычно создается, сохраняется или распечатывается с использованием различных типов программного обеспечения для редактирования документов. Соответствующие файлы обычно имеют такие расширения имени файла, как TXT, DOCX, Open Document Text (ODT), Portable Document Format (PDF), Hangul Word Process XML (HWPX), TeX, Hyper-Text Markup Language (HTML) и другие.»

    Известно, что в некоторых юрисдикциях текстовыми документами считаются те, в которых (основная) информация представлена  в виде букв алфавита, включая векторную и растровую графику. Сканы традиционных бумажных документов также обычно считаются текстовыми документами (независимо от того, были ли они распознаны с помощью OCR или нет). 

    По каким-то своим причинам авторы проекта не рассматривают в качестве текстуального контента сообщения электронной почты, PowerPoint-презентации, электронные таблицы, XML-документы (признавая лишь некоторые специфические форматы на основе XML) … 

  • Согласно тексту стандарта, текстуальный контент может также включать различные нетекстовые элементы контента, такие как аудиовидеозаписи и изображения – ввиду чего становиться непонятно, зачем вообще отдельно выделять «текстуальный контент». В этом плане данный стандарт идёт вразрез со сложившейся практикой и предлагает «эталонную модель», которая, возможно, была бы интересна лет 25 тому назад, но которая, на наш взгляд, не соответствует реалиям 21-го века.

  • Модель в целом представляется слишком сложной и непонятной для использования теми, кто не является специалистом по технологиям и форматам; а те, кто в данных вопросах разбирается, с нашей точки зрения, в подобной модели не нуждаются. Иными словами, в стандарте отсутствуют конкретные и практичные рекомендации для специалистов, которые на деле занимаются обеспечением сохранности документов и контента.

  • В проекте не упоминается, что цели и масштабы усилий по обеспечению долговременной сохранности определяются законодательно-нормативными требованиями и деловыми потребностями, а также возможностями организаций. В зависимости от них определяется, какие особенности оригинала должны быть сохранены - порой следует сохранять лишь сравнительно небольшую часть исходного контекста и поведения контента. Также следует учитывать особенности технологического ландшафта и тенденций его изменения. 

  • Ничего толком не сказано о том, как быть с усиленными электронными подписями, печатями, отметками времени и т.п., и как вообще решать задачу сохранения юридической и доказательной силы электронных документов при длительном хранении. 

По нашему мнению, сегодня нет никакой ощутимой потребности в подобной «эталонной модели» для текстуального контента.

Источники: сайт ИСО / сайт BSI
https://www.iso.org/standard/86228.html 
https://www.iso.org/obp/ui/en/#!iso:std:86228:en 
https://standardsdevelopment.bsigroup.com/projects/2023-00655 

Комментариев нет:

Отправить комментарий