Стандарт разрабатывает технический подкомитет TC171/SC2 «Файловые форматы для электронного контента, системы управления контентом и аутентичность информации» (Document file formats, EDMS systems and authenticity of information). О работе над данным документом я уже рассказывала в посте по адресу http://rusrim.blogspot.com/2022/12/blog-post_23.html - с тех пор изменилась структура документа, и данная его часть, которая ранее была первой, теперь стала второй.
До 15 июня 2025 года желающие имеют возможность самостоятельно принять участие в публичном обсуждении стандарта на сайте Британского института стандартов (BSI) по адресу https://standardsdevelopment.bsigroup.com/projects/2023-00655 (требуется пройти бесплатную регистрацию на сайте).
Во вводной части стандарта отмечается следующее:
Стандарт ISO 20271-2 определяет основные понятия эталонной модели для текстуального контента. Он описывает составляющие эталонную модель слои; входящие в состав текстуального контента элементы; различные свойства, присущие текстуальному контенту, и их классификацию по типу.
Кроме того, стандарт определяет понятия, концепции и структуру эталонной модели обеспечения долговременной сохранности электронных документов и контента, которые могут применяться к другим типам документов и контента, помимо текстуальных.
Стандарт ISO 20271-2:
- определяет понятие «текстуальный контент» и описывает основные свойства контента, состоящего из текстуальных материалов;
- описывает понятия и концепции эталонной модели для текстуального контента; определяет ключевые элементы, имеющиеся в составе текстуальных материалов; и, на основе эталонной модели, предлагает рекомендации по улучшению деятельности по обеспечению долговременной сохранности;
- даёт рекомендации по классификации различных свойств, которые могут иметься в текстуальном контенте, как это описано в ISO 20271-3 (?) по слоям эталонной модели, - а также примеры классификации и рекомендации по улучшению деятельности по обеспечению долговременной сохранности после проведения классификации.
- конкретные технические методы проверки того, имеются ли свойства у определённого текстуального контента или нет;
- конкретные технические методы анализа форматов текстуального контента, таких как DOC, DOCX, ODT, TXT, PDF и т.д.;
- конкретные элементы метаданных, используемых для целей обеспечения долговременной сохранности текстуального контента;
- необходимое компьютерное оборудование и/или операционные системы;
- конкретные файловые форматы как подходящие для долговременного хранения текстуального контента;
- какие-либо процессы, процедуры или методы управления, связанные с обеспечением долговременной сохранности и с управлением документами.
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Текстуальные материалы
5. Эталонная модель для текстуального контента
6. Целевой контент для применения эталонной модели
Библиография
Мой комментарий: Российские представители в разрабатывающей стандарт рабочей группе не раз высказывали своё скептическое отношение к нему. В частности, отмечалось:
- В документе совсем не упоминается ни уже накопленный (с 1960-х годов) мировой опыт (включая опыт национальных архивов, библиотек, крупных государственных и научных учреждений), ни авторитетные международные документы, проекты и концепции (например, реестры форматов, такие как PRONOM). Иными словами, «велосипед» пере-изобретается заново :)
- Большим недостатком проекта стандарта является отсутствие четкого определения понятия «текстуальный контент / текстовой документ» (textual document).
В проекте стандарта сказано следующее: «Под текстуальным документом/контентом понимается тип документов/контента, который обычно создается, сохраняется или распечатывается с использованием различных типов программного обеспечения для редактирования документов. Соответствующие файлы обычно имеют такие расширения имени файла, как TXT, DOCX, Open Document Text (ODT), Portable Document Format (PDF), Hangul Word Process XML (HWPX), TeX, Hyper-Text Markup Language (HTML) и другие.»
Известно, что в некоторых юрисдикциях текстовыми документами считаются те, в которых (основная) информация представлена в виде букв алфавита, включая векторную и растровую графику. Сканы традиционных бумажных документов также обычно считаются текстовыми документами (независимо от того, были ли они распознаны с помощью OCR или нет).
По каким-то своим причинам авторы проекта не рассматривают в качестве текстуального контента сообщения электронной почты, PowerPoint-презентации, электронные таблицы, XML-документы (признавая лишь некоторые специфические форматы на основе XML) … - Согласно тексту стандарта, текстуальный контент может также включать различные нетекстовые элементы контента, такие как аудиовидеозаписи и изображения – ввиду чего становиться непонятно, зачем вообще отдельно выделять «текстуальный контент». В этом плане данный стандарт идёт вразрез со сложившейся практикой и предлагает «эталонную модель», которая, возможно, была бы интересна лет 25 тому назад, но которая, на наш взгляд, не соответствует реалиям 21-го века.
- Модель в целом представляется слишком сложной и непонятной для использования теми, кто не является специалистом по технологиям и форматам; а те, кто в данных вопросах разбирается, с нашей точки зрения, в подобной модели не нуждаются. Иными словами, в стандарте отсутствуют конкретные и практичные рекомендации для специалистов, которые на деле занимаются обеспечением сохранности документов и контента.
- В проекте не упоминается, что цели и масштабы усилий по обеспечению долговременной сохранности определяются законодательно-нормативными требованиями и деловыми потребностями, а также возможностями организаций. В зависимости от них определяется, какие особенности оригинала должны быть сохранены - порой следует сохранять лишь сравнительно небольшую часть исходного контекста и поведения контента. Также следует учитывать особенности технологического ландшафта и тенденций его изменения.
- Ничего толком не сказано о том, как быть с усиленными электронными подписями, печатями, отметками времени и т.п., и как вообще решать задачу сохранения юридической и доказательной силы электронных документов при длительном хранении.
По нашему мнению, сегодня нет никакой ощутимой потребности в подобной «эталонной модели» для текстуального контента.
Источники: сайт ИСО / сайт BSI
https://www.iso.org/standard/86228.html
https://www.iso.org/obp/ui/en/#!iso:std:86228:en
https://standardsdevelopment.bsigroup.com/projects/2023-00655
Комментариев нет:
Отправить комментарий