среда, 8 января 2025 г.

Стивен Кларк о терминах «данные», «информация» и «документ»

Данная заметка бывшего Главного архивиста Новой Зеландии, ныне консультанта в сфере искусственного интеллекта, машинного обучения и управления информацией и данными Стивена Кларка (Stephen Clarke) была опубликована 6 декабря 2023 года на сайте LinkedIn.

Я часто наблюдаю путаницу, связанную с непониманием различия между понятиями «данные», «информация» и «документы» (record). Есть даже те, кто использует эти термины как взаимозаменяемые синонимы, так что...

  • Элемент данных (datum) = отдельная величина, точка, отдельное измерение.

  • Данные (data) = агрегация /набор из нескольких элементов данных (в латыни, data - просто множественное число от datum), часто, но не всегда организованных в столбцы, строки или таблицы.

  • Информация (information) = данные, агрегированные (собранные) в определённом контексте (обычно для определенной цели), и хоть и не всегда, но часто выраженные в поддерживающей текстовой или естественно-языковой форме.

  • Документ (record) = информация, имеющая доказательную ценность.

Документ, по сути дела, это информация, зафиксированная вместе со всем соответствующим контекстом (обычно в форме метаданных), который устанавливает её происхождение (которые некоторые называют «родословной»), наделяющее её атрибутами, придающими ей статус имеющей доказательную ценность с деловой или юридической точек зрения. В основном информация управляется с целью обеспечения её достоверности (trustworthiness), что означает, что она будет способна противостоять в суде попыткам её оспаривания.

Стивен Кларк (Stephen Clarke)

Источник: сайт LinkedIn
https://www.linkedin.com/posts/steffclarke_i-often-encounter-the-confusion-between-what-activity-7270699698250801152-lp_s

Комментариев нет:

Отправить комментарий