вторник, 18 февраля 2020 г.

Управление документами до и после ИИ-революции, часть 2


(Продолжение, начало см. http://rusrim.blogspot.com/2020/02/1_17.html )

Период после цифровой революции

Мой комментарий: Лично я считаю, что электронная (цифровая) революция ещё только-только начинается, и что завершился лишь её первый этап. Мы ведь не говорим, что революционные преобразования, связанные с электромагнитными технологиями, закончились с появлением лампочек накаливания!

Предвестником цифровой революции стала компьютеризация организациями различных процессов и потоков работ в 1960-х, 1970-х и 1980-х годах. Сфера этой компьютеризации была в значительной степени ограничена очень предсказуемыми процессами с большими объемами транзакций, такими, как расчет заработной платы, ведение бухгалтерских книг, управление запасами и т.д. Эти процессы были компьютеризированы путем создания баз данных с моделью данных, специально адаптированной к конкретному процессу.

Цифровая революция пришла в крупные англоязычные экономики в начале 1990-х годов, когда был найден способ включения общей деловой переписке в структуру данных. Рассматриваемая структура данных содержалась в протоколе электронной почты (см.  https://en.wikipedia.org/wiki/Simple_Mail_Transfer_Protocol ), в котором специфицировался формат, с использованием которого один подключенный к Интернету компьютер мог послать сообщение (электронную почту) другому. Распространение электронной почты привело к появлению компьютеров на рабочих столах каждого служащего в крупных экономиках.

Мой комментарий: Протокол SMTP, на который сослался автор, появился ещё в 1982 году т.е. «до интернета». Электронная почта впервые появилась в корпоративных компьютерных сетях.

Подобно тому, как квантовая частица, такая как электрон, может рассматриваться и как частица, и как волна, так и электронные письма в системах электронной почты можно рассматривать:
  • как неструктурированные данные - электронные письма являются отдельными элементами переписки, которые перемещаются от одного лица к другому и которые в определенный момент следует сохранить вместе с иной документацией, относящейся к тому же направлению работы; либо

  • как структурированные данные - система электронной почты представляет собой корпоративную базу данных, и каждое новое сообщение электронной почты становится новой записью в базе данных. Подобно записям в базе данных любого другого типа, ни отправителю, ни кому-либо из получателей не нужно помещать его в дело, поскольку это сообщение интегрировано в структуру / схему системы электронной почты с момента отправки / получения.
В начале цифровой эпохи (с 1990-х годов и до наших дней):
  • Преобладающей формой документирования стали «наборы данных». Организации имеют множество баз данных. Некоторые из них относятся к конкретному процессу или направлению деловой деятельности, другие используются в масштабах всей организации. Система электронной почты - это база данных переписки. Система управления контентом представляет собой базу данных контента, доступного через веб-сайт и/или интранет. Система управления взаимоотношениями с клиентами (customer relations system) - это база данных о контактах с клиентами, и т.д. Некоторые оперативные и логистические базы данных могут содержать критически важную для деловой деятельности информацию, а также ключевую интеллектуальную собственность и ноу-хау;

  • Объемы и скорость передачи документации увеличиваются в геометрической прогрессии. Распространение электронной почты привело к тому, что время, необходимое для передачи корреспонденции от отправителя к получателю сокращается практически до нуля;

  • Нет какой-то единой общей схемы организации документов. Каждый набор данных использует свою собственную отдельную схему метаданных / модель данных;

  • Управление документами становится стратегической / политической функцией, устанавливая требования к тому, что отдельные сотрудники должны и не должны делать с документами и данными, которые они создают и получают;

  • Перенос структурированных данных из аналоговых регистров, индексных и инвентарных книг, картотек и учётных реестров в цифровые базы данных является трансформирующим процессом благодаря новым мощным способам обработки и анализа данных, которые приносят с собой компьютеры;

  • Поля метаданных позволяют машинам «понимать» данные в структурированных системах. Машины могут выполнять задачи управления информацией, если им даны правила, сообщающие им, какие действия должны быть инициированы при появлении в поле метаданных определенных значений.
Управление документами в последние два десятилетия после цифровой революции оказалось намного менее эффективным, чем в предшествующие ей четыре десятилетия.

В начале цифровой эпохи профессия управления документами видела свою задачу в управлении электронными документами. Это видение было основано на предположении, что фундаментальным изменением, связанным с цифровой революцией, являлась смена формата с бумажного на цифровой. Мы предполагали, что неструктурированные данные будут по-прежнему преобладать над структурированными данными, как это было на протяжении всей истории управления документами в период до цифровой революции. Мы предполагали, что элементы переписки будут продолжать функционировать как неструктурированные данные – как более-менее самостоятельные, свободно перемещающиеся объекты, которые в определенный момент их жизненного цикла необходимо захватить и интегрировать в структуру и систему.

Стандартная стратегия управления документами в первое десятилетие цифровой эпохи заключалась в том, чтобы настроить корпоративные документные системы, в которые можно было бы захватывать документы и переписку, интегрируя их с другими документами в рамках классификации / структуры документов.

Эта стратегия провалилась из-за того, что большая часть корреспонденции существует в виде электронных писем в электронных почтовых системах. Их движение сводится к передаче из одной системы электронной почты в другую, если отправитель и получатель используют различные почтовые системы. Нет такой точки, в который отправителю либо получателям нужно «списать их в дело». Сообщения электронной почты уже интегрированы в структуру и схему метаданных системы электронной почты как отправителя, так и получателя (получателей).

В цифровую эпоху единственным типом документов, который функционирует как «неструктурированные данные» и нуждается в сознательном захвате в структуру, являются документы, созданные с помощью программного обеспечения для обработки текстов / презентаций / электронных таблиц, такого как Microsoft Word / PowerPoint / Excel. Такие документы ведут себя подобно документам бумажной эпохи. На момент их создания они ещё не интегрированы в структуру, и поэтому их создатель должен где-то их зарегистрировать и сохранить. Отсюда возникает потребность в системах управления контентом (document management systems).

Корпоративные системы управления контентом заслуживают внимания. Они нуждаются и заслуживают тщательного управления. Они выступают в роли документных систем для контента, созданного в таких пакетах программ, как Microsoft Word, PowerPoint и Excel. Они обеспечивают более чем достаточный объём работы для многих специалистов-практиков. Мы, однако, не можем основывать на них свою профессию. Наша профессия все меньше влияет на такие системы, поскольку огромная часть рынка таких систем принадлежит всего двум поставщикам (Microsoft и Google).

Между корпоративными системами управления контентом и системами электронной почты сложились непростые взаимоотношения. Системы управления контентом редко выступают в качестве документных систем для корреспонденции; в то же время системы электронной почты обычно действуют в качестве документных систем для контента. Когда необходимо кому-либо передать контент, он обычно отправляется по электронной почте.

Мой комментарий: Последнее утверждение (в плане «обычно») на данный момент устарело. Контент сегодня передается разнообразными способами – через социальные сети, путем открытия доступа к файлам в облачных хранилищах и на веб-сайтах, через доверенные третьи стороны и т.д. Помимо этого, вместо передачи документов туда-обратно всё чаще практикуется совместная работа над ними в информационных системах.

В системе электронной почты фиксируется дата отправки контента, сведения об отправителе и адресатах, переданное вместе с контентом сообщение полученные ответные сообщения. Как корпоративная система управления контентом, так и система электронной почты охватывают все виды корпоративной деятельности. Каждая из них содержит большую часть документов организации, однако система электронной почты даёт гораздо больше с точки зрения информации о ходе принятия решений в связи с документами и помимо них.

Системы для совместной работы последнего поколения (такие как Microsoft Teams - пространство для групповой работы в Office 365 – Н.Х; и Slack – корпоративный мессенджер – Н.Х.) пытаются преодолеть этот разрыв между системами электронной почты и системами управления контентом, выводя информационный обмен в рамках рабочих групп из систем электронной почты в пространство для совместной работы. Это стратегия лучше, чем попытки переместить диалоги, имевшие место в среде электронной почты, в среду управления контентом. У неё есть хорошие шансы на успех, когда люди преимущественно общаются в рамках тесно сплочённой группы (например, в рамках проектной команды). Она, однако, имеет тенденцию работать не так хорошо, когда взаимодействие идёт через границы групп и организаций, с вовлечением в него меняющегося набора собеседников по изменяющемуся кругу вопросов. Эта последняя категория охватывает многих людей, чьи документы архивисты обычно хотят принять на постоянное хранение (лица, принимающие политические решения; дипломаты и т.д.).

ИИ-революция

ИИ-революция происходит прямо сейчас, в начале третьего десятилетия 21-го века. Она влечет за собой значительное расширение сферы суждений и выводов, которые могут быть сделаны с помощью машинного интеллекта.

До ИИ-революции машины могли принимать касающиеся управления информацией решения и суждения лишь при определенных обстоятельствах, круг которых был ограничен, а именно, при одновременном выполнении следующих трёх условий:
  • машина явным образом запрограммирована, как именно выносить суждение или принимать решение;

  • решение может быть принято на основе значений в полях метаданных;

  • значения в этих полях метаданных должны быть ясными и однозначными.
ИИ-революция позволяет машинам выносить суждения и решения, не будучи явно для этого запрограммированными. Нам больше не нужно давать машине пошаговые инструкции. Если мы используем инструмент машинного обучения для выявления в переписке по электронной почте тех электронных писем, могут быть классифицированы как «деловая переписка», мы фактически используем набор алгоритмов (модель машинного обучения) для разработки другого набора алгоритмов (тех, что будут отделять деловые письма от личной / тривиальной электронной почты на основе наблюдаемых в данных закономерностей).

Наиболее очевидный способ обучить инструмент машинного обучения выделять деловую переписку в системе электронной почты - это «скормить» ему обучающий набор электронных писем, каждое из которых классифицировано как «деловое» либо «личное / тривиальное». Модель машинного обучения анализирует набор деловых писем и ищет характеристики, значения которых, как правило, отличаются от значений тех же характеристик для не-деловой переписки. Инструмент предлагает возможный алгоритм классификации, устанавливая параметры для каждой характеристики данных. Затем алгоритм обычно тестируется путем подачи на вход смешанного набора, содержащего как деловых, так и не-деловые электронных письма, с тем, чтобы увидеть, насколько точно он способен их различать.

Если до ИИ-революции правила для машинные опирались на определенность, нынешние алгоритмы работают с учётом вероятности. Неформальный стиль электронного письма увеличивает вероятность того, что оно является тривиальным (или личным), но не дает безусловной уверенности в этом. Принимая во внимание другие особенности данных (заголовок электронного письма, количество получателей, роли получателей, темы, затронутые в письме, судя по ключевым словам в теле сообщения и т.д.), алгоритм может повысить собственную уверенность в правильности классификации письма как «тривиального / личного» (или «делового»). Алгоритмы машинного обучения могут сообщить Вам не только то, как они классифицировали объект, но также выдать и количественную оценку достоверности этого суждения. Это позволяет организации установить пороговый уровень достоверности, ниже которого вынесенные машиной суждения должны проверяться людьми.

(Окончание следует, см. https://rusrim.blogspot.com/2020/02/3.html )

Джеймс Лепен (James Lappin)

Источник: блог «Thinking Records»
https://thinkingrecords.co.uk/2020/01/30/records-management-before-and-after-the-ai-revolution/

Комментариев нет:

Отправить комментарий