четверг, 15 декабря 2011 г.

Автоматическая классификация документов – уже реальность?

30 ноября 2011 года компания OpenText представила своё новое решение OpenText Auto-Classification, которое, по её словам, является «первым программным приложением для автоматической классификации, спроектированным с учетом требований по обеспечению прозрачности и защитимости в суде. Оно дает организациям мощные средства  управления сроками хранения и решением судьбы больших объёмов такого контента, как сообщения в социальных сетях, сообщения электронной почты, офисные документы и унаследованный контент, - позволяющие снизить правовые риски и расходы на поиск и выемку электронных документов и информации в ходе судебных разбирательств и расследований (eDiscovery)».

Далее в пресс-релизе компании отмечается:  «По словам руководителя службы маркетинга компании OpenText Джеймса Лэфема (James Latham), «Когда мы рассказываем нашим клиентам о технологии автоматической классификация, их самые большие опасения следующие: «Как мы будем это делать систематически согласованно в отношении всего контента, и как мы сможет это доказать в случае необходимости?». Приложение для автоклассификации с самого начала разрабатывалось для решения этих проблем. Теперь у нас есть первый в отрасли инструмент для автоматизированной классификации, со встроенными средствами статистического анализа и обеспечения качества, обеспечивающие как прозрачность процесса автоклассификации,  так и его защитимость в суде. Это решение кардинально меняет практику управления электронными документами».

«Деловые руководители и специалисты по управлению документами должны управлять процессами классификации, использования, хранения в течение установленных сроков, защиты, поиска и извлечения, и, в конечном итоге, уничтожения либо передачи на постоянное архивное хранение «деловых документов». Все чаще, однако, от них требуется управлять огромными объемами «преходящего» или малоценного контента из социальных сетей  и электронных почтовых систем, из-за их стоимости и потенциальных рисков. Классификация контента (по существу, экспертиза его ценности – Н.Х.) имеет критически-важное значение, поскольку позволяет организации определить, что нужно сохранить, а что можно выбросить. Исторически сложилось так, что классификация контента возлагалась на конечных пользователей, однако степень исполнения и точность классификации были низкими, часто подводя организацию под дорогостоящие электронные выемки и штрафы.»

Презентация OpenText Auto-Classification

«Предлагаемое компанией OpenText  приложение для автоматической классификации обеспечивает проведение согласованной, защитимой в случае споров классификации контента без вмешательства (после того, как система налажена) конечных пользователей. Оно использует «аналитический мотор» (OpenText Content Analytics engine)  для просмотра всех документов, сообщений электронной почты и постов в социальных сетях и классификации контента в соответствии с корпоративной политикой и законодательно-нормативными требованиями. В отличие от аналитики, базирующейся на поиске или ключевых словах, приложение  OpenText Content Analytics кодифицирует специфические языковые нюансы, выявленные группами экспертов-лингвистов, что радикально улучшает точность.»

«Делая значительный шаг вперед по сравнению с системами классификации, представляющими собой «черные ящики», данный продукт включает специальные модули (workbenches) для выявления типовых документов и формирования правил, для тестирования и повышения эффективности, обеспечения качества и непрерывно проводимого создания репрезентативных выборок из более обширного широкого набора документов. Всё это обеспечивает организациям уровень прозрачности, который им необходим для того, чтобы непрерывно адаптировать «мотор» автоматической классификация к их меняющимся потребностям; и чтобы доказывать судам и регулирующим органам наличие у них эффективной системы управления документами.»

На рынке данное средство должно появиться в конце года. Дополнительную информацию можно найти по адресу: http://www.opentext.com/2/global/products/products-opentext-ecm-suite/products-ecm-suite-lifecycle/products-ecm-suite-lifecycle-auto-class.htm

Первая реакция ведущих специалистов на это объявление - осторожно-положительная. Многие говорят о том, что если такие средства действительно обеспечат более производительную и качественную классификацию массового контента, то слово «революция» вовсе не будет преувеличением.

Источник: сайт компании OpenText
http://www.opentext.com/2/global/press-release-details.html?id=354442799299477CB4BC196BADC1A3A0 

17 комментариев:

  1. «Классификация контента без вмешательства… конечных пользователей» в России вряд ли пройдет, т.к. более 60% документов временного срока хранения (от 3 до 5 лет), а это «стержневой срок» для рассматриваемого «мотора» автоматической классификации».

    В отличие от опыта стран Европы, в России устоялся институт «завершающей» экспертно-проверочной оценки (во многом предвзятой) специалистов для времянки, обеспечивающую «прозрачности и защитимость в суде». Или так называемая отметка «ЭК/ЭПК».

    Хотя, в плане сокращения на корню специалистов федеральных, региональных и муниципальных архивов и замена их всех «мотором» автоматической классификации» (можно одним на всю Россию) – затея занятная… :)))

    И «революция», о которой так «долго говорили» «технари» свершится! :) В федеральных, региональных и муниципальных архивах, а также архивах источников комплектования останутся только системные администраторы-архивисты-делопроизводители (в одном флаконе) :)

    Впрочем, это моя/й ИМХО :) С уважением С.В. Дроков

    ОтветитьУдалить
  2. Сергей Владимирович, я призываю Вас перечитать текст пресс-релиза компании, и обратить внимание на то, что она – очень аккуратно – предлагает использовать этот инструментарий не во всех случаях, а, в первую очередь, для классификации тех массовых (очень важное слово!) материалов, до которых у немногочисленных профессиональных архивистов и документоведов руки не доходят.

    Чтобы довести любую идею до абсурда IMHO много ума не надо… А ведь автоматическая классификация наверняка могла бы пригодиться и такой компании, как ЭЛАР :) (а вот где и как - подсказывать не буду)

    Насчет ЭПК… Ваши слова говорят о том, что теорию-то Вы знаете, но мало знакомы с реальной практикой. В большинстве организаций никакой серьёзной экспертизы не проводится, и им что ЭПК, что не ЭПК – всё едино. Вы, как говорится, ещё бы и про полистный просмотр вспомнили...

    ОтветитьУдалить
  3. Наталья Александровна, категория (?) "массовые документы", обеспечивающие «прозрачность и защитимость в суде», это что такое может быть не у них, а у нас?

    Любопытно, категорийность, в корне завязанная на "массовость", а дальше в "гамбургском счете"?.. :) С уважением С.В. Дроков

    ОтветитьУдалить
  4. Перечитал: "у немногочисленных профессиональных архивистов и документоведов руки не дошли" до "офисных документов"? Н-дя. :) С уважением С.В. Дроков

    ОтветитьУдалить
  5. Полагаю, что «мотор» автоматической классификации» может быть интересным решением для практического внедрения в России в отношении э-документов со сроком хранения "До минования надобности".

    Этого "добра" выше крыши, в каждой мусорной корзине. А сколько стоит "мотор" для макулатуры? :) С уважением С.В. Дроков

    ОтветитьУдалить
  6. С.В.Дрокоп писал: это что такое может быть не у них, а у нас?

    Не говоря уже о том, что у нас есть и электронная почта, и социальные сети, и сайты, которые - если прислушиваться к голосам практиков - уже становятся проблемой, есть такая область деятельности, как работа с обращениями граждан. Их классификация по типу, тематике и срокам хранения - задача сложная, и здесь определенная автоматизация была бы на пользу.

    Перечитал ... Н-дя.

    Что это вдруг такое удивление? Многие отечественные специалисты (даже в организациях, отнесенных к лидерам в нашей ветви Галактики), не в курсе, что в природе существует что-то помимо ОРД :)

    ОтветитьУдалить
  7. С.В.Дроков писал: Полагаю, что «мотор» автоматической классификации» может быть интересным решением для практического внедрения в России в отношении э-документов со сроком хранения "До минования надобности"

    Ну что же, можно констатировать, что точка зрения эксперта "ЭОС" в данном случае кардинально расходится с мнением аналитика компании "ЭЛАР" :)

    ОтветитьУдалить
  8. Все документы по отражаемым в них видам деятельности делятся на две большие группы. Первая — это документы по общим и административным вопросам, т.е. вопросам общего руководства предприятием (организацией) и его производственной деятельностью. Эти документы могут составлять работники всех подразделений предприятия. Вторая группа — документы по функциям управления. Такие документы составляют работники финансовых органов, бухгалтерии, отделов планирования, снабжения и сбыта, других функциональных подразделений.

    По происхождению документы классифицируют на служебные, подготовленные на предприятиях, в организациях, и личные письма граждан с изложением жалоб, предложений, просьб.

    Так какие документы классифицируются?

    "действительно обеспечат более производительную и качественную классификацию массового контента"

    А где в законодательстве именно в российской федерации посмотреть термин "массовый контент". Поясните, как специалисты ДОУ это понимают.
    И еще данный продукт применим к Российской практике?

    ОтветитьУдалить
  9. Syntarex писал: Так какие документы классифицируются?

    По-моему, в пресс-релизе достаточно ясно указана нацеленность продукта: установление сроков хранения на основе определения тематики документов, сообщений и т.п.

    Служебные документы или, скажем, заявления граждан могут затрагивать разные по важности вопросы, и соответственно, им будут устанавливаться разные сроки хранения.

    Более того, подобное средство наверняка можно использовать и без "привязки" к делопроизводству - например, для поиска материалов по определенной тематике в большом массиве информации.

    А где в законодательстве именно в российской федерации посмотреть термин "массовый контент"

    Нигде. Только вот я не понимаю - Вам термин не нравится (так предложите свой!), или Вы считаете что массового контента нет как такового, нет электронной почты, SMS, Твиттера, социальных сетей, многочисленных рабочих материалов? :)

    И еще данный продукт применим к Российской практике?

    Какой ответ Вы ждёте? И немецким молотком можно забивать российские гвозди.

    OpenText, - для тех, кто не в курсе, - сейчас занимает 4-5 места в рейтинге поставщиков ECM-решений фирмы Gartner (деля его с EMC). Компания работает на международный рынок, и не станет выпускать продукт, "заточенный" исключительно под законодательство и практику одной страны. А если в России будет к таким средствам интерес, поставщик наймёт российских лингвистов и других специалистов для подстройки под наши особенности.

    ОтветитьУдалить
  10. А если Вам предложить в поисках ответов, прежде всего отталкиваться от видов деятельности, не испугаетесь? :) Откройте ОКВЭД. Он используется при решении следующих основных задач, связанных с: - классификацией и кодированием видов экономической деятельности, заявляемых хозяйствующими субъектами при регистрации; - определением основного и других фактически осуществляемых видов экономической деятельности хозяйствующих субъектов; - разработкой нормативных правовых актов, касающихся государственного регулирования отдельных видов экономической деятельности…

    Вопрос к Вам: виды деятельности – это что? И надо ли что-то выдумывать, при наличии обязательного (!) классификатора? Откуда взялись «две большие группы», состоящие из: 1-я «общих» и «административных» вопросов? Не тавтология ли это искусственно выдуманного отожествления одного и того же? Затем, 2-я «большая» группа – документы по функциям. Функционирование и деятельность, для Вас это одно и того же?

    Почему Вы привязываетесь к структуре одно из 2-х Типовых перечней документов, а не унифицированным системам документации (см. ОКУД)? Что Вы понимаете под «происхождением» документов? Смотрите, пишите «личные письма граждан с изложением жалоб, предложений, просьб». Есть «личные письма», предположим Пушкина к…, но граждане же «обращаются» и не важно с чем: жалобами, предложениями, просьбами. Поэтому есть спецуказ Президента.

    В законодательных актах термины «массовый контент», слава Богу, отсутствует. :) А описанный в посте продукт присутствует также как модуль в FaleNet. С уважением С.В. Дроков (гражданин РФ) :)

    ОтветитьУдалить
  11. Вы, Сергей Владимирович, вероятно, единственный человек в стране, который все эти многочисленные классификаторы (как првило, неполные и устаревшие, а то и вовсе невостребованные) воспринимает всерьёз. Поэтому Вас надо беречь! :)

    В законодательных актах термины «массовый контент», слава Богу, отсутствует

    Отсутствует, отсутствует! А существование такого контента в реальном мире, это ведь неважно, правда? Вы же живете в другом мире - в мире классификаторов :)

    ОтветитьУдалить
  12. Ну, да. А еще я живу в России! С уважением С.В. Дроков (гражданин РФ)

    ОтветитьУдалить
  13. А еще я живу в России!

    За это Вам медаль не дадут - тут нас таких 150 миллионов + иностранцы + граждане мира и лица без гражданства :))

    ОтветитьУдалить
  14. Наталья Александровна, а Вы действительно считаете общероссийские классификаторы «и вовсе невостребованными»? Даже в рамках «электронного бюджета» Минфина?

    http://svdrokov.blogspot.com/2011/11/blog-post_24.html
    http://svdrokov.blogspot.com/2011/12/blog-post_03.html

    С уважением С.В. Дроков (гражданин РФ)

    ОтветитьУдалить
  15. «А если Вам предложить в поисках ответов, прежде всего, отталкиваться от видов деятельности, не испугаетесь? :) Откройте ОКВЭД."»

    Конечно ОКВЭД это важно и нужно. Но и думаю предложенная в Учебнике Под ред. проф. В.А. Кудряева. - 2-е изд., М.: ИНФРА-М, 2002. - 592 с. деление на группы не ошибочно.

    «... подобное средство наверняка можно использовать и без "привязки" к делопроизводству»
    Согласен, но таких подходов в России тоже достаточно. Может ПО и нет , но теоретическая основа велика.
    Чего только стоит классификатор Гроссберга или информационная система «Обзор-ЭСИ» или дизъюнктивная нормальная форма документа.
    Аж диву даешься!

    OpenText, …4-5 места в рейтинге поставщиков ECM-решений.
    ЕСМ – это слишком огромно. Там наверно подпод раздел – классификация. Так что это не показатель.

    «Компания работает на международный рынок, и не станет выпускать продукт, "заточенный" исключительно под законодательство и практику одной страны».

    Вот именно , компания что-то выпустила а Вы попробуйте воспользоваться. Получается деньги за продукт + еще за «донастройку». И не факт что «донастройка » не выйдет раза в 4 больше стоимости продукта.
    Но поживем, увидим.

    ОтветитьУдалить
  16. С.В.Дроков писал: Вы действительно считаете общероссийские классификаторы «и вовсе невостребованными»?

    Да. Не все, конечно, но многие.

    ОтветитьУдалить
  17. syntarex писал: Но поживем, увидим.

    Это, по крайней мере, конструктивная мысль. Согласна, поживём - увидим.

    ОтветитьУдалить