четверг, 3 января 2019 г.

США: Семинар по вычислительной архивной науке, часть 2


(Окончание, начало см. https://rusrim.blogspot.com/2019/01/1.html )

2. Кеннет Тибодё (Kenneth Thibodeau, в прошлом один из наиболее заметных специалистов Национальных Архивов США; теперь, после выхода на пенсию – независимый исследователь) «Вычислительная архивная практика: На пути к теории архивной инженерии» (Computational Archival Practice: Towards a Theory for Archival Engineering)

Аннотация: «Ценность вычислительной архивной науки реализуется через производство товаров и услуг. Конечная ценность архивной науки – это её вклад в организацию информации о прошлом. Архивная инженерия предлагает систематическую основу для получения такого рода отдачи. В статье сформулированы концепции, которые можно объединить с традиционной архивной теорией с тем, чтобы расширить сферу её применения и разработать архивные методы, которые можно оттестировать, проверить, и эффективность которых можно измерить.»

Материалы доступны по адресу: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/3.Thibodeau-1.pdf (презентация), и http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/3.Thibodeau.pdf  (статья).

3. Натаниэль Пейн (Nathaniel Payne, университет Британской Колумбии, Канада) «Размешать котёл: Переосмысление вычислительной архивной науки для области больших данных» (Stirring The Cauldron: Redefining Computational Archival Science (CAS) for The Big Data Domain)

Аннотация: «За последние 10 лет оцифровка, большие данные и технологический прогресс существенно повлияли на деятельность специалистов в области компьютерных и информационных наук, а также архивистов. Каждая из этих групп по отдельности внесла свой вклад в открытие новых направлений междисциплинарных исследований, имеющих критически-важное значение для дальнейшего прогресса в мире больших данных, а все вместе они способствовали созданию новой междисциплинарной области знаний - вычислительной архивной науки (Computational Archival Science, CAS). К сожалению, существуют значительные пробелы, в том числе отсутствие всеобъемлющего определения понятия «вычислительная архивная наука». Настоящая статья устраняет эти пробелы, предлагая новое, всестороннее определение этого понятия, одновременно подчеркивая ключевые проблемы «больших данных», которые возникают место как в практической деятельности, так и в рамках научных исследований. В статье также предлагаются важные направления будущих исследований, особенно в контексте больших данных и искусственного интеллекта.»

Материалы доступны по адресу: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/4.Payne_-1.pdf  (презентация); и http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/4.Payne_.pdf  (статья).

4. Тим Хатчинсон (Tim Hutchinson, библиотека университета Саскачевана, Канада) «Защита в архивах неприкосновенности частной жизни: Машинное обучение с учителем и изначально-электронные документы» (Protecting Privacy in the Archives: Supervised Machine Learning and Born-Digital Records)

Аннотация: «В данной статье описаны итерации, выполненные при разработке обучающих наборов для машинного обучения с учителем (supervised machine learning), связанных с идентификацией содержащих персональные данные документов по личному составу. В целом, эти результаты являются многообещающими, хотя мы пока что не смогли предложить более систематического подхода к разработке к формированию обучающих наборов. Это говорит о том, что машинное обучение с учителем может стать жизнеспособным подходом для создания метода «отбора», используемого при анализе коллекций на предмет установления ограничений по доступу.»

Материалы доступны по адресу: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/5.Hutchinson-1.pdf (презентация); http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/5.Hutchinson.pdf  (статья).

5. Кристофер Ли (Christopher Lee, университет Северной Каролины, США) «Экспертиза ценности и отбор архивных материалов с использованием компьютерных технологий» (Computer-Assisted Appraisal and Selection of Archival Materials)

Аннотация: «Несмотря на развитие различных технологий, способствующих как обеспечению долговременной сохранности, так и описанию архивных материалов, мы все еще наблюдаем относительно небольшой прогресс в плане развития программного обеспечения, поддерживающего такие ключевые виды деятельности, как экспертиза ценности и отбор. Есть два фактора, существенно отличающих экспертизу ценности и отбор электронных материалов от экспертизы ценности и отбора аналоговых материалов: электронные материалы существуют на нескольких уровнях представления, и они являются непосредственно машиночитаемыми. Благодаря этому существуют прекрасные возможности для более эффективной поддержки экспертизы ценности и отбора электронных материалов, включая использование инструментов цифровой криминалистики (digital forensics), методов и средств обработки текстов на естественном языке и машинного обучения.»

Материалы доступны по адресу: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/6.Lee_-1.pdf  (презентация); http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/6.Lee_.pdf  (статья).

6. Тайлер Смит (Tyler Smith, компания Adventium Labs,  США) «Лакмусовая бумажка для блокчейна» (The Blockchain Litmus Test)

Аннотация: «Лежащая в основе Биткойна база данных в виде блокчейн-цепочки - это новый подход к управлению документами, который потенциально может децентрализовать большие данные. Успех Биткойна вдохновил множество аналогичных проектов, надеющихся использовать блокчейн в качестве распределенной базы данных для инноваций в плане управления документами в других областях. Заблуждения и преувеличения в отношении блокчейна и его возможностей широко распространены в средствах массовой информации. Опираясь на видение проблем с точки зрения архивной науки, надежных вычислений (dependable computing) и безопасных вычислений (secure computing), в данной статье рассматриваются существующие приложения, научные исследования и критика блокчейна, с тем. чтобы дать объективную оценку его преимуществ и ограничений. На основе этого анализа в статье предлагаются три критерия, позволяющие предсказать успешность проектов управления данными на основе технологии блокчейна, а именно: надежность, безопасность и доверие.»

Соответствующая статья доступна по адресу: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2018/12/11.Smith_.pdf

Источник: блог DCIC на сайте университета штата Мэриленд
http://dcicblog.umd.edu/cas/ieee-big-data-2018-3rd-cas-workshop/

Комментариев нет:

Отправить комментарий