вторник, 14 января 2020 г.

США: В рамках инициативы IEEE Big Data 2019 прошёл 4-й семинар по вычислительной архивной науке, часть 2


(Окончание)

Я продолжаю рассказ о докладах, сделанных на 4-м семинаре по вычислительной архивной науке:
  • Даниэле Батиста (Danielle Batista, уничерситет Британской Колумбии, Канада) и Тим Вайнгартнер (Tim Weingärtner, Университет прикладных наук и искусства в Люцерне, Швейцария) «Решение ArchContract: использование смарт-контрактов для принятия решений об уничтожении документов либо передаче на архивное хранение» (ArchContract: using smart contracts for disposition).

    «Уничтожение/передача документов по истечении сроков хранения (disposition) является одним из следствий архивной функции экспертизы ценности. Это правда, что ни одно технологическое решение не способно в полной мере выполнить эту функцию, однако принятие решений по уничтожению/передачи уже сегодня поддерживается рядом инструментов.

    В данной работе мы предлагаем соответствующее приложение на основе технологии блокчейна - смарт-контракт, названный ArchContract, используя при этом два разных хранилища. Мы обсуждаем проведение экспертизы ценности и принятие решений об уничтожении/передаче документов на платформе блокчейн-систем, использование смарт-контрактов в качестве инструментов проведения экспертизы ценности, и представляем модель ArchContract. Мы пришли к выводу, что блокчейн и смарт-контракты имеют потенциал для поддержки определенных функций управления документами, таких, как решения об уничтожении/передаче.»

    Мой комментарий:
    Само собой, в блокчейне никакие документы не хранятся. Блокчейн используется для документирования принимаемых решений и их исполнения, а также для подтверждения целостности и аутентичности документов. Предлагаемый пример вызывает уже ставший привычным вопрос: да, такое решение можно реализовать – но зачем? Какое новое качество оно способно дать по сравнению с централизованным решением на основе традиционных технологий?


    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Batista.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/5_Danielle-Batista.pdf

  • Нкно Фрейре (Nuno Freire, компания INESC-ID, Португалия) и Сьёр де Вальк (Sjors de Valk, голландская сеть культурно-исторического наследия) «Автоматическая интерпретируемость онтологий связанных данных: Оценка в сфере сохранения культурно-исторического наследия» (Automated interpretability of linked data ontologies: an evaluation within the cultural heritage domain).

    «В сфере культурно-исторического наследия соответствующие учреждения и поставщики услуг стремятся к публикации и использованию связанных данных (linked data). В настоящее время проводится много исследований и совместных работ по адаптации и совершенствованию моделей данных культурного наследия под технологии связанных данных, по построению онтологий и словарей, а также по развитию сервисов на основе связанных данных.

    В этой работе представлена оценка опубликованных в виде связанных данных онтологий и словарей, которые происходят из области культурного наследия или часто используются и связаны с этой областью. Наше исследование направлено на оценку на удобство их использованию работающими в сети данных программами поиска и захвата (crawlers), в соответствии со спецификациями и практиками связанных данных, семантического интернета (Semantic Web) и онтологической логикой.

    Мы ориентируемся на вариант применения приложений потребления данных общего плана на основе инструментов RDF, RDF Schema, OWL, SKOS и руководств по связанным данным. Мы проанализировали двенадцать онтологий и словарей и установили, что четыре из них не полностью соответствовали требованиям, и что вопрос согласования онтологий не учитывается при их формировании.

    Данное исследование способствует изучению новых услуг на основе использования связанных данных. Оно также позволяет лучше оценить потенциал автоматизации при обработки разнообразных и объёмных связанных данных, при оценке жизнеспособности новых услуг на основе связанных данных в области культурного наследия.»

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Freire.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/6_Nuno-Freire.pdf

  • Осман Дин (Osman Din — MIT, США) «На пути к гибкой системной архитектуре для платформ автоматизированного формирования баз знаний» (Towards a Flexible System Architecture for Automated Knowledge Base Construction Frameworks).

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Din.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/7_Osman-Din.pdf

  • Лайнайз Уильямс (Lyneise Williams, университет Северной Каролины в Чепел-хилл, США) «Что вычислительная архивная наука могла бы позаимствовать у исследований по истории искусств и материальной культуры» (What Computational Archival Science Can Learn from Art History and Material Culture Studies).

    «В работе обсуждается важность учёта эстетических аспектов, как это практикуется в истории искусства, в плане используемых архивами и библиотеками способов представления/воспроизведения материалов. Технологии воспроизведения, такие как микрофильмирование и оцифровка, формируют то, как мы видим и запоминаем историю.

    «На примере исследования того, как пресса показывала панамского боксера, чемпиона мира в полусреднем весе (1929-1936; 1938-1941) Альфонсо Брауна, демонстрируется, как отсутствие внимания к эстетическим аспектам привело к стиранию и искажению исторических сведений об и без того маргинализированных сообществах небелого населения и других недостаточно представленных группах.

    В исследованиях в области материальной культуры технологии представления/воспроизведения рассматриваются как средства представления информации, заслуживающие, как таковые, глубокого и тщательного анализа. Такой подход полезны для вычислительной архивной науки, поскольку мы движемся к полностью цифровым архивам. Эстетические компоненты представления в архивных материалах имеют ключевое значение для представления маргинализированных сообществ, как исторических, так и современных, обеспечивая полную доступность данных всех видов.»

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Williams.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/8_Lyneise-Williams.pdf

  • Грег Янсен (Greg Jansen, университет Мэриленда, США) «Цифровое наследие на бумаге: Чтение перфокарт с помощью компьютерного зрения» (Digital Legacies on Paper: Reading Punchcards with Computer Vision).

    «В работе описана разработка рабочего процесса на основе компьютерного зрения для нормализации графических образов устаревшего формата данных на перфокартах (кодировка IBM 029-80) и последующего чтения закодированных данных.

    Показана роль недавно разработанного инструмента чтения данных с перфокарт Punchcard Extractor Tool в API-сервисе Brown Dog. Также упомянут опыт использования тех же технологий компьютерного зрения в решении Jupyter notebook (инструмент для интерактивной разработки и представления проектов в области наук о данных – Н.Х.).»

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Jansen.pdf , и презентацию: http://cases.umd.edu/github/cases-umd/Reading-Punchcards/blob/master/index.ipynb

  • Шадрак Катуу (Shadrack Katuu, университет Южной Африки, ЮАР) «Корпоративная архитектура – Польза для специалистов по управлению документами» (Enterprise Architecture – A Value Proposition for Records Professionals).

    «Современные учреждения используют сотни деловых систем и приложений для поддержки своей деятельности. В любой организации в число ключевых игроков или участников входят специалисты по управлению документами, в чьи обязанности входит управление документами / архивными документами и потенциально имеющими статус документов материалами, создаваемыми этими системами и приложениями.

    Специалисты по управлению документами должны иметь представление о широком спектре программных приложений и технологической инфраструктуре, а также о том, как они взаимосвязаны друг с другом в рамках поддержки функций и деятельности учреждения.

    К сожалению, часто имеет место несогласованность между различными действующими лицами учреждения, в том числе специалистами деловых подразделений, ИТ и специалистами по управлению документами.

    Сторонники корпоративной архитектуры (Enterprise Architecture, EA) рассматривают её как перспективную концепцию, позволяющую решить эту фундаментальную проблему. Данная работа основана на исследовании, в рамках которого изучалась полезность концепций корпоративной архитектуры для специалистов по управлению документами.»

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Katuu.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/10_Shadrack-Katuu.pdf

  • Грег Янсен (Greg Jansen) и Ричард Марчиано (Richard Marciano), университет Мэриленда, США «Использование разделов данных и серверов без фиксации данных о поступающих запросах для масштабирования хранилищ в системе Fedora» (Using Data Partitions and Stateless Servers to Scale Up Fedora Repositories).

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Jansen-Marciano.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/11_Greg-Jansen.pdf

  • Эрик Кальтман (Eric Kaltman, университет штата Калифорния, США) «Предварительный анализ крупномасштабного архива разработки компьютерных игр: Пример проектов Центра технологий развлечения при институте Карнеги-Меллона» (Preliminary Analysis of a Large-Scale Digital Entertainment Development Archive: A Case Study of the Entertainment Technology Center’s Projects).

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/Kaltman.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/12_Eric-Kaltman.pdf

  • Эмили Гудмен (Emily Goodmann, университет Кларк), Марк Матиензо (Mark A. Matienzo, Стенфордский университет), Шон ван Кур (Shawn VanCour, UCLA) и Ульям ван ден Дриес (William Vanden Dries, университет Индианы) «Создание национальной базы радиопередач: Использование технологий больших данных для документирования звукового культурного наследия» (Building the National Radio Recordings Database: A Big Data Approach to Documenting Audio Heritage).

    «В данной работе рассматриваются стратегии, используемые Целевой группой по обеспечению сохранности радиопередач Национального совета по сохранению аудиозаписей (National Recording Preservation Board) Библиотеки Конгресса США,  для создания общедоступной и снабжённой средствами поиска базы данных, документирующей существующие радиоматериалы, хранящихся в учреждениях памяти по всей стране.

    Проект, объединивший на сегодняшний день метаданные о 2500 уникальных коллекциях, столкнулся с рядом логистических проблем, которые носят не только технический, но и институциональный и социальный характер. Тем самым ставятся ключевые по важности вопросы, касающиеся организационной структуры, политического представительства и этики доступа к данным.

    Поскольку проект продолжает расширяться и развиваться, уроки его раннего этапа развития служат ценным напоминанием о человеческом суждении, скрытых трудозатратах и межличностных отношениях, необходимых для успешной работы с большими данными.»

    Также см. текст доклада: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/11/VanCour.pdf , и презентацию: http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/13_Building-the-National-Radio-Recordings-Database.pdf

  • Марк Хеджес (Mark Hedges, Королевкий колледж Лондона, Великобритания) «Международная сеть вычислительной архивной науки» (International CAS Network), см. http://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2019/12/14_OpenMic_Mark-Hedges.pdf
Дополнительная информация: О предыдущем, 3-м семинаре см. мои посты http://rusrim.blogspot.com/2019/01/1.html и http://rusrim.blogspot.com/2019/02/3-ieee-big-data-2018.html .

Источник: блог «Центра инноваций в курировании электронных материалов»
https://dcicblog.umd.edu/cas/ieee-big-data-2019-4th-cas-workshop/

Комментариев нет:

Отправить комментарий