четверг, 19 мая 2016 г.

Захват документов из социальных сетей


Заметка Меган Кэри (Megan Carey) была опубликована 10 мая 2016 года на блоге «The Texas Record» («Документы Техаса», https://www.tsl.texas.gov/slrm/blog/ ), который ведёт Комиссия по вопросам библиотечного и архивного дела штата Техас (Texas State Library and Archives Commission, TSLAC).


Когда Вы определились с тем, является ли контент социальных сетей документами, работа на этом ещё не закончена, поскольку процесс захвата документов из социальных сетей представляет собой чрезвычайно важный элемент успешного управления документами. Захват позволяет обеспечить доступность этих документов для Вашего органа государственной власти, возможность анализировать и использовать их, и, в конечном итоге, провести их уничтожение по истечении срока хранения. Данная задача может оказаться сложной, поскольку не все методы захвата являются равноценными; некоторые из них могут не обеспечивать полного захвата всего документного материала, в то время как другие могут всё делать на самом современном уровне, но требовать больших затрат. Эмма Мартин (Emma Martin) в своей статье на блоге под названием «Социальные сети: Отдача и проблемы» (Social Media: Benefits and Challenges, https://www.tsl.texas.gov/slrm/blog/2016/05/social-media-benefits-and-challenges/ ), опубликованной 5 мая 2016 года, затронула проблему обеспечения полноты захвата документов из социальных сетей.
Предупреждение!

Многие органы государственной власти штата Техас разделяют ошибочное мнение о том, что система сбора и сохранения веб-контента TRAIL («След», от Texas Records and Information Locator – система штата Техас для поиска документов и информации – Н.Х.)  гарантирует захват их онлайн-контента. Это не так; система TRAIL обеспечивает доступ к содержащейся в электронных публикациях информации государственных органов штата Техас, однако из-за существующих ограничений она в настоящее время не захватывает контент, размещенный на поддерживаемых третьими сторонами социальных платформах.

Подробнее о системе TRAIL Вы можете узнать на сайте Комиссии по вопросам библиотечного и архивного дела штата ( https://www.tsl.texas.gov/trail/about.html ) либо посмотрев посвящённый системе веб-семинар «Ознакомление с программой депозитарного хранения публикаций штата Техас и системой TRAIL» (Understanding the Texas State Publications Depository Program and TRAIL, https://slrmtraining.tsl.texas.gov/course/view.php?id=38 ).
Захват документов из социальных сетей - дело необходимое, но, в то же время, сложное. Часто с этими документами больше проблем, чем это видно с первого взгляда, включая вопрос захвата метаданных и другой контекстуальной информации (например, материалов по ссылкам и фотографий) и необходимость использования в ряде случаев различных методов захвата в зависимости от характера документов. Несмотря на динамичный характер социальных сетей, органы власти, у которых есть документы в социальных сетях, должны сохранять точные и достоверные копии этой информации (см. «Стандарты и процедуры работы местных органов власти штата с электронными документами» (Local Government Bulletin B: Electronic Records Standards and Procedures), §7.76, https://www.tsl.texas.gov/slrm/recordspubs/lgbullb.html#s76 ).

Больше, чем видит глаз

Метаданные, под которыми обычно понимают данные о данных, обеспечивают контект для документов этого вида, а также подтверждают их аутентичность. Например, метаданные сообщения электронной почты содержат сведения о его отправителе получателях (в том числе bcc-копий), дату отправки, тему сообщения и т.д. О количестве метаданных, создаваемых и хранимых «за кулисами» даже самого маленького документа в социальных сетях, говорит следующий факт: твит-сообщение из 126 символов сопровождает также более 2300 символов метаданных. Способ захвата документов имеет значение, идёт ли речь о метаданных сообщений электронной почты или о метаданных твитов.

Метаданные помогают сохранять функциональные возможности документов, обеспечивают их существование и отображение в том виде, как это первоначально предполагалось. Например, с целью сохранения функциональности содержащий гиперссылку пост в Facebook-е нужно захватывать таким образом, что ссылка оставалась работающей. Твит-сообщение с вложенным изображением не будет полностью захвачено, если вместе с текстом твита не будет захвачено и это изображение.

Методы захвата могут быть разными

Существует ряд различных по сложности и эффективности методов, которые могут быть использованы органами власти для захвата материалов социальных сетей. Как правило, полагаться в вопросах хранения документов на встроенные инструменты социальных сетей – не лучшее решение; органам государственной власти следует сохранять копии документов в своей собственной документной системе.

Использование программных приложений / программного обеспечения

Золотым стандартом управления документами в социальных сетях является способность захватывать такие документы в момент их создания, как можно ближе к захвату в реальном времени, - а затем архивировать эти материалы для последующего использования. Использование этого метода дает возможность захватывать и архивировать твит-сообщения в учетной записи Вашего государственного органа, ответы (@replies), ретвиты и упоминания даже в том случае, если впоследствии они были удалены. Он также позволяет отразить изменения, которым может подвергаться документ в социальной сети в случаях, когда пользователь редактирует исходное сообщение или когда пост «собирает» «лайки» и комментарии – путем неоднократного захвата документа  в течение длительного времени и архивации всех версий.

Хотя Комиссия TSLAC не может рекомендовать какого-либо конкретного программного обеспечения или сервиса, существует много поставщиков, предлагающих услуги захвата в социальных сетях или сканирования интернета и захвата веб-контента, таких, как компания Archive-It. Некоторые компании, такие как  ArchiveSocial, специализируются на оказании услуг государственным органам. Если Ваше учреждение собирается идти по этому пути, быстрый поиск в Google по ключевым словам типа «захват в социальных сетях» или «архивация социальных сетей для государственных органов» выдаст Вам множество потенциальных вариантов для изучения.

Использование услуг платформ социальных сетей

Компании, размещающие в сети социальные инструменты, не обязаны сохранять – временно или постоянно – созданный с использованием этих инструментов контент. Исключением являются ситуации, когда сохранение контента предусматриваются действующим договором или соглашением о качестве оказываемых услуг (SLA). Заключение с провайдером или со стороной, отвечающей за размещение в интернете документов социальных сетей, SLA-соглашения о качестве обслуживания является способом установить правила и принципы, касающихся доступности полноценных документов. К сожалению, большинство популярных платформ социальных сетей, таких, как Twitter и Facebook, не заключают контракты и SLA-соглашения.

Некоторые платформы социальных сетей имеют встроенные функциональные возможности, поддерживающие захват контента. В Твиттере Вы можете запросить архив твитов учетной записи  (см. https://support.twitter.com/articles/20170160 ), а в Facebook  выгрузить Вашу информацию (см. https://www.facebook.com/help/131112897028467/ ).

Ручное сохранение

Если использовать описанные выше методы не представляется возможным или целесообразным, то последним вариантом является ручной захват. Копирование/вставка сообщений в социальных сетях в программу обработки текстов либо изготовление копий экрана контента - не самые эффективные и всеохватывающие тактики захвата документов в социальных сетях, хотя если это все, что Ваше учреждение способно сделать, то лучше сделать хоть что-то, чем совсем ничего.

По данным Национальных Архивов США, ряд американских федеральных органов исполнительной власти используют этот вариант, применяя различные методы, в том числе преобразуя снимки экрана в файлы формата PDF/A (это архивная версия формата PDF, специально предназначенная долговременного сохранения электронных документов), копируя и вставляя контент в Word-файлы, а также управляя мультимедийными документами в соответствующем формате, одновременно захватывая при этом по максимуму контекстную информацию в текстовые файлы.

Недостатком ручного захвата является то, что при копировании / вставке не полностью захватываются метаданные документа. Дастин Хайслер (Dustin Haisler) из e.Republic и Анил Чоула (Anil Chawla) из ArchiveSocial представили по этой теме доклад на конференции «Электронные документы» (e-Records Conference 2015) в ноябре прошлого года,  о котором наш блог рассказал в посте «Конференция Электронные документы-2015: Что каждый специалист по управлению документами должен знать о социальных сетях» (e-Records Conference 2015: What Every Records Manager Must Know About Social Media, см. ) Запись покрыта это содержание в "электронной записи конференции 2015: что каждый менеджер отчеты должны знать о социальных медиа" (  https://www.tsl.texas.gov/slrm/blog/2015/12/e-records-conference-2015-what-every-records-manager-must-know-about-social-media/ ).

Следите за развитием социальных сетей

Технологии социальных сетей и способы их применения постоянно развиваются, из-за чего любые конкретные рекомендации быстро устаревают. Имея это в виду, обращаем Ваше внимание на ресурсы, к которым Вы можете обратиться при принятии решения о том, какой метод захвата лучше всего подойдёт Вашему учреждению. Полезно также постоянно быть в курсе тенденций развития технологий социальных сетей и их использования, чтобы всё время наилучшим образом управлять документами в социальных сетях Вашего органа власти.

Какой бы метод захвата Вы ни выбрали, обязательно задокументируйте и опишите его в политике использования социальных сетей Вашего учреждения. Разработка и практическая реализация такой политики Вашим учреждением или органом является обязательным при пересечении ландшафта социальных сетей. Политика устанавливает принципы и ожидания в отношении использования социальных сетей государственным органом. Этот вопрос мы обсудим более детально в нашей следующей публикации на блоге из серии, посвященной социальным сетям.

Ресурсы
Дайте нам знать (в комментариях к данному посту) о Ваших идеях и опыте работы с социальными сетями и захвата соответствующих материалов!

Меган Кэри (Megan Carey)

Источник: сайт «The Texas Record»
https://www.tsl.texas.gov/slrm/blog/2016/05/capturing-social-media-records/

Комментариев нет:

Отправить комментарий