среда, 29 июля 2015 г.

Проект создания Твиттер-архива Библиотеки Конгресса США – крупная #неудача


Статья Ненси Сколы (Nancy Scola) была опубликована 11 июля 2015 года на сайте журнала Politico.

Прошло более пяти лет, а проект Твиттер-архива Библиотеки всё ещё находится в подвешенном состоянии, и конца этому не видно.


Весной 2010 года Библиотека Конгресса объявила о своём большом шаге по сохранению всё более становящегося электронно-цифровым культурно-исторического наследия нации - путем приобретения у компании Twitter полного архива щебетать твит-сообщений, которые предполагалось в полном объёме сделать доступными для исследователей.

«Как это твиттерно!» (How Tweet It Is! – напоминает английское выражение «how sweet it is», означающее «как это мило» - Н.Х.), - заявила Библиотека в восторженной заметке, вызвавшей фанфары со стороны ИТ-сайтов, средств массовой информации, блогов библиотекарей и, конечно же, компании Twitter. Для библиотеки с двухвековой историей, это событие стало свидетельством того, что даже учреждение, ведущее своё происхождение от Джона Адамса (John Adams) и Томаса Джефферсона (Thomas Jefferson), может выйти на новый уровень в плане взаимодействия с социальными сетями.

Но вот прошло уже более пяти лет, а проект по-прежнему находится в подвешенном состоянии. Библиотека всё ещё пытается сообразить, как управлять архивом, объём которого составляет примерно полтриллиона твитов. И исследователи до сих пор ждут своего часа. «На данный момент не установлена дата его открытия для исследователей», - сообщила по электронной почте пресс-секретарь Библиотеки Гейл Остерберг (Gayle Osterberg).

Судьба архива является еще одним примером того, как непросто защитить и сохранить исторические документы эпохи, в которую люди общаются с помощью легко удаляемых сообщений электронной почты; через веб-сайты, которые могут быть ликвидированы в течение секунд; используя мимолётные твит-сообщения, сообщения в видео-социальной сети Vine ( https://vine.co/ ) и фото-сети Snapchat (  https://www.snapchat.com/ ). Однако критики также рассматривают эту ситуацию как поучительную историю, относящуюся к 28-летнему периоду руководства Библиотекой уходящим сейчас на пенсию Библиотекарем Конгресса США Джеймсом Биллингтоном (James Billington).

В период пребывания Биллингтона на этом посту, утверждают критики, для Библиотеки стали характерны грандиозные технологические амбиции, которые, однако, не были подкреплены планированием, финансированием и проработкой деталей, необходимыми для того, чтобы превратить эти амбиции из повода для новостной шумихи в осязаемые достижения. Биллингтона также неоднократно критиковали за то, как он руководил Бюро по авторским правам (The U.S. Copyright Office), которое оказалось втянутым в многочисленные споры по вопросам, касающимся программного обеспечения, мобильных телефонов и потоковой онлайн-передачи музыки.

«У Биллингтона было много замечательных достижений, но понимание технологий к их числу не относилось», - говорит член Палаты представителей Конгресса США от Силиконовой долины демократ Зои Лофгрен (Zoe Lofgren). Его выход на пенсию, намеченный на январь 2016 года, инициировал дебаты по поводу того, каким образом учреждение могло бы утвердиться в качестве библиотеки современной эпохи, начиная от более полной оцифровки своей книжной коллекции и до обеспечения больших возможностей поиска по документам Бюро по авторским правам.

По словам пресс-секретаря Библиотеки, Биллингтон отказался комментировать все эти высказывания. Но в ответ на опубликованный в марте этого года очень критический отчет Счетной палаты США (Government Accountability Office) о технических недостатках в работе библиотеки, он сказал, что принимает меры для того, чтобы «полностью реализовать возможности, предоставляемые электронной эпохой», включая план нанять к сентябрю директора по информационным технологиям (постоянного директора по ИТ у библиотеки не было с 2012 года).

Остерберг подчеркнула, что библиотека по-прежнему продвигается на пути создания архива твитов, официально известного как проект «Доступ исследователей к материалам Твиттера» (Twitter Research Access). По её словам, «Библиотека занималась индексированием материалов коллекции и разработкой политики их использования», и одновременно ей приходилось балансировать «масштабы и динамичный характер платформы Твиттер» и «реальные возможности государственного учреждения в плане ресурсов».

Библиотека также сформировала так называемую «Группу по вопросам доступа к Твиттер-архиву» (Twitter Access Group), перед которой была поставлена задача по возможности более раннего открытия доступа к архиву для исследователей. Остерберг сказала, что группа включает «экспертов по ИТ, исследовательской работе, праву и библиотечному делу из числа сотрудников Библиотеки».

Проект ставит перед Библиотекой масштабные проблемы. С одной стороны, Библиотека должна «пропылесосить» и принять на хранение статический архив твитов, начиная с момента запуска социальной сети в 2006 году и до момента подписания соглашения с компанией Twitter – это около 20 миллиардов сообщений. Он также должна регулярно принимать обновления, объём которых составляет примерно 400 миллионов твитов в день. И затем Библиотека должна сообразить, как индексировать твиты и как сделать их доступными для поиска «добросовестными исследователями», получившими право доступа к ним в читальных залах библиотеки.

Федеральные инспекторы жаловались на отсутствие информации о том, как продвигается проект. В отчете Счетной палаты о технологических провалах в работе Библиотеки отмечено, что Библиотека не смогла предоставить данные о стоимости архива и план-график его создания.

Библиотека отстает даже от объявленного ею собственного неформального плана работ по проекту: В марте 2013 года заместитель руководителя Библиотеки Роберт Дизард-младший (Robert Dizard Jr.) сообщил занимающимся вопросами ассигнований членам Палаты представителей по поводу твиттер-архива о том, что «мы надеемся сделать его доступным для первоначальных исследований в июне». Этот срок истек более года тому назад.

Компания Twitter также отказались комментировать ход проекта, несмотря на энтузиазм, выраженный её соучредителем Бизом Стоуном (Biz Stone) в 2010 году в посте на блоге, где он писал: «Воодушевляет, что твиты становятся частью истории». Соглашение о передаче архива твитов всегда подавалось как подарок компании государственным архивистам, и Twitter предоставил Библиотеке самой разбираться с тем, как этим архивом управлять.

Кое-кто обвиняет Библиотеку в напрасной трате времени и денег на сохранение имеющих мимолётную ценность материалов социальных сетей, но само учреждение утверждает, что огромная коллекция твитов может оказаться для будущих поколений бесценным, созданным в реального времени документом, показывающим, как общались люди в 21-м веке.

 «Архивирование и обеспечение долговременной сохранности таких социальных сетей, как Твиттер, позволит будущим исследователям увидеть более полную картину, отражающую современные культурные нормы, диалоги, тенденции и события, с тем, чтобы использовать всё это в научных исследованиях, в процессе законотворчества, при подготовке новых авторских работ, в образовании и для других целей», - писала Остерберг в изданной в 2013 году короткой «белой книге», ставшей последней существенной новостью о состоянии коллекции твитов.

Условия соглашения - подписанного Биллингтоном и тогдашним руководителем юридической службы компании Twitter Александром Макгилливреем (Alexander Macgillivray), в настоящее время занимающим должность заместителя директора по технологиям федерального правительства США – требуют от исследователей обещания не использовать содержащиеся в твитах данные в коммерческих целях. Это было сделано для того, чтобы не устраивать помех бизнесу компании по продаже частей своего твит-архива фирмам, которые, например, хотят посмотреть, как люди пишут об их продуктах по сравнению с продуктами конкурентов.

Но приостановлены и даже чисто академические исследования.

В 2014 году немецкий специалист в области информационных наук Катрин Веллер (Katrin Weller) была названа центром имени Джона Клюге (John W. Kluge Center) – подразделением Библиотеки, курирующим вопросы использования материалов учреждения для научных исследований -  в числе первых двух аккредитованных «электронных исследователей». Веллер должна была сосредоточить усилия на анализе и структуризации коллекции с целью извлечения сведений об исторических событиях, от выборов до стихийных бедствий. Однако накануне отъезда в Вашингтон она узнала, что ей придётся сместить фокус своих исследований.

Теперь, пишет в электронном письме Веллер, пребывание которой в Библиотеке Конгресса заканчивается, «Я изучаю вопрос о том, станут ли в будущем материалы социальных сетей важным источником для историков, и что следует сделать сейчас для того, чтобы сохранить эти данные».

Ненси Скола (Nancy Scola)

Источник: сайт журнала Politico
http://www.politico.com/story/2015/07/library-of-congress-twitter-archive-119698.html

Комментариев нет:

Отправить комментарий