понедельник, 21 ноября 2016 г.

Хранителю современной культуры «Интернет-архиву» исполнилось 20 лет


Статья сотрудника газеты «Сан-Франциско кроникл» (San Francisco Chronicle) Бенни Эванджелисты (Benny Evangelista – на фото) была опубликована на сайте издания 28 октября 2016 года.

Когда «Интернет-архив» (Internet Archive, https://archive.org/ ) был создан 20 лет тому назад, мало кто предполагал, что небольшая галактика из примерно 500 тысяч веб-сайтов превратится в центр человеческого общения и культуры.

Сегодня базирующаяся в Сан-Франциско некоммерческая организация – которая отпраздновала знаменательную дату вечером в среду 26 октября - курирует колоссальный электронный архив, содержащий более 370 миллионов веб-сайтов и 273 миллиарда веб-страниц, многие из которых были захвачены перед тем, как исчезнуть навсегда.

Джейсон Скотт (Jason Scott) открывает праздничное мероприятие в Сан-Франциско по поводу 20-й годовщины «Интернет-архива». Фото: Carlos Avila Gonzalez / Chronicle

Мой комментарий: Джейсон Скотт Садовски (Jason Scott Sadofsky), более известный как Джейсон Скотт, - американский архивист, историк технологий и кинорежиссёр, работающий сейчас в «Интернет-архиве».

Это больше, чем архив интернет-сайтов. Организация, основанная компьютерным ученым и предпринимателем Брюстером Калом (Brewster Kahle, о нем см. http://www.sfgate.com/news/article/Brewster-Kahle-s-Internet-Archive-3946898.php ), теперь располагает виртуальным хранилищем, в котором материалы варьируются от оцифрованных книг и исторический фильмов до забавных картинок-мемов и аудиозаписей концертов американской рок-группы Grateful Dead («Благодарные покойники»).

Будущие ученые смогут вести поиск по архиву новостных ток-шоу и политической рекламы, с тем, чтобы лучше понять, например, перипетии президентских выборов этого года.

«Когда Брюстер всё это начинал, многие люди думали, что он сошел с ума или оторвался от реальности», - говорит Рик Прелингер (Rick Prelinger), киноархивист и доцент кафедры кино- и электронных носителей Университета Калифорнии в Санта-Крус.

«Во-первых, кто в 1996 году, 1997 или 1998-м считал, что в Интернете есть что-то заслуживающее сохранения?», говорит он. «Вы просто смотрели на экраны. Не думаю, что кто-то предвидел столь стремительный переход нашей культуры в онлайн-среду. Брюстер же это видел. У него хороший инстинкт на такого рода вещи».

Ларри Дитрих (Larry Dieterich, слева) осматривает настольное устройство для оцифровки книг, которое ему во время праздничных мероприятий демонстрирует  Тим Бигелоу (Tim Bigelow). Фото: Carlos Avila Gonzalez / Chronicle

Около 600 человек собралось на вечеринку, которая проходила в неоклассическом стиле здании «Интернет-архива» с греческими колоннами (раньше это была церковь сциентистов) на Фанстон-авеню в районе Ричмонд. В числе гостей были один из первых техно-предпринимателей Марк Кантер (Marc Canter), сооснователь компании, сегодня известной как Macromedia; один из первых сотрудников Apple Дэн Коттк (Dan Kottke); и журналист из Вашингтона Кэти Кили (Kathy Kiely).

Среди приглашенных были прошлые и настоящие сотрудники «Интернет-архива», а также те, кто добровольно жертвовал свое время или деньги, чтобы помочь организации в течение этих лет.

Целью Кала было создание электронно-цифровой версии Великой Александрийской библиотеки, утраченного хранилища знаний древнего мира. Он верил, что сохранение особенно эфемерной Всемирной паутины, как тогда назывался Интернет, будет иметь ключевое значение для будущих историков, с тем, чтобы иметь возможность понять особенности этой эпохи.

«Веб - это фантасмагория обмена информацией между людьми, доверяющими другим сведения о том, кто они есть, и делающими это публично», - говорил Кал. «Мы хотели обеспечить постоянную сохранность всего этого».

Джейсон Скотт (справа) запускает для Маус Рив (Mouse Reeve, слева) винтажную игру Pac-Man во время 20-летнего юбилея «Интернет-архива». Фото: Carlos Avila Gonzalez / Chronicle

Примерно в то же время Кал стал одним из основателей занимавшейся веб-аналитикой и информатикой компании Alexa Internet, название которой также происходит от имени этой древней библиотеки. Amazon купил Alexa в 1999 году, стоимость сделки составила около 250 миллионов долларов.

У Кала «было разумное видение будущего и пути к нему», - подчеркнула бывший глава службы проектирования фирмы Alexa Ронна Таненбаум (Ronna Tanenbaum), «Он стремился защитить и сохранить знания, и обеспечить к ним универсальный доступ».

«Интернет-архив» выжил благодаря пожертвованиям общественности и взаимодействию с примерно 1000 библиотек по всему миру, которые платят компании за помощь с оцифровкой книг и других материалов. Но доступ к самому сайту остается свободным.

«Мы - организация, которая дает вещи бесплатно», - сказал Кал. «Кто ещё так делает? Интересно то, что «бесплатность» хорошо работает в Интернете-архиве».

Архив лучше всего известен своей «Машиной времени» (Wayback Machine, https://archive.org/web/ ), которая использует компьютерные алгоритмы для осмотра Интернета и постоянно сохраняет снимки сайтов. Пользователи используют этот инструмент для того, например, чтобы сравнить, как во времени менялись такие веб-сайты, как SFGate.com ( https://web-beta.archive.org/web/19961027013135/sfgate.com - совместный сайт изданий Сан-Франциско Экзаминер и Сан-Франциско Кроникл – Н.Х.), Это также хранилище наследия интернет-компаний, которые давным-давно всплыли «брюхом кверху», таких, как Pets.com (  https://web-beta.archive.org/web/20000303212454/http://www.pets.com:80/cgi-bin/puppy/home/home.jsp?BV_UseBVCookie=YES&animal=Home сайт о домашних животных – Н.Х.).

Поток посетителей в 3 - 4 миллиона человек в день показывают, что «людям нужны старые материалы, они хотят помнить, - подчеркнул Кал.

На прошлой неделе архив запустил инструмент для более легкого поиска в «Машине времени», которая заодно помог восстановить 1 миллион «битых» ссылок на статьи в Википедии.

Ещё один раздел архива содержит около 3 миллионов часов телевизионных новостей. Сюда входит оснащенная средствами поиска база данных политической рекламы, захваченной в ходе нынешней президентской предвыборной гонки – спустя столетие политологи смогут её использовать для того, чтобы выяснить, что мы думали во время этих «сумасшедших, наиболее разрушительных после Гражданской войны в США выборов», - сказал директор телевизионного архива Роджер Макдональд (Roger Macdonald).

Или же, возможно, будущие ученые отыщут в архиве что-то ещё, что более показательно для нашей эпохи. «Сейчас невозможно предсказать, в чём именно будет заключаться главная ценность архива в будущем», - отметил Макдональд.

По словам Кала, «Интернет-архив» оцифровал около 2,5 миллионов книг, хотя это все еще далеко от поставленной им перед собой цели оцифровать к 2020 году 10 миллионов книг, а также от объёмов фондов Библиотеки Конгресса. Но уже сегодня пользователи архива могут ввести поиск по оцифрованным им книгам – что до недавнего времени было невозможно.

«Сегодня весь наш мир – это электронные и веб-материалы», -  подчеркнул историк из Сан-Франциско Вуди ла Баунти (Woody LaBounty). «И они берутся за эту непонятную, масштабную работу, пытаясь захватить лишь малую часть этого мира и сохранить её для потомков. Это чрезвычайно сложная и трудоемкая задача».

Бенни Эванджелиста (Benny Evangelista)

Источник: сайт газеты San Francisco Chronicle
http://www.sfchronicle.com/business/article/Internet-Archive-repository-of-modern-culture-10421008.php#photo-11648446

Комментариев нет:

Отправить комментарий