Заметка Элис Липович (Alice Lipowicz – на фото) была опубликована на сайте издания Federal Computer Week 26 октября 2011 года под заголовком «NARA electronic archive has fundamental flaw in search, IG says».
По словам генерального инспектора (руководителя службы внутреннего аудита – Н.Х.) Национальных Архивов США, людей, которые попытаются вести поиск по текстам документов в созданном Национальными Архивами (NARA) «Архиве электронных документов» (Electronic Records Archive, ERA) стоимостью в 430 млн. долларов, ждёт разочарование.
В развернутой к настоящему времени системе, пользователи могут вести поиск только по метаданным, в число которых обычно входят сведения о документах, такие, как название оригинальной публикации, дата публикации, выпустившее публикацию агентство и небольшое число ключевых слов. Пользователи, надеющиеся найти документ по слову или фразе, не являющимся частью метаданных, не смогут этого сделать.
Генеральный инспектор Национальных Архивов Пол Бречфельд (Paul Brachfeld) в интервью, данном им 26 октября 2011 года, отметил, что использование системы ERA широкой публикой будет, вероятно, затруднено из-за отсутствия функциональных возможностей для полнотекстового поиска, аналогичных тем, что предоставляют Google.com и другие коммерческие поисковые системы.
Отсутствие полнотекстового поиска «является на данный момент одной из серьёзных проблем системы ERA», сказал Бречфельд. «Метаданные сам по себе не раскрывают всего того, что содержится в документах».
Недавно Бречфельд выложил в сети копии двух писем, написанных им в январе и марте 2011 года Архивисту США Дэвиду Ферьеро (David Ferriero), по поводу неадекватности имеющихся в ERA инструментов поиска.
Национальные Архивы признали некоторые ограничения функциональных возможностей ERA. В сентябре был завершен 430-миллионный контракт на создание и развитие системы с фирмой Локхид Мартин (Lockheed Martin), без продления его на дополнительный год. Взамен NARA наняла фирму IBM для обслуживания и эксплуатации ERA по ежегодно возобновляемому контракту, общая сумма которого за 10 лет может достичь 243 млн. долларов, если будут использованы все возможные опции.
В соответствии с новым договором, Национальные Архивы будут приветствовать попытку IBM по расширению функциональных возможностей системы путем добавления полнотекстового поиска, однако пока не ясно, реализуемы ли такие возможности в рамках нынешней архитектуры системы, и не окажутся ли чрезмерными соответствующие расходы. Кроме того, добавил Бречфельд, в данный момент добавление возможности полнотекстового поиска может помешать обеспечению защиты персональных данных.
«Контракт предусматривает попытку решить проблему полнотекстового поиска», - сообщил Бречфельд. «Я не уверен в том, что именно они смогут сделать». Отсутствие полнотекстового поиска «является серьёзным недостатком, и я не уверен, что это может быть исправлено», добавил он.
По мнению Бречфельда, страдающая недостатками система была плохо спроектирована сменявшими друг друга руководителями, многие из которых покинули государственную службу. «Проблемы у программы были с начала её создания при тогдашнем Архивисте США Джоне Карлине (John Carlin)», сказал он. «За это время на посту руководителя Национальных Архивов сменилось три Архивиста». Бречфельд подчеркнул, что на протяжении всей многолетней программы управление генерального инспектора продолжало задавать вопросы о возможностях поиска.
Управление задавало «руководителям программы ERA, сотрудникам, подрядчикам и высшим должностным лицах Национальных Архивов вопросы принципиальной важности. Ключевым был следующий: «Когда система войдёт в промышленную эксплуатацию, смогут ли граждане эффективно получать доступ и изучать те электронные документы, к которым они имеют право доступа через Интернет?», - писал Бречфельд 4 мая в своем меморандуме. «Мы считаем, что ответ, с некоторыми оговорками, отрицательный».
Бречфельд также предупреждает, что из-за ограниченных возможностей поиска вероятно появление «узких мест» в процессе проверки документов перед их включением в систему ERA [в тот её сегмент, который будет доступен широкой общественности – Н.Х.], по ходу которого требуется выявить и удалить секретные сведения и персональные данные.
Хотя государственные органы не должны передавать в систему ERA секретную информацию, такая проверка, скорее всего, понадобится во избежание утечки секретных сведений, и это может привести к замедлению работы системы, полагает он.
«Если представить себе систему ERA как загруженное шестиполосное шоссе, по которому идёт огромное движение, то эта часть процедуры ввода данных в систему будет равноценна закрытию на определенном отрезке пяти полос. Хотя остальная часть шоссе по-прежнему способна пропустить весь поток, возникшее в одном месте «горлышко» сделает использование дороги практически нецелесообразным», написал Бречфельд. (Генеральный инспектор намекает на то, что при вводе электронных документов в систему их, возможно, придётся «вручную» полистно просматривать – Н.Х.)
Элис Липович (Alice Lipowicz)
Источник: Federal Computer Week
http://fcw.com/articles/2011/10/26/nara-electronic-archive-has-fundamental-flaw-in-search--it-says.aspx
По словам генерального инспектора (руководителя службы внутреннего аудита – Н.Х.) Национальных Архивов США, людей, которые попытаются вести поиск по текстам документов в созданном Национальными Архивами (NARA) «Архиве электронных документов» (Electronic Records Archive, ERA) стоимостью в 430 млн. долларов, ждёт разочарование.
В развернутой к настоящему времени системе, пользователи могут вести поиск только по метаданным, в число которых обычно входят сведения о документах, такие, как название оригинальной публикации, дата публикации, выпустившее публикацию агентство и небольшое число ключевых слов. Пользователи, надеющиеся найти документ по слову или фразе, не являющимся частью метаданных, не смогут этого сделать.
Пол Бречфельд
Генеральный инспектор Национальных Архивов Пол Бречфельд (Paul Brachfeld) в интервью, данном им 26 октября 2011 года, отметил, что использование системы ERA широкой публикой будет, вероятно, затруднено из-за отсутствия функциональных возможностей для полнотекстового поиска, аналогичных тем, что предоставляют Google.com и другие коммерческие поисковые системы.
Отсутствие полнотекстового поиска «является на данный момент одной из серьёзных проблем системы ERA», сказал Бречфельд. «Метаданные сам по себе не раскрывают всего того, что содержится в документах».
Недавно Бречфельд выложил в сети копии двух писем, написанных им в январе и марте 2011 года Архивисту США Дэвиду Ферьеро (David Ferriero), по поводу неадекватности имеющихся в ERA инструментов поиска.
Национальные Архивы признали некоторые ограничения функциональных возможностей ERA. В сентябре был завершен 430-миллионный контракт на создание и развитие системы с фирмой Локхид Мартин (Lockheed Martin), без продления его на дополнительный год. Взамен NARA наняла фирму IBM для обслуживания и эксплуатации ERA по ежегодно возобновляемому контракту, общая сумма которого за 10 лет может достичь 243 млн. долларов, если будут использованы все возможные опции.
В соответствии с новым договором, Национальные Архивы будут приветствовать попытку IBM по расширению функциональных возможностей системы путем добавления полнотекстового поиска, однако пока не ясно, реализуемы ли такие возможности в рамках нынешней архитектуры системы, и не окажутся ли чрезмерными соответствующие расходы. Кроме того, добавил Бречфельд, в данный момент добавление возможности полнотекстового поиска может помешать обеспечению защиты персональных данных.
«Контракт предусматривает попытку решить проблему полнотекстового поиска», - сообщил Бречфельд. «Я не уверен в том, что именно они смогут сделать». Отсутствие полнотекстового поиска «является серьёзным недостатком, и я не уверен, что это может быть исправлено», добавил он.
По мнению Бречфельда, страдающая недостатками система была плохо спроектирована сменявшими друг друга руководителями, многие из которых покинули государственную службу. «Проблемы у программы были с начала её создания при тогдашнем Архивисте США Джоне Карлине (John Carlin)», сказал он. «За это время на посту руководителя Национальных Архивов сменилось три Архивиста». Бречфельд подчеркнул, что на протяжении всей многолетней программы управление генерального инспектора продолжало задавать вопросы о возможностях поиска.
Управление задавало «руководителям программы ERA, сотрудникам, подрядчикам и высшим должностным лицах Национальных Архивов вопросы принципиальной важности. Ключевым был следующий: «Когда система войдёт в промышленную эксплуатацию, смогут ли граждане эффективно получать доступ и изучать те электронные документы, к которым они имеют право доступа через Интернет?», - писал Бречфельд 4 мая в своем меморандуме. «Мы считаем, что ответ, с некоторыми оговорками, отрицательный».
Бречфельд также предупреждает, что из-за ограниченных возможностей поиска вероятно появление «узких мест» в процессе проверки документов перед их включением в систему ERA [в тот её сегмент, который будет доступен широкой общественности – Н.Х.], по ходу которого требуется выявить и удалить секретные сведения и персональные данные.
Хотя государственные органы не должны передавать в систему ERA секретную информацию, такая проверка, скорее всего, понадобится во избежание утечки секретных сведений, и это может привести к замедлению работы системы, полагает он.
«Если представить себе систему ERA как загруженное шестиполосное шоссе, по которому идёт огромное движение, то эта часть процедуры ввода данных в систему будет равноценна закрытию на определенном отрезке пяти полос. Хотя остальная часть шоссе по-прежнему способна пропустить весь поток, возникшее в одном месте «горлышко» сделает использование дороги практически нецелесообразным», написал Бречфельд. (Генеральный инспектор намекает на то, что при вводе электронных документов в систему их, возможно, придётся «вручную» полистно просматривать – Н.Х.)
Элис Липович (Alice Lipowicz)
Источник: Federal Computer Week
http://fcw.com/articles/2011/10/26/nara-electronic-archive-has-fundamental-flaw-in-search--it-says.aspx
Комментариев нет:
Отправить комментарий