четверг, 25 ноября 2010 г.

Представление электронной информации из баз данных в ходе судебных споров и расследований: Небесспорно, но неизбежно – часть I

Статья Джейсона Краузе (Jason Krause)  «Database Discovery Is Dubious, but Unavoidable» была опубликована на сайте «Новости правовых технологий» (Law Technology News) 3 ноября 2010 года.

Структурирование в рамках баз данных уже давно применялось в качестве решение для хранения сложных данных, которые могут быть извлекаться и представляться различными способами. Однако в контексте поиска и представления электронной информации в рамках судебных споров и расследований (e-discovery, далее переводится как «представление» - Н.Х.) с этими решением связаны правовые проблемы.

Многим судьям и участникам судебных процессов потребовались годы на то, чтобы привыкнуть к представлению сообщений электронной почты и других электронных документов. Но, по мере того, как всё больше различных форм электронных документов вовлекается в споры по поводу представления документов и информации, юристы снова оказываются на незнакомой территории. «Всё ещё есть такие виды доказательств, которые юристы предпочитают игнорировать, надеясь на то, что они испарятся, - так же, как это было с представлением электронной почты десять лет тому назад», говорит Роб Браннер (Rob Brunner), руководитель направления аналитики финансовых и корпоративных данных фирмы FTI Consulting. «Мне неприятно это говорить, но по сравнению с тем, что будет дальше, электронная почта было легкой задачей».

Браннер в первую очередь имеет в виду структурированные данные, особенно электронные доказательства, содержащиеся в базах данных. Структурированные данные, однако, включают широкий спектр типов контента, в том числе широко распространенные источники контента (такие, как электронная почта), который большинство может расценивать как документы. Всякий раз, когда программная система, - будь то большая корпоративная база данных или почтовый сервер, - извлекает информацию из нескольких различных файлов и объединяет её в единое представление, она функционирует подобно базе данных. Неструктурированные же данные обычно определяются как такие данные, которые не хранятся в базе данных или в семантически размеченном документе.

Структурированные данные подлежат представлению в ходе судебных процессов, однако  юристы сталкиваются с недостатком руководств по выполнению такой работы. «Это проблема, которая будет требовать всё больше внимания, потому что мы купаемся в такого рода информации», - подчёркивает Браннер. «Когда я пытаюсь объяснить, почему процессы представления этой информации так важны, я напоминаю, что все 500 из компаний «Fortune 500» располагают структурированными данными. Во многих случаях этой проблемы избежать не удастся».

В случае структурированных данных, информация хранится в виде отдельных файлов, которые взаимосвязаны таким образом, что информацию можно вытягивать из различных источников, анализировать и комбинировать. К примеру, типичная корпоративная кадровая система содержит информацию, которую можно и просматривать в виде досье на отдельных сотрудников, и получать по ней статистику по всему персоналу.

Подобно подводной части айсберга, массивы структурированных данных нередко являются основной частью корпоративных данных, но редко бывают «на виду». По данным научно-исследовательской фирмы «Институт хранилищ данных» (Data Warehousing Institute), примерно 47 процентов всех корпоративных данных по своей природе являются структурированными, по сравнению с 31 процентом неструктурированных данных (остальные 22 процента описываются как частично структурированные данные).

Долее игнорировать невозможно

«Конференция Седона» (Sedona Conference) - некоммерческий правовой идейный центр, в основном занимающийся вопросами обеспечения долговременной сохранности и представления сохраняемой в электронном виде информации (electronically stored information, ESI – термин американского права – Н.Х.) в ходе гражданских судебных процессов, объявил, что после 1 декабря он опубликует комментарии по представлению информации из баз данных. Это станет одной из первых попыток разработать рекомендации по представлению структурированных данных. «Комментарии фокусируются на том, что является основой относимости (relevance) базы данных», рассказывает Конрад Джекоби (Conrad Jacoby), основатель консультационной фирмы efficientEDD и редактор готовящегося документа. «Структурированные данные настолько трудно определить, что нам пришлось начать с формулирования самых основ представления такого рода информации».

К сожалению, вопрос представления структурированных данных оказался для редакционной коллегии настолько проблематичным, что той пришлось умерить свои амбиции. Первоначально организаторы проекта надеялись рассмотреть различные формы структурированных данных, и в том числе охватить назревающую проблему данных, доступных через интернет. Однако в конечном итоге в комментариях рассматриваются лишь доказательства, содержащиеся в базах данных, и игнорируются все остальные структурированные источники информации. «Это очень сложный диалог, и, порой, участвующие в нём стороны говорят, не слушая друг друга», говорит Джекоби. «Это вопрос терминологии. Можно располагать прекрасными юристами и «технарями», но их терминология и логика неодинакова. Одни и те же слова могут иметь различное значение, и обсуждение может идти по кругу».

В качестве примера, Джекоби рассказывает о том, что попытка дать определение такого простого слова,  как «поиск» (search) стала причиной головной боли для его группы. Во многих случаях база данных индексирует только первые слова содержимого текстового поля, и это означает, что многие данные не является легкодоступными. «Вам может казаться, что при выполнении запроса к базе данных поиск идёт по всем записям в этой базе», говорит он. «Но оказывается, что часть информации не индексируется или охватывается поиском. Тогда по каким данным Вы ведёте поиск? Возможно ли вообще извлечь из базы данных всю нужную информацию без чрезмерных затрат?».

Структурированные данные часто имеют важное значение для судебного процесса, особенно для установления величины ущерба и решения вопроса об ответственности. К сожалению, эти данные часто эфемерны и постоянно изменяются. Джекоби отмечает, что во многих организациях автоматизированные журналы протоколирования транзакций  постоянно стираются и перезаписываются системами, установленными в точках продаж. Кассовый аппарат обычно сохраняет контрольную информацию до момента снятия кассы, после чего соответствующая запись загружается в региональную, а затем и в общенациональную базу данных, где она часто перезаписывается после того, как транзакция по кредитной карте закончена. «Даже отыскать запись нелегко», говорит он. «Она может оказаться как в нескольких местах, так и ни в одном из ожидаемых мест».

(Окончание следует, см. http://rusrim.blogspot.com/2010/11/ii.html )

Джейсон Краузе (Jason Krause)

Источник: Law Technology News
http://www.law.com/jsp/lawtechnologynews/PubArticleLTN.jsp?id=1202474326612&Database_Discovery_Is_Dubious_but_Unavoidable

Комментариев нет:

Отправка комментария