Оценить:
 Рейтинг: 0

Исторические информационные системы: теория и практика

Год написания книги
2021
Теги
<< 1 2
На страницу:
2 из 2
Настройки чтения
Размер шрифта
Высота строк
Поля

Однако такой взгляд на соотношение современных терминов, отражающих определенные направления в областях исторического и гуманитарного компьютингов, не является единственным. Не все ученые разделяют мнение о столь резком противопоставлении понятий и соответствующих направлений, разрыве преемственности и утрате сходства. Еще в 1988 г. М. Таллер заметил, что предмет и методы историков настолько разнообразны, что историки часто оказываются ближе связанными с исследователями из других сфер, чем с другими направлениями исторической науки [Thaller, 1988].

Нельзя не признать, что историческая информатика не нашла достаточного и заслуженного признания в среде традиционных историков. На это обращали внимание исследователи уже в 1990-х и 2000-х годах; очевидно, это можно констатировать и на текущем этапе. Так, в 1994 г. В. А. Спек отмечал: «…факт остается фактом: профессия по-прежнему разделена между небольшим меньшинством историков, которые используют компьютеры в качестве инструментов для анализа исторических данных, и подавляющим большинством, которые, хотя и могут использовать компьютер для набора текста, не думают о том, что он может стать методологическим активом» [Speck, 1994[3 - Цит. по: Anderson I. History and computing // Making History [Электронный ресурс]. URL: http://www.history.ac.uk/makinghistory/resources/articles/ history_and_computing.html (дата обращения: 27.08.2018).]]. А так Л. МакКрэнк пишет об ученых-историках в 2002 г.: «Как люди такого характера, интеллекта, образования и позиции влияния могут быть настолько устойчивы к информационным технологиям? Могут ли они не видеть возможности, которые предлагают технические достижения нашего времени?» [McCrank, 2002]. Достаточно подробный обзор противостояния традиционных историков и тех, кто использовал количественные методы и технологии, приведен в статье У. Дж. Томаса «Вычисления и историческое воображение» [Tomas, 2004].

Не вдаваясь в причины указанных изменений и проблем, а также в соотношение терминов «историческая информатика», «цифровая история», «цифровая гуманитаристика» (как было отмечено, существуют разные подходы и достаточное количество литературы по данному вопросу [Бородкин, 2005; Бородкин, 2012; Владимиров, 2006; Гарскова, 2014]), отметим, что формирование и методология исторической информатики как самостоятельного междисциплинарного направления напрямую проецируются на понятийный аппарат и идеологию создания и использования историко-ориентированных информационных систем. Именно в связи с этим становление и развитие исторической информатики и ее подходов представляют ценность для понимания феномена историко-ориентированных информационных систем.

Выделим несколько важных, на наш взгляд, аспектов.

Во-первых, точно так же как неологизм «историческая информатика» не является просто сочетанием истории и информатики (здесь скорее в смысле Information Science, а не Computer Science), давая больше, чем сумму этих частей [McCrank, 2002], историческая (историко-ориентированная) информационная система – это больше, чем просто сумма истории (исторических данных, знаний) и информационных систем.

Во-вторых, историческое в исторической информатике понимается в самом широком смысле, оно «не ограничивается историей как дисциплиной, также история является краеугольным камнем других гуманитарных наук» [Boonstra, Breure, Doorn, 2006].

В-третьих, исторические информационные системы, как и историческая информатика, используют практически все виды исторических источников – числовые, текстовые, материальные, устные, аудиовизуальные и др. В некотором смысле историческая информатика даже способствует более активному внедрению в научный оборот нетекстовых источников. С точки зрения хронологии, географии и проблематики исторического исследования историческая информатика также не имеет ограничений. Наконец, «каждая технология и методология кажутся восприимчивыми к принятию историками, адаптированными к историческим исследованиям… Никаких ограничений, кроме самоналоженных, не видно» [McCrank, 2002]. Эта «всеядность» исторической информатики определяет разнообразие историко-ориентированных информационных систем и множество оснований для их классификации (к чему мы вернемся позже в этой главе).

В-четвертых, историческая информатика не просто исходит из понимания истории как науки и как направления, имеющего научную базу и доказательные методы документации и интерпретации (не принимая постмодернистские трактовки истории и «рассказы об истории»), но и усиливает научность истории. Л. МакКрэнк отмечает в связи с этим, что информатику можно рассматривать как «судебную экспертизу истории»; что задача исторической информатики – не просто информирование, а «создание основы для приемлемости, надежности и достоверности информации и ее интерпретации в контексте, как ближайшем и непосредственном, так и в более отдаленном» [McCrank, 2002]. В этом смысле особенно заметны роль и наследие квантитативной истории и математических методов в истории в формировании исторической информатики. Несмотря на то, что методологически, содержательно и технологически историческая информатика выходит за пределы квантитативной истории, тем не менее в требованиях системности, верифицируемости, объективности и доказательности – не уступает ей.

Эти повышенные (по сравнению со средними по истории в целом) ожидания и требования научности исторической информатики определяют принципы и подходы к проектированию, наполнению и дальнейшему использованию исторических информационных систем. Хотя при заполнении базы данных, разметке исторического источника, нанесении объектов на географическую карту или реконструкции памятника исследователь также вынужден принимать субъективные решения, есть значимое отличие в их характере по сравнению со многими другими направлениями исторической науки: эти операции с историческими сущностями более четко фиксируются и, как правило, предполагают простые инструменты корректировки при уточнении данных либо даже позволяют заложить в модель информацию о достоверности тех или иных источников. Одновременно акцент исторической информатики на научности истории делает особо значимыми информационные системы для поддержки научных исторических исследований. Д. А. Гутнов и В. А. Перевертень выделили в отдельный класс компьютерные системы, созданные для поддержки информационно-познавательной деятельности историков. Для обозначения этого понятия авторы предложили использовать термин «историко-исследовательские информационные системы» [Гутнов, Перевертень, 1994]. К этому типу систем и их использованию в исследованиях мы вернемся в главе 4.

Таким образом, исторические информационные системы определенно открывают новые перспективы организации и массовой обработки исторического материала, большей формализации исторического знания и применяемых в нем доказательств.

1.3. Историко-ориентированные базы данных

Выделение класса и термина «историко-ориентированные информационные системы» связано с практикой создания исторических баз данных, которые долгое время были и все еще часто остаются технологической основой информационных систем. Развитие понятийного аппарата, подходы к созданию и классификация, а также другие теоретические и прикладные вопросы тесно связаны и во многом схожи для исторических баз данных и информационных систем. Можно отметить и такой признак, как типичное объединение двух видов ресурсов в одну секцию на профильных конференциях по исторической информатике и цифровой гуманитаристике.

Феномен внимания историков и других гуманитариев к технологии баз данных интересен сам по себе. «База данных становится центром творческого процесса в компьютерную эпоху», – пишет Л. Манович в 1999 г. Анализируя базы данных как культурную форму, он приходит к выводу, что база данных и нарратив являются «естественными врагами»: база данных представляет предметную область как неотсортированный список; нарратив же, напротив, создает линейное, а значит, последовательное и, возможно, причинно-следственное повествование, которое кажется неупорядоченными событиями. «Конкурируя на одной и той же территории человеческой культуры, каждый из них претендует на исключительное право сделать смысл из мира» [Manovich, 1999]. В некотором роде базы данных являются новой, текущей и будущей формой знаний, заменяя повествование в изучении истории и литературы [Drucker, Kim, Salehian, Bushong, 2013].

Базы данных относятся к эффективным средствам структурирования и организации информации. В зависимости от модели, которая положена в основу базы данных, она может быть иерархической, сетевой или реляционной. Возможность организации данных в базе на основе разных моделей позволяет наиболее адекватно представлять информацию об отображаемых объектах и эффективно работать с ней. Проектирование и создание информационных систем на основе реляционных баз данных будет подробно рассмотрено в главе 2; задача этого раздела – показать влияние исторических баз данных на формирование теории и понятийного аппарата информационных систем, используемых в области истории.

Наиболее значимо и комплексно исторические базы данных рассмотрены в исследованиях М. Таллера. В его работах, изданных в период с 1980-х по 2000-е годы, зафиксированы возникновение исторических баз данных, их эволюция, состояние и значимость на разных этапах информатизации истории.

Технология баз данных была и продолжает оставаться одной из наиболее востребованных в исторической информатике, цифровой истории и цифровых гуманитарных науках. На ее основе создаются электронные каталоги, цифровые архивы и библиотеки, тематические исторические ресурсы, коллекции машиночитаемых источников, публикаций и др. Созданные на основе технологии баз данных исторические информационные системы позволяют оптимальным образом сохранять, организовывать, визуализировать историческую информацию и обеспечивают необходимый доступ к ней.

Ч. Харви и Д. Пресс в обобщающем труде «Базы данных в исторических исследованиях. Теория, методы и приложения», изданном в 1996 г., говорят о том, что «проектирование и разработка баз данных играют центральную роль в трансформации методов исследований в истории». Авторы отмечают значимость этой технологии для разработки систем хранения первичных и вторичных источников, создания исследовательских ресурсов, связывания записей (record linkage), организации, поиска и сортировки исследовательских материалов, анализа и представления исторической информации в целом [Harvey, Press, 1996].

С началом внедрения систем управления базами данных (СУБД) перед историками встал вопрос об использовании программ общего назначения или разработке собственных решений. Данный вопрос решался индивидуально: «некоторые историки экспериментировали со стандартным программным обеспечением для баз данных: недружелюбными иерархическими СУБД, которые требовали программирования для навигации и поиска данных, или еще не полностью развитыми реляционными базами данных» [Boonstra, Breure, Doorn, 2006, p. 26].

С развитием и распространением реляционных баз данных, в силу своей простоты, адаптивности и универсальности, они быстро стали популярными и у историков [Denley, 1994; Harvey, Press, 1996]. Однако, как было показано в работах М. Таллера и других ученых, реляционная модель имеет серьезные ограничения при структурировании исторических источников. Так, исторические данные плохо вписываются в поля фиксированной длины, которые часто оказываются пустыми из-за отсутствия информации или содержат более одного значения; историки постоянно имеют дело с недесятичными системами счисления, изменяющимися топонимами; одно и то же слово может означать географическую принадлежность или просто быть фамилией [Thaller, 1988].

Решением этих проблем стало создание М. Таллером в начале 1980-х годов специализированной СУБД Клио (др. – греч. ?????) [Таллер, 1995], которая отличалась поддержкой нечеткости исторической информации и гибкостью форматов данных. Создание специализированной системы, как пишут О. Бонстра, Л. Брере и П. Доорн, «ознаменовало новый период исторического компьютинга» [Boonstra, Breure, Doorn, 2006, p. 26].

Существенным шагом в осмыслении рассматриваемых проблем являлась дискуссия о подходах к созданию историко-ориентированных баз данных, начатая М. Таллером и П. Доорном [Доорн, 1995; Таллер, 1993]. Ее результатом стало обоснование и утверждение двух основных подходов: проблемно-ориентированного и источнико-ориентированного, которые вполне можно рассматривать в качестве подходов к созданию историко-ориентированных систем в целом (что будет сделано в главе 2). Помимо указанных были предложены методо-ориентированный и пользовательско-ориентированный подходы, однако они не оказали определяющего влияния на развитие направления.

Постановка вопросов об источнико-ориентированном и проблемно-ориентированном подходах к созданию баз данных для исторических исследований означала видение специфики информационных ресурсов для исторической науки не только в том, что они содержат информацию особого рода – историческую, но и в переносе акцентов в понимании специфики исторических ресурсов вообще и историко-ориентированных баз данных в частности в область организации информации исторических источников и методов их обработки.

В этом смысле показательна позиция В. Леверманна, который через обоснование понятия «источнико-ориентированная обработка данных» развивает понятия «источнико-ориентированный подход» и «источнико-ориентированная информационная система» [Леверманн, 1994]. При этом содержание указанного понятия раскрывается словами М. Таллера о том, что источнико-ориентированная обработка данных, в противоположность так называемой методо-ориентированной, – «это стремление смоделировать в компьютере весь объем информации, содержащейся в историческом источнике; это попытка обеспечить возможность использования источника в самых разнообразных целях. Предоставляя историку средства для различных типов анализа, он не требует от него на этапе создания базы данных принятия решения о том, какие методы будут позднее использованы» [Таллер, 1993]. Отмечая достоинства и значение источнико-ориентированной обработки данных, В. Леверманн акцентирует внимание на том, что она ориентирована на максимально точное сохранение источника и предоставление широкого диапазона средств, позволяющих использовать различные аналитические подходы к ним [Леверманн, 1994].

Примечательно, что в предисловии редакции к сборнику научных трудов, в котором была опубликована цитируемая работа В. Леверманна, вводится и такое понятие, как «специализированное источнико-ориентированное программное обеспечение» [Круг идей…, 1994, с. 5]. Здесь же сформулирован вопрос о соотношении источнико-ориентированных технологий и информационных систем для обработки исторических данных. Отвечая на него, авторы указали, что проблема источнико-ориентированных технологий не сводится только к соответствующим системам, а связана с идеологией отношения к информации, в центре которой – сохранение инфраструктуры данных (структурной, семантической), возможность воспроизвести историографическую и культурную среду исследовательского процесса. Приведенные положения обогащают понимание историко-ориентированного подхода и историко-ориентированных информационных систем аспектами, связанными с программным обеспечением и технологиями. Кроме того, в них сформулированы и важнейшие принципы обеспечения специфики исторической информации, создания и эффективности историко-ориентированных информационных систем: сохранение инфраструктуры исторических данных, возможность воспроизведения историографической и культурной среды исторического исследования [Круг идей…, 1994, с. 7, 8].

Можно однозначно констатировать, что базы данных на много лет заняли нишу основного средства организации исторической информации и структурирования исторических источников. Историки и в настоящее время активно используют СУБД общего назначения для решения своих задач. Но нельзя не отметить, что в последнее десятилетие ведущим стандартом представления текстовых источников в гуманитарных науках (особенно в лингвистике и литературоведении) стал стандарт TEI (Text Encoding Initiative), позволяющий на основе XML проводить глубокую разметку текстов. Эта технология, с одной стороны, нивелирует недостатки реляционной модели и стандартных СУБД, а с другой – является более простой и доступной по сравнению с ?????.


<< 1 2
На страницу:
2 из 2