Исторические информационные системы: теория и практика - Динара Амировна Гагарина


С. И. Корниенко, Д. А. Гагарина, Н. Г. ПоврозникИсторические информационные системы: теория и практика

Рецензенты:

доцент Школы исторических наук факультета гуманитарных наук Национального исследовательского университета «Высшая школа экономики», к.и.н. Д. А. Добровольский;

заведующая кафедрой документоведения, архивоведения и истории государственного управления Уральского федерального университета, д.и.н., доцент Л. Н. Мазур;

доцент кафедры исторической информатики исторического факультета Московского государственного университета им. М. В. Ломоносова, директор Института цифровых гуманитарных исследований Сибирского федерального университета, к.и.н. А. Ю. Володин

* * *

Введение

Существенную часть информационных ресурсов гуманитарных наук и образования составляет историческая информация. Со временем увеличивается ее объем, растет количество и разнообразие источников данныхисторических источников. В этих условиях важными становятся подходы к извлечению, организации, хранению и обработке исторической информации, выбору соответствующих средств и методов, а также обеспечение их научности, строгости и верифицируемости. В значительной степени указанные задачи позволяют решать исторические информационные системы, которым посвящена представляемая книга.

Информационные системы параллельно с решением вычислительных задач практически сразу становятся одним из главных направлений развития ЭВМ. Их специфика требует структурированной организации, основой чего наиболее часто являются базы данных. К концу 1980-хначалу 1990-х годов базы данных и информационные системы начинают исследоваться в аспектах исторической науки и исторической информации.

Исторические, или историко-ориентированные, информационные системы (мы будем употреблять эти понятия как синонимичные)  значимый тип исторических ресурсов и важный элемент информационной среды гуманитарных наук и образования. Выделение этого класса систем связано с несколькими тенденциями: развитием исторической информатики, цифровой истории и историко-ориентированного подхода; формированием информационной среды истории и гуманитарных наук в целом, инфраструктуры цифрового исторического и культурного наследия; практикой создания исторических электронных ресурсов, в частности баз и банков данных.

Представленное издание содержит результаты исследования методологических, теоретических и прикладных проблем создания и использования историко-ориентированных информационных систем. Монография является первым комплексным исследованием по заданной теме. Одни проблемы в книге ставятся и рассматриваются впервые, другиехотя и находили ранее свое отражение в соответствующей литературе, не изучались специально и столь глубоко.

В главе 1 монографии рассмотрены изменения в информационной среде исторической науки, дана характеристика информационных ресурсов различного типа. На основе анализа историографии и многолетней практики авторов сформулировано и обосновано определение исторических информационных систем; разработана методика их описания, классификации и оценки; проанализированы роль и место систем различного типа. Значимой частью работы является каталог «Историко-ориентированные информационные системы», который, с одной стороны, стал организационной основой исследования, а с другойего практическим итогом и апробационной площадкой для полученных теоретико-методических результатов. Характеристика ресурса также приведена в этой главе.

В главе 2 комплексно рассмотрены вопросы разработки исторических информационных систем; проанализированы существующие подходы, их возможности и ограничения; разработаны обобщенные модели. Наибольшее внимание уделено системам на основе реляционной модели данных и технологий разметки текста XML-TEI. С точки зрения исторической специфики в этой главе описаны две важные текущие тенденции создания цифровых (в том числе исторических) ресурсовкраудсорсинг для реализации крупномасштабных проектов и массовое развитие доступных сервисов.

Глава 3 посвящена возможностям информационных систем в работе с историко-культурным наследием; проанализированы потенциал, роль и место рассматриваемого вида ресурсов в библиотеках, архивах и музеях. Глава содержит как технологические аспекты в частности создание 3D-моделей и виртуальных экспозиций, так и инфраструктурные: взаимодействие государства, организаций хранения и исследовательских учреждений при создании информационных систем, международное сотрудничество, документирование цифрового историко-культурного наследия.

В главе 4 издания описаны уровни поддержки и методики проведения конкретно-исторических, источниковедческих и историографических исследований на основе историко-ориентированных информационных систем, а также приведены примеры таких исследований. Кроме того, в главе уделено внимание возможностям информационных систем в решении специфических задач исторической науки.

Глава 5 полностью посвящена педагогическим, методическим и дидактическим вопросам. Приведены примеры, анализ и методика применения систем, имеющих изначально образовательный характер, а также варианты адаптации системы поддержки научных исследований, каталогов исторических источников и ресурсов другого типа. Кроме того, описаны методы и форматы обучения студентов разработке информационных систем с учетом исторической специфики.

Результаты, описанные в книге, были получены в ходе реализации ряда научных проектов, работа над которыми велась с 2003 г. в Центре цифровой гуманитаристики (до 2016 г.  Лаборатория исторической и политической информатики) Пермского университета, а в настоящее время продолжается на кафедре гуманитарных дисциплин НИУ ВШЭПермь. Одним из наиболее значимых в этой серии стал проект «Историко-ориентированные информационные системы: методологические, теоретические и прикладные проблемы создания и использования», поддержанный Российским фондом фундаментальных исследований и реализованный в 20132015 гг. (грант РФФИ  13-06-00655). Пользуясь случаем, авторы выражают благодарность фонду за многолетнюю поддержку проектов по созданию исторических информационных систем и проведению научных исследований на их основе.

Такое широкое по отражаемой проблематике исследование стало результатом работы целого коллектива. Кроме авторов книги в нем принимали участие сотрудники Центра цифровой гуманитаристики Пермского университета и кафедры гуманитарных дисциплин НИУ ВШЭПермь. Авторы выражают искреннюю благодарность за предоставление материалов для монографии и общий вклад в работу молодым ученым О. В. Власовой, Ю. В. Ященко, А. Р. Ехлаковой, И. Д. Исмакаевой.

Представленное издание не могло бы состояться без внимательного прочтения вариантов рукописи нашими коллегами. Авторы признательны за советы и замечания А. Ю. Володину (МГУ им. М. В. Ломоносова), Л. Н. Мазур (УрФУ), А. А. Мироносу (ННГУ им. Н. И. Лобачевского). Благодаря критическому отношению к рецензируемой рукописи и детальным рекомендациям Д. А. Добровольского (НИУ ВШЭ) текст приобрел большую аккуратность, были уточнены некоторые классификации и обновлены описания отдельных ресурсов.

Глава 1. Исторические информационные системы: понятие, классификация и оценка

В этой главе рассматриваются состояние и тенденции развития исторических информационных систем на уровне понятийного аппарата, содержания, используемых исторических источников и других параметров. Даются классификация и характеристика некоторых типов систем. Предложена методика оценки историко-ориентированных информационных систем.

1.1. Исторические информационные системы как информационные ресурсы

Информатизация привела к коренным изменениям в информационных среде и структуре исторической науки. Наиболее отчетливо и полно это выразилось в возникновении междисциплинарных направлений на стыке гуманитарных наук, информатики и математикигуманитарного компьютинга (Humanities Computing), клиометрии, квантитативной истории, исторической информатики (Historical Information Science), цифровых гуманитарных наук (Digital Humanities), цифровой истории и др.

Гуманитарии используют компьютеры для решения профессиональных задач практически с начала появления ЭВМс 1950-х годов. Наиболее ярким примером в области компьютерной лингвистики и использования информационных технологий (ИТ) для обработки исторических текстов является проект Index Thomisticus, разработанный священником и ученым Роберто Бусой. В это же время появляются исторические исследования с использованием ЭВМ, в основном для автоматизации обработки статистических данных [Thomas, 2004]. Эта связь между количественными историческими исследованиями и источнико-ориентированной обработкой данных (которая впоследствии стала основой источнико-ориентированного подхода к созданию баз данных) проанализирована в статье М. Таллера [Thaller, 1995]. По мнению автора, несмотря на то, что они часто рассматриваются как противоречия, фактически исключающие друг друга, на самом деле корни источнико-ориентированного подхода лежат в традиции количественных исследований.

До 1980-х годов число гуманитарных исследований с применением компьютеров было невелико; по мнению ряда авторов, они носили случайный характер [Alkhoven, Doorn, 2007; Feeney, Ross, 1993]. С 1980-х годов, с появлением микропроцессорной техники, компьютеры проникают уже во все гуманитарные науки, количество проектов стремительно растет. Но рост и значение ИТ неравномерно распределяются среди разных направлений гуманитарных наук, в некоторых областях роль компьютеров становится более важной, чем в других [Alkhoven, Doorn, 2007]. Неравномерность наблюдается и в отношении типов изучаемых документовтекстовых, статистических, визуальных, звуковых, устных источников и материальных объектов.

Развитие исторической информатики и других направлений, в настоящее время объединенных Digital Humanities, связано не только с научными исследованиями, но и с созданием электронных ресурсов. Необходимость их разработки определяется всем процессом цифровой трансформации общества, переходом к цифровой куль туре. С ростом числа компьютеров, а затем с появлением и распространением Интернета меняются способы создания, поиска, обработки и публикации источников [Alkhoven, Doorn, 2007]; увеличиваются количество и разнообразие цифровых информационных ресурсов, их удельный вес в информационной среде общества.

Заметной частью новой инфраструктуры гуманитарных наук в целом и исторической науки в частности являются предметно-ориентированные и адаптированные к этим областям информационные ресурсы и инструментарий. Исторические информационные ресурсы разнообразны по проблематике и назначению. Они могут быть продуктом академической и публичной истории, разрабатываться профессиональными историками, историками-любителями, студентами и даже школьниками. Это как продукты для научного изучения, продукты-результаты такого изучения, так и продукты для исторического образования и просветительских целей [Корниенко, Власова, Гагарина, 2012].

Среди исторических информационных ресурсов существенное место занимают исторические (историко-ориентированные) информационные системы. Этот вид ресурсов как форма и средство сохранения, организации, обработки и визуализации исторической информации позволяет эффективно решать проблемы учета своеобразия, содержательных и формальных особенностей исторических данных, знаний и науки в целом. Будучи сегодня одним из основных компонентов информационных ресурсов исторической науки и существенной частью информационных ресурсов социально-гуманитарных наук, исторические информационные системы, а также процессы их создания и использования отражают все характерные черты их природы и применения. В этом смысле приобретает определенную важность понимание тех свойств и характерных особенностей исторических информационных систем, которые вытекают из их принадлежности к информационным ресурсам вообще и историческим ресурсам в частности. Это относится прежде всего к определению понятия «исторический информационный ресурс». Для определения, классификации и анализа указанного вида ресурсов недостаточно интуитивного понимания исторической специфики и понимания информационных ресурсов вообще [Корниенко, Власова, Гагарина, 2012]. Как и в отношении ресурсов в целом, применительно к историческим информационным системам такой уровень понимания не обеспечивает нужной четкости определения характера, содержания, установки границ и критериев для отнесения ресурсов к историческим. Более того, при определенном подходе можно расширить границы содержания рассматриваемого понятия на весь круг ресурсов вообще. Очевидно, что с течением времени любые результаты, остатки и свидетельства деятельности человека станут историческими свидетельствами, т. е. историческими источниками. Такой подход к указанному понятию правомерен, поскольку он наиболее полно раскрывает то общее, что характеризует исторические информационные ресурсы как информационные ресурсы вообще. Однако в этом одновременно состоит и недостаток данного подхода. При нем и на формальном, и на содержательном уровнях исчезает специфика исторических информационных ресурсов. Поэтому существует и более строгий подход, основанный на учете природы и предназначения таких ресурсов. В этом случае к историческим информационным ресурсам относят только те, которые созданы специалистами в области исторических исследований или обучения. В то же время такая четкость и определенность оставляют за рамками рассмотрения значимую для исторической науки и образования часть ресурсов, например цифровые музеи, коллекции, библиотеки и тематические сайты междисциплинарного характера, а также любительские ресурсы.

Преодолеть как излишне расширительное толкование, так и чрезмерную строгость в определении понятия «исторический информационный ресурс» позволяет подход, при котором основным критерием служит отношение к предметной областиистории. Иными словами, целесообразно относить к историческим те ресурсы, в которых тем или иным образом присутствует историческая тематика. Такой критерий дает возможность определения исторических информационных ресурсов, минуя имеющиеся противоречия в подходах к этому понятию в научной литературе [Антопольский, 2004, с. 3745] и законодательстве, а также дискуссии о предмете изучения истории как науки.

Представляется, что указанный подход и вытекающее из него определение достаточно продуктивны для оценки качества, исследовательской и образовательной эффективности использования, дальнейшего развития методик и инструментов создания и применения исторических ресурсов.

Как еще в начале 2000-х годов отмечал А. Б. Антопольский, разработка стандартов описания информационных ресурсов, а следовательно, и качество их документирования во многом связаны с содержанием понятия «информационные ресурсы» и их классификация ми [Антопольский, 2004, с. 3745]. Разработка таких классификаций и стандартов описания связана с классификацией информационных ресурсов соответственно структуре и содержанию предметной области, для которой они предназначены. В описании исторических информационных ресурсов могут использоваться: атрибуты, общие для информационных ресурсов; исторические атрибуты, в том числе применяемые для описания исторических источников и литературы; назначение ресурсов; типы данных ресурсов; тематические атрибуты [Корниенко, Власова, Гагарина, 2012].

Существенное значение с точки зрения возможностей использования ресурсов имеет классификация по типу данных, которым представлена информация, и по соответствующим информационным технологиям. В этом смысле информационные ресурсы подразделяются на текстовые, гипертекстовые, числовые, графические (в том числе 3D, 4D), аудио-, видео-, мультимедиа-, интернет-ресурсы и др. Такая классификация может использоваться, в частности, для электронных версий источников и объектов культурного наследияв зависимости от типа источника его электронная версия может быть представлена в виде текстовой, графической (в том числе 3D-графической), аудио- или видеоинформации. Те или иные ресурсы, как правило, являются комбинацией применения различных видов технологий [Корниенко, Власова, Гагарина, 2012].

Еще один аспект анализа исторических информационных систем как информационных ресурсов связан с их значительным распространением в Интернете. Исторические информационные системы как интернет-ресурсы представлены сегодня историко-ориентированными личными и коллективными, многопрофильными и проблемно-тематическими сайтами, порталами, сервисами, форумами, хранилищами данных, веб- и цифровыми историческими архивами, поисковыми системами. Наличие исторического характера и содержания в блогах, электронной переписке, тематических группах и на страницах в социальных сетях превращает содержащие их информационные системы в уникальные современные исторические интернет-ресурсы, обогащает их многообразие и возможности, повышает значимость.

Дальше