Исторические энциклопедии. Одним из важных типов историко-ориентированных ресурсов являются исторические энциклопедии. Историческая интернет-энциклопедия это энциклопедия, действующая в веб-среде и содержащая массивы исторических фактов и их интерпретаций. Можно выделить два подтипа таких ресурсов: те, авторство статей в которых принадлежит коллективу разработчиков, и те, содержание которых создается пользователями (вики-энциклопедии) [Ященко, Ященко, 2015].
Анализ 550 интернет-ресурсов и 50 мобильных приложений, отобранных с точки зрения информативности (рассматривались ресурсы, содержащие от 5000 до 20 000 статей объемом от 20 до 150 слов), визуализации, функциональных возможностей и доступности, проведенный Ю. В. Ященко и А. В. Ященко, показал, что существуют разные по структуре исторические энциклопедии. Часто встречается иерархический вид с несколькими уровнями, когда каждый последующий уровень является подразделом предыдущего информационного блока, а основной страницей системы является стартовая (главная) страница сайта. Другой вариант перекрестные ссылки. Статьи могут быть упорядочены посредством алфавитного и тематического указателей. При этом преобладает смешанный (гибридный) вид, когда есть и корневая страница, и перекрестные переходы между статьями, организованные на основе гиперссылок. Кроме того, используются электронные версии печатных изданий. В этом случае поисковая система внутри интернет-энциклопедии может отсутствовать [Ященко, Ященко, 2015].
Большая доля энциклопедических ресурсов представляет информацию в виде текста, без сопровождения визуальными элементами [Платонов, 2012]. Количество мобильных приложений невелико, зачастую они содержат недостоверную информацию. В целом для исторических интернет-энциклопедий характерен устоявшийся набор отличительных атрибутов: таймлайн; развитая поисковая система с возможностью фильтрации и сортировки данных; тематические и алфавитные указатели; перекрестные ссылки, которые часто являются дополнением к основной поисковой системе. Такие веб-проекты часто оформлены в формате портала, они содержат расширения и интерактивные сервисы (например, элементы ГИС, инструментарий для работы с изображениями, в том числе их обработки). В Рунете ожидаемо преобладают энциклопедические ресурсы по истории России.
Большая доля энциклопедических ресурсов представляет информацию в виде текста, без сопровождения визуальными элементами [Платонов, 2012]. Количество мобильных приложений невелико, зачастую они содержат недостоверную информацию. В целом для исторических интернет-энциклопедий характерен устоявшийся набор отличительных атрибутов: таймлайн; развитая поисковая система с возможностью фильтрации и сортировки данных; тематические и алфавитные указатели; перекрестные ссылки, которые часто являются дополнением к основной поисковой системе. Такие веб-проекты часто оформлены в формате портала, они содержат расширения и интерактивные сервисы (например, элементы ГИС, инструментарий для работы с изображениями, в том числе их обработки). В Рунете ожидаемо преобладают энциклопедические ресурсы по истории России.
Классификация по областям исторического знания
О содержательных характеристиках исторических информационных систем позволяют судить такие атрибуты, как область истории, география и хронология. Классификация по ним показывает тематическое разнообразие изучаемого вида ресурсов.
По-прежнему, как было установлено П. Доорном еще в середине 1990-х годов [Доорн, 1995], наиболее популярными тематиками (в порядке убывания) являются: социальная история, экономическая история, история культуры, политическая история, демография, краеведение и археология. Тот факт, что большая часть современных систем предназначены для исследований по социально-экономической и политической истории, объясняется, с одной стороны, востребованностью данной проблематики, а с другой наличием значительных массивов информации, требующей обработки. В то же время растет число ресурсов, содержащих информацию, связанную с историко-культурным наследием.
По хронологическим критериям большинство рассматриваемых информационных систем относятся к истории XX в., что связано с доступностью источников этого периода. Ранее, по данным на начало 1990-х годов, отмечалось преобладание ресурсов по истории XIX в., а затем XVII и XVIII вв. [Доорн, 1995].
В целом исторические информационные системы имеют разную временную протяженность от нескольких месяцев до нескольких веков. Активно развиваются системы, охватывающие до нескольких тысячелетий, в том числе в рамках междисциплинарного направления Big History истории развития Земли от Большого взрыва до современности. Для таких проектов характерно использование таймлайнов и картографических инструментов (например, как в интерактивном атласе TimeMaps[13], содержащем более 1500 карт по различным периодам и регионам). Значительная хронологическая протяженность присуща и более традиционным коллекциям источников, к которым относится проект Йельского университета Avalon[14], разработанный в 2008 г. и содержащий полные тексты источников в области права, экономики, политики, дипломатии и государственного управления, начиная с 4 тыс. лет до н. э. Наиболее известным в области Big History является одноименный Big History Project[15], разрабатываемый по инициативе Билла Гейтса и рассматривающий почти 14 млн лет истории. Еще один проект Big History ChronoZoom совместная разработка Калифорнийского университета в Беркли и Московского государственного университета им. М. В. Ломоносова[16]. Данный проект представляет инструменты для создания собственных ресурсов, их сохранения и репрезентации в рамках единой системы. Для перечисленных примеров и других подобных проектов свойственны сильная образовательная составляющая и наличие методических разработок, адаптирующих использование продукта в учебном процессе.
Классификация по типу исторических источников
Существующие историко-ориентированные информационные системы варьируются по типам исторических источников, использованных в формировании контента. В этом смысле можно говорить о системах, основанных на письменных, статистических, вещественных, изобразительных, аудио-, видео-, мультимедийных, картографических и других источниках, а также на их различных комбинациях. Наиболее часто встречающиеся источники на всем протяжении развития историко-ориентированных информационных систем и баз данных письменные, что связано как с их преобладанием в общем объеме исторических источников, так и с доступностью технологий для их перевода в цифровой формат. Вместе с тем характер используемых письменных источников и способы их репрезентации в системе существенно изменялись со временем. Историко-ориентированные базы данных конца 1980-х 1990-х годов основывались преимущественно на массовых, прежде всего формулярных источниках: личных карточках, отчетных делопроизводственных документах, родословных книгах, формулярных списках, информация которых хорошо структурирована и удобным образом укладывается в формат реляционных баз данных.
Поскольку хранение, анализ и описание изображений в оболочке информационной системы гораздо легче текста, в ряде случаев текстовый источник заносится в информационную систему в виде нераспознанного изображения. Такие изображения могут быть сделаны на основе оригинала или копии (факсимильного издания) и представлены следующими форматами: jpeg, gif, pdf, djvu и др. Все чаще встречаются псевдоизображения, представленные в формате pdf, передающие, например, оригинальный шрифт источника, а также нераспознанный или плохо распознанный текст.
С развитием технологий круг источников, для представления информации которых используются информационные системы, расширяется. Одновременно меняется способ репрезентации источников в системе в направлении большей машиночитаемости, а также точности и детальности визуализации. В наибольшей степени это видно на примере письменных и вещественных источников. Применительно к текстовым источникам это может быть обозначено как переход от простой атрибуции к полнотекстовости с сохранением формальных и внешних особенностей документа и возможностью передачи многослойности текста. Сегодня все более характерным при репрезентации текстовых источников в информационной системе становится их представление в виде изображения, метаописания, распознанного и размеченного текста и, если необходимо, транскрипции, перевода[17].
В перспективе следует ожидать изменения способов репрезентации и для других источников, в частности аудио-, видео- и мультимедийных данных, для которых сегодня по-прежнему преобладают атрибутивное описание и наличие соответствующего файла, не предполагающие возможности полнотекстового поиска. Значительным шагом в этом направлении стала разработка инструментария для анализа массивов аудиоданных. Так, в Королевском технологическом институте (Стокгольм, Швеция) разработана программа[18] c открытым кодом для поиска по большим неструктурированным массивам аудиоданных. В ходе тестирования указанного инструментария на оцифрованных аудиоматериалах из архива Института языка и фольклора (Institute for Language and Folklore, ISOF) а это порядка 13 тыс. часов звучания была доказана эффективность разработанной методики анализа [Fallgren, Malisz, Edlund, 2018].
Также встречается значительное число информационных систем, источниковой базой которых стали статистические данные. Как правило, такие системы предназначены для анализа социально-экономических процессов и динамики демографического развития.
Наличие многочисленных систем, различающихся по такому критерию, как тип источника, создает возможности для комплексных исследований на основе разнотипных источников, сочетая текст, статистику и изображения.
1.5. Каталог историко-ориентированных информационных систем
Сайт «Историко-ориентированные информационные системы» http://digitalhistory.ru предназначен для отображения процесса и результатов исследования теоретических и практических вопросов создания таких систем, использования их в науке, образовании и для сохранения историко-культурного наследия.
В основе сайта лежит база данных MySQL, содержащая информацию об историко-ориентированных информационных системах, публикациях по этой тематике, связях между ними, авторах, организациях создания ресурсов, тематике, типологии систем и публикаций по различным основаниям.
Основными разделами сайта являются «Публикации» и «Каталог систем». Оба раздела включают соответствующие электронные каталоги, расширенный поиск и детализированное описание каждого экземпляра.
Источниковую основу каталога составили в первую очередь системы, представленные в Интернете или доступные на локальных носителях. Они были найдены в основном в 20132015 гг., в период работы над проектом «Историко-ориентированные информационные системы: методологические, теоретические и прикладные проблемы создания и использования»[19], через поисковые системы, каталоги, списки и перечни отдельных типов информационных ресурсов, сайты научных фондов (в частности, РФФИ[20] и РГНФ, в настоящее время вошедшего в состав РФФИ, которые в течение многих лет проводили конкурсы по созданию информационных систем), а также сайты университетов, научных организаций, учреждений хранения. Созданный каталог продолжает пополняться в настоящее время. Значимым источником информации о ресурсах стали коллекции информационных систем и баз данных, созданные в партнерстве различными организациями и не всегда связанные содержательно, а также тематические порталы, агрегаторы (часть из них перечислены в предыдущем разделе как примеры метасистем).