Круглый стол «Цифровизация письменного наследия России: проблемы и перспективы»

22 марта 2023 года в Доме Российского исторического общества состоялся круглый стол на тему «Цифровизация письменного наследия России: проблемы и перспективы».

В ходе мероприятия были подведены итоги реализации совместного проекта Сбера и РИО «Digital Пётр», нацеленного на распознавание рукописей Петра I, а также рассмотрены перспективы развития цифровизации на примере арабографичных книг и тибетских рукописей.

Дискуссию открыл заместитель Министра науки и высшего образования Российской Федерации, член Президиума Российского исторического общества Константин Могилевский, отметивший глубину проникновения искусственного интеллекта во все сферы общественной жизни, в том числе в работу с архивными документами:

«Мы с вами находимся сейчас даже не на пороге, а уже на первом этапе бытования нового технологического уклада, связанного с цифровизацией всех сфер нашей жизни. С появлением искусственного интеллекта в тех сферах, в которых ещё год назад сложно было бы представить, что он сможет помочь человеку и даже в чём-то заменить человеческий труд. Это очень серьёзные вещи, которые происходят быстро. Те, кто сейчас не поймёт этих процессов во всех отраслях человеческой деятельности, рискуют безнадёжно отстать. Это касается и работы с письменным наследием».


«Большинство коллег из нашей сферы считают, что оцифровка — это сканирование. Если мы выйдем за пределы историко-архивного сообщества по всей стране, во всём мире оцифровка — это совсем другая организация процесса, это внедрение искусственного интеллекта <…> Поэтому необходимо приходить к пониманию того, что такое оцифровка в современном архивном деле в части, прежде всего, использования документов. Полагаю, коллеги подумают о том, как и в других направлениях архивного дела — хранении, учёте — может быть использован искусственный интеллект»,

— добавил Константин Могилевский.

На фото: Константин Могилевский

Его мысль продолжил ВРИО председателя Правления Российского исторического общества Руслан Гагкуев, подчеркнувший востребованность использования искусственного интеллекта в исторической науке:

«Я убеждён, что тема цифровизации письменного наследия России для подавляющего большинства историков — вопрос насущный и важный. Все мы постоянно в нашей каждодневной практике так или иначе работаем с письменными документами, источниками, рукописными текстами. Это всегда, с одной стороны, очень волнительно и ответственно, а с другой стороны, конечно, время, которое в ряде случаев нам приходится тратить на осмысление этих источников, на чтение тех почерков, которые относятся даже к ХХ веку, я не говорю про более ранние, очень значительно. Надеюсь, современные технологии и искусственный интеллект смогут в ближайшем будущем облегчить нашу работу и проводить исследования более быстро и качественно».

На фото: Руслан Гагкуев

В свою очередь, директор Санкт-Петербургского Института истории Российской академии наук, член Правления Российского исторического общества Алексей Сиренов наметил перспективы дальнейшего развития проекта «Digital Пётр» и отметил необходимость объединения усилий историков в работе по оцифровке документов:

«Мы сейчас видим, что по одному и тому же пути идут коллеги из разных научных центров. Сегодня у нас будет возможность познакомиться с результатами этой работы и с её ходом. Тут должна быть и Республика Татарстана, и Республика Бурятия и то, что мы делали с петровскими рукописями. Очевидно, что здесь нам нужно действовать скоординированно. Это, мне кажется, проблема, которую сегодняшний наш разговор может поставить и отчасти решить. Это не значит, что мы должны в одном ключе действовать, так как материалы разные. Тем не менее, координация здесь нужна, так как в конечном счёте мы делаем одно общее дело».

На фото: Алексей Сиренов
На круглом столе также выступили руководитель Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения РАН Олег Ринчинов, директор Российского государственного архива древних актов Владимир Аракчеев, исполнительный директор по исследованию данных Sber AI Денис Димитров и другие специалисты в области цифровизации архивных документов.

Подводя итоги дискуссии, Руслан Гагкуев подчеркнул значимость обсуждения проблем и перспектив цифровизации письменного наследия.

«По итогам работы круглого стола будем исходить из необходимости продолжения нашей работы, выработки практических мер»,

— резюмировал он.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.

Работа над оцифровкой документов Архивного фонда Российской Федерации и других архивных документов, включая размещённые в государственных архивах субъектов Российской Федерации и муниципальных архивах, в том числе с применением технологий искусственного интеллекта, ведётся Минцифры России совместно с Росархивом и Российской академией наук в рамках поручения Президента Российской Федерации по итогам совместного заседания Госсовета и Совета по науке и образованию (Пр-290, п. 8). Значительный вклад в этот процесс внесло и поручение Президента по итогам конференции по искусственному интеллекту в 2020 году (Пр-2242, п. 2), во исполнение которого в регионах России были разработаны и утверждены стратегии цифровой трансформации ключевых отраслей экономики, социальной сферы, государственного управления, предусматривающие внедрение конкурентоспособного отечественного программного обеспечения и программно-аппаратных комплексов, созданных в том числе на основе технологий искусственного интеллекта.

Российское историческое общество принимает деятельное участие в оцифровке архивов. Так, при поддержке фонда «История Отечества» создана Электронная библиотека исторических документов, в которой исследователи в открытом доступе смогут найти, в перспективе, все исторические документы, опубликованные в России с 1991 года. Портал позволяет читать документы на экране компьютера, делать по ним полнотекстовой поиск, а также просматривать с помощью системы Указателей.

Одним из наиболее крупных проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I Российским историческим обществом, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в максимально удобном и понятном формате расшифровку рукописей Петра Первого. В течение многих лет изучение выдающейся личности первого российского императора сдерживалось медленными темпами публикации его рукописного наследия. Первый сборник из серии «Письма и бумаги Петра Великого» вышел из печати ещё в 1887 году, однако и сегодня эта работа по-прежнему далека от своего завершения. Одной из причин её огромной трудоёмкости является неразборчивый почерк императора.

Решить эту проблемы и призван «Digital Пётр». В ходе работы над проектом в Санкт-Петербургском институте истории РАН была сформирована рабочая группа, состоящая из научных сотрудников — специалистов по истории Петровской эпохи, а также палеографии и археографии. Источниковой базой стали рукописи из собраний Санкт-Петербургского института истории РАН и Российского государственного архива древних актов. Командой проекта был выбран подход, основанный на нейронных сетях и глубоком обучении, с помощью которого на основе девяти тысяч строк петровских текстов разных лет параметры нейронной сети были адаптированы под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов. Подобное технологическое решение открывает новые перспективы не только в исследовании текстов Петра I, но и в изучении других рукописных документов. В настоящее время сотни тысяч документов по истории России XVII–XVIII веков остаются неизданными в том числе потому, что их чтение доступно только специалистам. Машинное распознавание скорописи существенно упростило бы задачу публикации таких источников.

Другим значимым проектом в сфере оцифровки архивных документов, основанным на технологиях искусственного интеллекта, стал «Поиск по архивам», разработанный Яндексом. Изначально команда проекта занималась генеалогическими исследованиями, но, столкнувшись с необходимостью вручную отсматривать множество сканов рукописных документов, чтобы найти информацию о родственниках, разработчики приняли решение во взаимодействии с архивными работниками создать сервис, с помощью нейронной сети автоматически распознающий рукописные тексты от XVIII до начала XX века.

Основой проекта стала технология оптического распознания символов — OCR, работа над использованием которой уже велась в Яндексе. Использовав первоначальную обучающую выборку в 2000 документов, команда проекта обучила нейронную сеть распознавать строки, расшифровывать их и группировать в смысловые блоки. На данный момент программа расшифровала уже более 4 миллионов страниц документов, которые теперь можно легко найти в поиске и прочесть, не тратя время на разбор рукописного текста.

Данные списка изображений не настроены

Текст: Михаил Дорофеев

Фото: Александр Шалгин

Фонд «История Отечества»

Мы в соцсетях

Вестник №2/2025

Поддержка научных трудов

Конференции поддержанные Фондом

Итоги и главные уроки Второй мировой войны обсудили на научной сессии в рамках ВЭФ

Итоги и главные уроки Второй мировой войны обсудили на научной сессии в рамках ВЭФ

3 сентября 2025 года на полях Восточного экономического форума состоялась сессия «Итоги и уроки Второй мировой войны». Выбор темы научной дискуссии обоснован 80-летним юбилеем со дня окончания Второй мировой войны, который весь мир празднует в текущем году.

 

Военные операции на Тихоокеанском театре военных действий обсудили в рамках ВЭФ

Военные операции на Тихоокеанском театре военных действий обсудили в рамках ВЭФ

3 сентября 2025 года на полях Восточного экономического форума прошла научная сессия «Военные операции на Тихоокеанском театре военных действий» в рамках конференции «Уроки Великой Отечественной и Второй мировой войн: к 80-летию Великой Победы».

 

На полях ВЭФ прошла научная конференция, посвящённая 80-летию Победы во Второй мировой войне

3 сентября 2025 года в рамках X Восточного экономического форума состоялась международная научно-практическая конференция «Уроки Великой Отечественной и Второй мировой войн: к 80-летию Великой Победы».

 

Выставки и экспозиции поддержанные Фондом

Международная делегация ознакомилась с интерактивной выставкой «Поезд Победы» во Владивостоке

Международная делегация ознакомилась с интерактивной выставкой «Поезд Победы» во Владивостоке

5 сентября 2025 года во Владивосток прибыл «Поезд Победы» — первая в мире иммерсивная инсталляция, размещенная в движущемся составе поезда. Экскурсию по выставке посетили участники конференции «Уроки Великой Отечественной и Второй мировой войн: к 80-летию Великой Победы», организованной Российским историческим обществом при участии фонда «История Отечества».

 

В центре РОСФОТО начала работу выставка «Аскания-Нова. Письма из земного рая»

В центре РОСФОТО начала работу выставка «Аскания-Нова. Письма из земного рая»

В музейно-выставочном центре РОСФОТО в Санкт-Петербурге начала работу выставка «Аскания-Нова. Письма из земного рая». На ней представлены более 300 фотографий, архивных документов, кинохроника и современные интервью об одном из старейших в мире биосферных акклиматизационных заповедников.

 

Выставка «Победный финал» открылась в Амурском областном краеведческом музее

Выставка «Победный финал» открылась в Амурском областном краеведческом музее

3 сентября 2025 года в рамках юбилейных мероприятий, посвящённых 80-летию окончания Второй мировой войны, в Амурском областном краеведческом музее имени Г.С. Новикова-Даурского открылась межрегиональная выставка «Победный финал».

 

Документальные фильмы поддержанные Фондом

Документальный фильм «Карл Брюллов. Не сгораша». К 225-летию (23 декабря 1799г.) со дня рождения

Документальный фильм «Карл Брюллов. Не сгораша»

В 1857 году в Российской империи стали готовиться к празднованию 1000-летия Руси - тысячелетию призвания Рюрика на княжение. Объявили конкурс на лучший проект памятника, который решено было поставить в Новгороде, куда, согласно легенде, варяга и призвали. В какой-то момент появилась идея, которая очень пришлась всем по душе, чтобы на памятнике присутствовали фигуры особенно заслуженных перед Россией людей.

 

Цикл документальных фильмов «Моя война. Освобождение Европы»

Цикл документальных фильмов «Моя война. Освобождение Европы»

Цикл фильмов «Моя война. Освобождение Европы» посвящен 80-летию начала освобождения Красной армией стран Европы и включает 4 документальных фильма.

 

Фильм «Софья Федорченко, сестра милосердия» из цикла «Настоящее-прошедшее»

218457182634172456182561251252.jpg

Как-то, разбирая старые издания, Александр Блок перелистывал выходивший в 1917 году журнал «Народоправство». Он обратил внимание на опубликованные в нем фрагменты из книги «Народ на войне» неизвестного писателя С. Федорченко.

 

Археологические экспедиции и исследования поддержанные Фондом

Подведены итоги Северо-Западной археологической экспедиции Эрмитажа в 2025 году

Подведены итоги Северо-Западной археологической экспедиции Эрмитажа в 2025 году

В июле – августе археологи проводили исследования двух многослойных торфяниковых памятников каменного века, расположенных на севере Смоленской области.

 

В Республике Татарстан открылась XII Болгарская международная археологическая школа

В Республике Татарстан открылась XII Болгарская международная археологическая школа

13 августа 2025 года в Болгарском государственном историко-архитектурном музее-заповеднике прошло открытие XII Болгарской международной археологической школы.

 

В Новосибирске молодые археологи приступили к занятиям в полевой школе «Древности Саяно-Алтая»

В Новосибирске молодые археологи приступили к занятиям в полевой школе «Древности Саяно-Алтая»

В Институте археологии и этнографии Сибирского отделения РАН стартовала молодёжная полевая школа «Древности Саяно-Алтая». Школа работает при поддержке фонда «История Отечества» и предоставляет студентам уникальную возможность стать участниками археологических экспедиций под руководством ведущих специалистов института.

 

ОНЛАЙН ПРОЕКТЫ поддержанные Фондом

Историко-документальная интернет-выставка «Обстоятельства повелительно требуют»

Федеральное архивное агентство, Российское Историческое Общество, Российский государственный архив социально-политической истории, при участии Государственного архива Российской Федерации, при поддержке фонда «История Отечества» представляют историко-документальную интернет-выставку к 100-летию образования СССР

 

Онлайн-проект посвящённый Михаилу Пришвину запущен в Смоленске

В Смоленске запущен онлайн-проект про Михаила Пришвина

При поддержке фонда «История Отечества» успешно реализован историко-просветительский онлайн-проект «Смоленский текст: пришвинские главы», приуроченный к 150-летию Михаила Пришвина.

 

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

1 ноября на официальном сайте музея был опубликован онлайн-каталог «“…Можете рассчитывать на меня”: научное наследие В.К. Арсеньева в собрании Российского этнографического музея».