Круглый стол «Цифровизация письменного наследия России: проблемы и перспективы»

22 марта 2023 года в Доме Российского исторического общества состоялся круглый стол на тему «Цифровизация письменного наследия России: проблемы и перспективы».

В ходе мероприятия были подведены итоги реализации совместного проекта Сбера и РИО «Digital Пётр», нацеленного на распознавание рукописей Петра I, а также рассмотрены перспективы развития цифровизации на примере арабографичных книг и тибетских рукописей.

Дискуссию открыл заместитель Министра науки и высшего образования Российской Федерации, член Президиума Российского исторического общества Константин Могилевский, отметивший глубину проникновения искусственного интеллекта во все сферы общественной жизни, в том числе в работу с архивными документами:

«Мы с вами находимся сейчас даже не на пороге, а уже на первом этапе бытования нового технологического уклада, связанного с цифровизацией всех сфер нашей жизни. С появлением искусственного интеллекта в тех сферах, в которых ещё год назад сложно было бы представить, что он сможет помочь человеку и даже в чём-то заменить человеческий труд. Это очень серьёзные вещи, которые происходят быстро. Те, кто сейчас не поймёт этих процессов во всех отраслях человеческой деятельности, рискуют безнадёжно отстать. Это касается и работы с письменным наследием».


«Большинство коллег из нашей сферы считают, что оцифровка — это сканирование. Если мы выйдем за пределы историко-архивного сообщества по всей стране, во всём мире оцифровка — это совсем другая организация процесса, это внедрение искусственного интеллекта <…> Поэтому необходимо приходить к пониманию того, что такое оцифровка в современном архивном деле в части, прежде всего, использования документов. Полагаю, коллеги подумают о том, как и в других направлениях архивного дела — хранении, учёте — может быть использован искусственный интеллект»,

— добавил Константин Могилевский.

На фото: Константин Могилевский

Его мысль продолжил ВРИО председателя Правления Российского исторического общества Руслан Гагкуев, подчеркнувший востребованность использования искусственного интеллекта в исторической науке:

«Я убеждён, что тема цифровизации письменного наследия России для подавляющего большинства историков — вопрос насущный и важный. Все мы постоянно в нашей каждодневной практике так или иначе работаем с письменными документами, источниками, рукописными текстами. Это всегда, с одной стороны, очень волнительно и ответственно, а с другой стороны, конечно, время, которое в ряде случаев нам приходится тратить на осмысление этих источников, на чтение тех почерков, которые относятся даже к ХХ веку, я не говорю про более ранние, очень значительно. Надеюсь, современные технологии и искусственный интеллект смогут в ближайшем будущем облегчить нашу работу и проводить исследования более быстро и качественно».

На фото: Руслан Гагкуев

В свою очередь, директор Санкт-Петербургского Института истории Российской академии наук, член Правления Российского исторического общества Алексей Сиренов наметил перспективы дальнейшего развития проекта «Digital Пётр» и отметил необходимость объединения усилий историков в работе по оцифровке документов:

«Мы сейчас видим, что по одному и тому же пути идут коллеги из разных научных центров. Сегодня у нас будет возможность познакомиться с результатами этой работы и с её ходом. Тут должна быть и Республика Татарстана, и Республика Бурятия и то, что мы делали с петровскими рукописями. Очевидно, что здесь нам нужно действовать скоординированно. Это, мне кажется, проблема, которую сегодняшний наш разговор может поставить и отчасти решить. Это не значит, что мы должны в одном ключе действовать, так как материалы разные. Тем не менее, координация здесь нужна, так как в конечном счёте мы делаем одно общее дело».

На фото: Алексей Сиренов
На круглом столе также выступили руководитель Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения РАН Олег Ринчинов, директор Российского государственного архива древних актов Владимир Аракчеев, исполнительный директор по исследованию данных Sber AI Денис Димитров и другие специалисты в области цифровизации архивных документов.

Подводя итоги дискуссии, Руслан Гагкуев подчеркнул значимость обсуждения проблем и перспектив цифровизации письменного наследия.

«По итогам работы круглого стола будем исходить из необходимости продолжения нашей работы, выработки практических мер»,

— резюмировал он.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.

Работа над оцифровкой документов Архивного фонда Российской Федерации и других архивных документов, включая размещённые в государственных архивах субъектов Российской Федерации и муниципальных архивах, в том числе с применением технологий искусственного интеллекта, ведётся Минцифры России совместно с Росархивом и Российской академией наук в рамках поручения Президента Российской Федерации по итогам совместного заседания Госсовета и Совета по науке и образованию (Пр-290, п. 8). Значительный вклад в этот процесс внесло и поручение Президента по итогам конференции по искусственному интеллекту в 2020 году (Пр-2242, п. 2), во исполнение которого в регионах России были разработаны и утверждены стратегии цифровой трансформации ключевых отраслей экономики, социальной сферы, государственного управления, предусматривающие внедрение конкурентоспособного отечественного программного обеспечения и программно-аппаратных комплексов, созданных в том числе на основе технологий искусственного интеллекта.

Российское историческое общество принимает деятельное участие в оцифровке архивов. Так, при поддержке фонда «История Отечества» создана Электронная библиотека исторических документов, в которой исследователи в открытом доступе смогут найти, в перспективе, все исторические документы, опубликованные в России с 1991 года. Портал позволяет читать документы на экране компьютера, делать по ним полнотекстовой поиск, а также просматривать с помощью системы Указателей.

Одним из наиболее крупных проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I Российским историческим обществом, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в максимально удобном и понятном формате расшифровку рукописей Петра Первого. В течение многих лет изучение выдающейся личности первого российского императора сдерживалось медленными темпами публикации его рукописного наследия. Первый сборник из серии «Письма и бумаги Петра Великого» вышел из печати ещё в 1887 году, однако и сегодня эта работа по-прежнему далека от своего завершения. Одной из причин её огромной трудоёмкости является неразборчивый почерк императора.

Решить эту проблемы и призван «Digital Пётр». В ходе работы над проектом в Санкт-Петербургском институте истории РАН была сформирована рабочая группа, состоящая из научных сотрудников — специалистов по истории Петровской эпохи, а также палеографии и археографии. Источниковой базой стали рукописи из собраний Санкт-Петербургского института истории РАН и Российского государственного архива древних актов. Командой проекта был выбран подход, основанный на нейронных сетях и глубоком обучении, с помощью которого на основе девяти тысяч строк петровских текстов разных лет параметры нейронной сети были адаптированы под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов. Подобное технологическое решение открывает новые перспективы не только в исследовании текстов Петра I, но и в изучении других рукописных документов. В настоящее время сотни тысяч документов по истории России XVII–XVIII веков остаются неизданными в том числе потому, что их чтение доступно только специалистам. Машинное распознавание скорописи существенно упростило бы задачу публикации таких источников.

Другим значимым проектом в сфере оцифровки архивных документов, основанным на технологиях искусственного интеллекта, стал «Поиск по архивам», разработанный Яндексом. Изначально команда проекта занималась генеалогическими исследованиями, но, столкнувшись с необходимостью вручную отсматривать множество сканов рукописных документов, чтобы найти информацию о родственниках, разработчики приняли решение во взаимодействии с архивными работниками создать сервис, с помощью нейронной сети автоматически распознающий рукописные тексты от XVIII до начала XX века.

Основой проекта стала технология оптического распознания символов — OCR, работа над использованием которой уже велась в Яндексе. Использовав первоначальную обучающую выборку в 2000 документов, команда проекта обучила нейронную сеть распознавать строки, расшифровывать их и группировать в смысловые блоки. На данный момент программа расшифровала уже более 4 миллионов страниц документов, которые теперь можно легко найти в поиске и прочесть, не тратя время на разбор рукописного текста.

Данные списка изображений не настроены

Текст: Михаил Дорофеев

Фото: Александр Шалгин

Фонд «История Отечества»

Мы в соцсетях

Вестник №3/2025

Поддержка научных трудов

Конференции поддержанные Фондом

В Кабардино-Балкарии завершилась работа X Международной исторической школы

В Кабардино-Балкарии завершилась работа X Международной исторической школы

24 октября 2025 года в Эльбрусском учебно-научном комплексе Кабардино-Балкарского государственного университета имени Х.М. Бербекова торжественно подвели итоги X Международной исторической школы.

 

Международное восхождение к вершинам исторической науки — как проходит МИШ в Приэльбрусье

Международное восхождение к вершинам исторической науки — как проходит МИШ в Приэльбрусье

В Кабардино-Балкарии продолжается X Международная историческая школа. Поспособствовал ли Эльбрус укреплению межнациональных связей студентов и влияет ли высокогорный воздух на создание историко-просветительских проектов, за первые пару дней Школы постарался выяснить корреспондент пресс-службы фонда «История Отечества» Михаил Дорофеев.

 

В Кабардино-Балкарской Республике открылась X Международная историческая школа

В Кабардино-Балкарской Республике открылась X Международная историческая школа

20 октября 2025 года в Эльбрусском учебно-научном комплексе Кабардино-Балкарского государственного университета имени Х.М. Бербекова состоялось торжественное открытие X Международной исторической школы.

 

Выставки и экспозиции поддержанные Фондом

В Центральном музее Тавриды открылась выставка «У Медведя на носу дети ели колбасу»

В Центральном музее Тавриды открылась выставка «У Медведя на носу дети ели колбасу»

1 октября 2025 года в Центральном музее Тавриды открылась выставка «У Медведя на носу дети ели колбасу.

 

Открылась выставка об отношениях СССР и Вьетнама в годы второй Индокитайской войны 1959—1975 годов

В Москве открылась выставка об отношениях СССР и Вьетнама в годы второй Индокитайской войны 1959—1975 годов

3 октября 2025 года в Российском государственном архиве социально-политической истории (РГАСПИ) начала работу историко-документальная выставка «СССР и Вьетнам в годы второй Индокитайской войны 1959—1975 гг. К 50-летию окончания войны во Вьетнаме».

 

В ГИМ состоялось торжественное открытие выставки «Николай I. Идеальный самодержец»

В ГИМ прошло торжественное открытие выставки «Николай I. Идеальный самодержец»

17 сентября 2025 года в Государственном историческом музее прошло открытие выставки «Николай I. Идеальный самодержец», посвящённая 200-летию вступления на престол монарха, созданная при поддержке фонда «История Отечества».

 

Документальные фильмы поддержанные Фондом

Фильм, посвященный Борису Вилькицкому, покажут в рамках киномарафона в Архангельске

Фильм, посвященный Борису Вилькицкому, покажут в рамках киномарафона в Архангельске

Документальный фильм «Борис Вилькицкий. Северный морской путь», созданный при поддержке фонда «История Отечества», вошёл в программу киномарафона Arctic open 2023.

 

Документальный фильм «Москва, 1917. Семь дней гражданской войны»

18275412559691212512512asfasf2.jpg

Как проходил в Москве процесс установления новой советской власти? Почему в Москве, в отличие от столичного Петрограда, большевики при попытке захвата власти в октябре 1917 года встретили организованное и длительное сопротивление? На эти и многие другие вопросы дают ответы авторы фильма.

 

Документальный фильм «Экономическое чудо». Расцвет экономики Российской империи в 1913 году

Документальный фильм «Экономическое чудо». Расцвет экономики Российской империи в 1913 году

Документальный фильм «Экономическое чудо» посвящён экономическому подъёму, произошедшему в Российской империи в начале XX века. Для советских экономистов 1913 год был неким эталоном сравнения состояния экономики на разных этапах развития СССР.

 

Археологические экспедиции и исследования поддержанные Фондом

Подведены итоги Северо-Западной археологической экспедиции Эрмитажа в 2025 году

Подведены итоги Северо-Западной археологической экспедиции Эрмитажа в 2025 году

В июле – августе археологи проводили исследования двух многослойных торфяниковых памятников каменного века, расположенных на севере Смоленской области.

 

В Республике Татарстан открылась XII Болгарская международная археологическая школа

В Республике Татарстан открылась XII Болгарская международная археологическая школа

13 августа 2025 года в Болгарском государственном историко-архитектурном музее-заповеднике прошло открытие XII Болгарской международной археологической школы.

 

В Новосибирске молодые археологи приступили к занятиям в полевой школе «Древности Саяно-Алтая»

В Новосибирске молодые археологи приступили к занятиям в полевой школе «Древности Саяно-Алтая»

В Институте археологии и этнографии Сибирского отделения РАН стартовала молодёжная полевая школа «Древности Саяно-Алтая». Школа работает при поддержке фонда «История Отечества» и предоставляет студентам уникальную возможность стать участниками археологических экспедиций под руководством ведущих специалистов института.

 

ОНЛАЙН ПРОЕКТЫ поддержанные Фондом

Историко-документальная интернет-выставка «Обстоятельства повелительно требуют»

Федеральное архивное агентство, Российское Историческое Общество, Российский государственный архив социально-политической истории, при участии Государственного архива Российской Федерации, при поддержке фонда «История Отечества» представляют историко-документальную интернет-выставку к 100-летию образования СССР

 

Онлайн-проект посвящённый Михаилу Пришвину запущен в Смоленске

В Смоленске запущен онлайн-проект про Михаила Пришвина

При поддержке фонда «История Отечества» успешно реализован историко-просветительский онлайн-проект «Смоленский текст: пришвинские главы», приуроченный к 150-летию Михаила Пришвина.

 

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

1 ноября на официальном сайте музея был опубликован онлайн-каталог «“…Можете рассчитывать на меня”: научное наследие В.К. Арсеньева в собрании Российского этнографического музея».