Круглый стол «Цифровизация письменного наследия России: проблемы и перспективы»

22 марта 2023 года в Доме Российского исторического общества состоялся круглый стол на тему «Цифровизация письменного наследия России: проблемы и перспективы».

В ходе мероприятия были подведены итоги реализации совместного проекта Сбера и РИО «Digital Пётр», нацеленного на распознавание рукописей Петра I, а также рассмотрены перспективы развития цифровизации на примере арабографичных книг и тибетских рукописей.

Дискуссию открыл заместитель Министра науки и высшего образования Российской Федерации, член Президиума Российского исторического общества Константин Могилевский, отметивший глубину проникновения искусственного интеллекта во все сферы общественной жизни, в том числе в работу с архивными документами:

«Мы с вами находимся сейчас даже не на пороге, а уже на первом этапе бытования нового технологического уклада, связанного с цифровизацией всех сфер нашей жизни. С появлением искусственного интеллекта в тех сферах, в которых ещё год назад сложно было бы представить, что он сможет помочь человеку и даже в чём-то заменить человеческий труд. Это очень серьёзные вещи, которые происходят быстро. Те, кто сейчас не поймёт этих процессов во всех отраслях человеческой деятельности, рискуют безнадёжно отстать. Это касается и работы с письменным наследием».


«Большинство коллег из нашей сферы считают, что оцифровка — это сканирование. Если мы выйдем за пределы историко-архивного сообщества по всей стране, во всём мире оцифровка — это совсем другая организация процесса, это внедрение искусственного интеллекта <…> Поэтому необходимо приходить к пониманию того, что такое оцифровка в современном архивном деле в части, прежде всего, использования документов. Полагаю, коллеги подумают о том, как и в других направлениях архивного дела — хранении, учёте — может быть использован искусственный интеллект»,

— добавил Константин Могилевский.

На фото: Константин Могилевский

Его мысль продолжил ВРИО председателя Правления Российского исторического общества Руслан Гагкуев, подчеркнувший востребованность использования искусственного интеллекта в исторической науке:

«Я убеждён, что тема цифровизации письменного наследия России для подавляющего большинства историков — вопрос насущный и важный. Все мы постоянно в нашей каждодневной практике так или иначе работаем с письменными документами, источниками, рукописными текстами. Это всегда, с одной стороны, очень волнительно и ответственно, а с другой стороны, конечно, время, которое в ряде случаев нам приходится тратить на осмысление этих источников, на чтение тех почерков, которые относятся даже к ХХ веку, я не говорю про более ранние, очень значительно. Надеюсь, современные технологии и искусственный интеллект смогут в ближайшем будущем облегчить нашу работу и проводить исследования более быстро и качественно».

На фото: Руслан Гагкуев

В свою очередь, директор Санкт-Петербургского Института истории Российской академии наук, член Правления Российского исторического общества Алексей Сиренов наметил перспективы дальнейшего развития проекта «Digital Пётр» и отметил необходимость объединения усилий историков в работе по оцифровке документов:

«Мы сейчас видим, что по одному и тому же пути идут коллеги из разных научных центров. Сегодня у нас будет возможность познакомиться с результатами этой работы и с её ходом. Тут должна быть и Республика Татарстана, и Республика Бурятия и то, что мы делали с петровскими рукописями. Очевидно, что здесь нам нужно действовать скоординированно. Это, мне кажется, проблема, которую сегодняшний наш разговор может поставить и отчасти решить. Это не значит, что мы должны в одном ключе действовать, так как материалы разные. Тем не менее, координация здесь нужна, так как в конечном счёте мы делаем одно общее дело».

На фото: Алексей Сиренов
На круглом столе также выступили руководитель Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения РАН Олег Ринчинов, директор Российского государственного архива древних актов Владимир Аракчеев, исполнительный директор по исследованию данных Sber AI Денис Димитров и другие специалисты в области цифровизации архивных документов.

Подводя итоги дискуссии, Руслан Гагкуев подчеркнул значимость обсуждения проблем и перспектив цифровизации письменного наследия.

«По итогам работы круглого стола будем исходить из необходимости продолжения нашей работы, выработки практических мер»,

— резюмировал он.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.

Работа над оцифровкой документов Архивного фонда Российской Федерации и других архивных документов, включая размещённые в государственных архивах субъектов Российской Федерации и муниципальных архивах, в том числе с применением технологий искусственного интеллекта, ведётся Минцифры России совместно с Росархивом и Российской академией наук в рамках поручения Президента Российской Федерации по итогам совместного заседания Госсовета и Совета по науке и образованию (Пр-290, п. 8). Значительный вклад в этот процесс внесло и поручение Президента по итогам конференции по искусственному интеллекту в 2020 году (Пр-2242, п. 2), во исполнение которого в регионах России были разработаны и утверждены стратегии цифровой трансформации ключевых отраслей экономики, социальной сферы, государственного управления, предусматривающие внедрение конкурентоспособного отечественного программного обеспечения и программно-аппаратных комплексов, созданных в том числе на основе технологий искусственного интеллекта.

Российское историческое общество принимает деятельное участие в оцифровке архивов. Так, при поддержке фонда «История Отечества» создана Электронная библиотека исторических документов, в которой исследователи в открытом доступе смогут найти, в перспективе, все исторические документы, опубликованные в России с 1991 года. Портал позволяет читать документы на экране компьютера, делать по ним полнотекстовой поиск, а также просматривать с помощью системы Указателей.

Одним из наиболее крупных проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I Российским историческим обществом, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в максимально удобном и понятном формате расшифровку рукописей Петра Первого. В течение многих лет изучение выдающейся личности первого российского императора сдерживалось медленными темпами публикации его рукописного наследия. Первый сборник из серии «Письма и бумаги Петра Великого» вышел из печати ещё в 1887 году, однако и сегодня эта работа по-прежнему далека от своего завершения. Одной из причин её огромной трудоёмкости является неразборчивый почерк императора.

Решить эту проблемы и призван «Digital Пётр». В ходе работы над проектом в Санкт-Петербургском институте истории РАН была сформирована рабочая группа, состоящая из научных сотрудников — специалистов по истории Петровской эпохи, а также палеографии и археографии. Источниковой базой стали рукописи из собраний Санкт-Петербургского института истории РАН и Российского государственного архива древних актов. Командой проекта был выбран подход, основанный на нейронных сетях и глубоком обучении, с помощью которого на основе девяти тысяч строк петровских текстов разных лет параметры нейронной сети были адаптированы под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов. Подобное технологическое решение открывает новые перспективы не только в исследовании текстов Петра I, но и в изучении других рукописных документов. В настоящее время сотни тысяч документов по истории России XVII–XVIII веков остаются неизданными в том числе потому, что их чтение доступно только специалистам. Машинное распознавание скорописи существенно упростило бы задачу публикации таких источников.

Другим значимым проектом в сфере оцифровки архивных документов, основанным на технологиях искусственного интеллекта, стал «Поиск по архивам», разработанный Яндексом. Изначально команда проекта занималась генеалогическими исследованиями, но, столкнувшись с необходимостью вручную отсматривать множество сканов рукописных документов, чтобы найти информацию о родственниках, разработчики приняли решение во взаимодействии с архивными работниками создать сервис, с помощью нейронной сети автоматически распознающий рукописные тексты от XVIII до начала XX века.

Основой проекта стала технология оптического распознания символов — OCR, работа над использованием которой уже велась в Яндексе. Использовав первоначальную обучающую выборку в 2000 документов, команда проекта обучила нейронную сеть распознавать строки, расшифровывать их и группировать в смысловые блоки. На данный момент программа расшифровала уже более 4 миллионов страниц документов, которые теперь можно легко найти в поиске и прочесть, не тратя время на разбор рукописного текста.

Данные списка изображений не настроены

Текст: Михаил Дорофеев

Фото: Александр Шалгин

Фонд «История Отечества»

Мы в соцсетях

Вестник №3/2024

Поддержка научных трудов

Конференции поддержанные Фондом

В Архангельске состоялась XI Всероссийская исследовательская историческая школа молодых учёных

В Архангельске состоялась XI Всероссийская исследовательская историческая школа молодых учёных

6 ноября 2024 года в Северном (Арктическом) федеральном университете имени Михаила Ломоносова прошло открытие XI Всероссийской исследовательской школы студентов, аспирантов и молодых учёных «Русский Север и Арктика: фундаментальные проблемы истории и современности».

 

В Новосибирске подвели итоги конференции, посвящённой творчеству каменного века

В Новосибирске подвели итоги конференции, посвящённой творчеству каменного века

С 21 по 24 октября 2024 года в Институте археологии и этнографии Сибирского отделения Российской академии наук в Новосибирске работала всероссийская (с международным участием) научная конференция «Знаки и образы в искусстве каменного века», приуроченная к 300-летию Российской академии наук.

 

В Омске состоялись IV военно-исторические чтения


В Омске состоялись IV военно-исторические чтения

1 ноября 2024 года в столице Омской области прошли IV Омские военно-исторические чтения «Сибирские формирования в военных конфликтах XVI–XXI веков. На пути к 80-летию Великой Победы».

 

Выставки и экспозиции поддержанные Фондом

В РНБ открылась выставка, посвящённая первому русскому книгопечатнику Ивану Фёдорову

В РНБ открылась выставка, посвящённая первому русскому книгопечатнику Ивану Фёдорову

30 октября 2024 года в Российской национальной библиотеке состоялось открытие планшетной выставки «Иван Фёдоров и начало книгопечатания в восточнославянских землях», созданная при поддержке фонда «История Отечества».

 

В Астраханском краеведческом музее открылась выставка буддийских артефактов

В Астраханском краеведческом музее открылась выставка буддийских артефактов

Выставка «Традиционная буддийская культура калмыков в исследованиях академических экспедиций. Из коллекции Астраханского музея-заповедника XIX — начала XX веков» создана в рамках одноимённого экспозиционно-выставочного проекта, который реализуется при поддержке фонда «История Отечества». Она приурочена к 300-летнему юбилею Российской академии наук.

 

В Государственном историческом музее состоялось открытие выставки «Ленин»

В Государственном историческом музее состоялось открытие выставки «Ленин»

16 октября 2024 года в Государственном историческом музее открылась выставка «Ленин». Экспозиция, посвящённая 100-летию со дня смерти основателя большевистской партии, подготовлена при поддержке фонда «История Отечества».

 

Документальные фильмы поддержанные Фондом

Фильм «Софья Федорченко, сестра милосердия» из цикла «Настоящее-прошедшее»

218457182634172456182561251252.jpg

Как-то, разбирая старые издания, Александр Блок перелистывал выходивший в 1917 году журнал «Народоправство». Он обратил внимание на опубликованные в нем фрагменты из книги «Народ на войне» неизвестного писателя С. Федорченко.

 

Документальный фильм «Красные и белые» рассказывает об одном из ключевых сражений Гражданской войны

Документальный фильм «Экономическое чудо». Расцвет экономики Российской империи в 1913 году

Документальный фильм «Красные и белые» режиссёра Владимира Арясова рассказывает об одном из ключевых сражений Гражданской войны возле посёлка Кромы.

 

Смотреть документальный фильмы «Заключенный камеры №207»

Фильм о великом князе Николае Михайловиче Романове. Он - внук императора Николая I, двоюродный брат императора Александра III и дядя императора Николая II. Речь пойдет о семи месяцах заключения и о том, что открылось археологам, проводившим раскопки на территории Петропавловской крепости в начале нового тысячелетия.

 

Археологические экспедиции и исследования поддержанные Фондом

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

С 10 по 12 сентября 2024 года в Екатеринбурге состоялись «IX Уральские археографические чтения», посвящённые 50-летию Уральского археографического центра.

 

В Амурской области продолжаются археологические раскопки городища около реки Зея

В Амурской области продолжаются археологические раскопки городища около реки Зея

1 июля 2024 года стартовала спасательная археологическая экспедиция Центра по сохранению историко-культурного наследия Амурской области на памятнике археологии «Гащенка, городище-1».

 

Стартовала молодёжная полевая школа «Археологическое наследие Алтая-2024»

Стартовала молодёжная полевая школа «Археологическое наследие Алтая-2024»

В июле 2024 года на Алтае при поддержке фонда «История Отечества» в третий раз работает молодёжная полевая археологическая школа. Занятия организованы Институтом археологии и этнографии Сибирского отделения РАН совместно с Гуманитарным институтом Новосибирского государственного университета.

 

ОНЛАЙН ПРОЕКТЫ поддержанные Фондом

Историко-документальная интернет-выставка «Обстоятельства повелительно требуют»

Федеральное архивное агентство, Российское Историческое Общество, Российский государственный архив социально-политической истории, при участии Государственного архива Российской Федерации, при поддержке фонда «История Отечества» представляют историко-документальную интернет-выставку к 100-летию образования СССР

 

Онлайн-проект посвящённый Михаилу Пришвину запущен в Смоленске

В Смоленске запущен онлайн-проект про Михаила Пришвина

При поддержке фонда «История Отечества» успешно реализован историко-просветительский онлайн-проект «Смоленский текст: пришвинские главы», приуроченный к 150-летию Михаила Пришвина.

 

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

1 ноября на официальном сайте музея был опубликован онлайн-каталог «“…Можете рассчитывать на меня”: научное наследие В.К. Арсеньева в собрании Российского этнографического музея».