Круглый стол «Цифровизация письменного наследия России: проблемы и перспективы»

22 марта 2023 года в Доме Российского исторического общества состоялся круглый стол на тему «Цифровизация письменного наследия России: проблемы и перспективы».

В ходе мероприятия были подведены итоги реализации совместного проекта Сбера и РИО «Digital Пётр», нацеленного на распознавание рукописей Петра I, а также рассмотрены перспективы развития цифровизации на примере арабографичных книг и тибетских рукописей.

Дискуссию открыл заместитель Министра науки и высшего образования Российской Федерации, член Президиума Российского исторического общества Константин Могилевский, отметивший глубину проникновения искусственного интеллекта во все сферы общественной жизни, в том числе в работу с архивными документами:

«Мы с вами находимся сейчас даже не на пороге, а уже на первом этапе бытования нового технологического уклада, связанного с цифровизацией всех сфер нашей жизни. С появлением искусственного интеллекта в тех сферах, в которых ещё год назад сложно было бы представить, что он сможет помочь человеку и даже в чём-то заменить человеческий труд. Это очень серьёзные вещи, которые происходят быстро. Те, кто сейчас не поймёт этих процессов во всех отраслях человеческой деятельности, рискуют безнадёжно отстать. Это касается и работы с письменным наследием».


«Большинство коллег из нашей сферы считают, что оцифровка — это сканирование. Если мы выйдем за пределы историко-архивного сообщества по всей стране, во всём мире оцифровка — это совсем другая организация процесса, это внедрение искусственного интеллекта <…> Поэтому необходимо приходить к пониманию того, что такое оцифровка в современном архивном деле в части, прежде всего, использования документов. Полагаю, коллеги подумают о том, как и в других направлениях архивного дела — хранении, учёте — может быть использован искусственный интеллект»,

— добавил Константин Могилевский.

На фото: Константин Могилевский

Его мысль продолжил ВРИО председателя Правления Российского исторического общества Руслан Гагкуев, подчеркнувший востребованность использования искусственного интеллекта в исторической науке:

«Я убеждён, что тема цифровизации письменного наследия России для подавляющего большинства историков — вопрос насущный и важный. Все мы постоянно в нашей каждодневной практике так или иначе работаем с письменными документами, источниками, рукописными текстами. Это всегда, с одной стороны, очень волнительно и ответственно, а с другой стороны, конечно, время, которое в ряде случаев нам приходится тратить на осмысление этих источников, на чтение тех почерков, которые относятся даже к ХХ веку, я не говорю про более ранние, очень значительно. Надеюсь, современные технологии и искусственный интеллект смогут в ближайшем будущем облегчить нашу работу и проводить исследования более быстро и качественно».

На фото: Руслан Гагкуев

В свою очередь, директор Санкт-Петербургского Института истории Российской академии наук, член Правления Российского исторического общества Алексей Сиренов наметил перспективы дальнейшего развития проекта «Digital Пётр» и отметил необходимость объединения усилий историков в работе по оцифровке документов:

«Мы сейчас видим, что по одному и тому же пути идут коллеги из разных научных центров. Сегодня у нас будет возможность познакомиться с результатами этой работы и с её ходом. Тут должна быть и Республика Татарстана, и Республика Бурятия и то, что мы делали с петровскими рукописями. Очевидно, что здесь нам нужно действовать скоординированно. Это, мне кажется, проблема, которую сегодняшний наш разговор может поставить и отчасти решить. Это не значит, что мы должны в одном ключе действовать, так как материалы разные. Тем не менее, координация здесь нужна, так как в конечном счёте мы делаем одно общее дело».

На фото: Алексей Сиренов
На круглом столе также выступили руководитель Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии Сибирского отделения РАН Олег Ринчинов, директор Российского государственного архива древних актов Владимир Аракчеев, исполнительный директор по исследованию данных Sber AI Денис Димитров и другие специалисты в области цифровизации архивных документов.

Подводя итоги дискуссии, Руслан Гагкуев подчеркнул значимость обсуждения проблем и перспектив цифровизации письменного наследия.

«По итогам работы круглого стола будем исходить из необходимости продолжения нашей работы, выработки практических мер»,

— резюмировал он.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.

Работа над оцифровкой документов Архивного фонда Российской Федерации и других архивных документов, включая размещённые в государственных архивах субъектов Российской Федерации и муниципальных архивах, в том числе с применением технологий искусственного интеллекта, ведётся Минцифры России совместно с Росархивом и Российской академией наук в рамках поручения Президента Российской Федерации по итогам совместного заседания Госсовета и Совета по науке и образованию (Пр-290, п. 8). Значительный вклад в этот процесс внесло и поручение Президента по итогам конференции по искусственному интеллекту в 2020 году (Пр-2242, п. 2), во исполнение которого в регионах России были разработаны и утверждены стратегии цифровой трансформации ключевых отраслей экономики, социальной сферы, государственного управления, предусматривающие внедрение конкурентоспособного отечественного программного обеспечения и программно-аппаратных комплексов, созданных в том числе на основе технологий искусственного интеллекта.

Российское историческое общество принимает деятельное участие в оцифровке архивов. Так, при поддержке фонда «История Отечества» создана Электронная библиотека исторических документов, в которой исследователи в открытом доступе смогут найти, в перспективе, все исторические документы, опубликованные в России с 1991 года. Портал позволяет читать документы на экране компьютера, делать по ним полнотекстовой поиск, а также просматривать с помощью системы Указателей.

Одним из наиболее крупных проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I Российским историческим обществом, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в максимально удобном и понятном формате расшифровку рукописей Петра Первого. В течение многих лет изучение выдающейся личности первого российского императора сдерживалось медленными темпами публикации его рукописного наследия. Первый сборник из серии «Письма и бумаги Петра Великого» вышел из печати ещё в 1887 году, однако и сегодня эта работа по-прежнему далека от своего завершения. Одной из причин её огромной трудоёмкости является неразборчивый почерк императора.

Решить эту проблемы и призван «Digital Пётр». В ходе работы над проектом в Санкт-Петербургском институте истории РАН была сформирована рабочая группа, состоящая из научных сотрудников — специалистов по истории Петровской эпохи, а также палеографии и археографии. Источниковой базой стали рукописи из собраний Санкт-Петербургского института истории РАН и Российского государственного архива древних актов. Командой проекта был выбран подход, основанный на нейронных сетях и глубоком обучении, с помощью которого на основе девяти тысяч строк петровских текстов разных лет параметры нейронной сети были адаптированы под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов. Подобное технологическое решение открывает новые перспективы не только в исследовании текстов Петра I, но и в изучении других рукописных документов. В настоящее время сотни тысяч документов по истории России XVII–XVIII веков остаются неизданными в том числе потому, что их чтение доступно только специалистам. Машинное распознавание скорописи существенно упростило бы задачу публикации таких источников.

Другим значимым проектом в сфере оцифровки архивных документов, основанным на технологиях искусственного интеллекта, стал «Поиск по архивам», разработанный Яндексом. Изначально команда проекта занималась генеалогическими исследованиями, но, столкнувшись с необходимостью вручную отсматривать множество сканов рукописных документов, чтобы найти информацию о родственниках, разработчики приняли решение во взаимодействии с архивными работниками создать сервис, с помощью нейронной сети автоматически распознающий рукописные тексты от XVIII до начала XX века.

Основой проекта стала технология оптического распознания символов — OCR, работа над использованием которой уже велась в Яндексе. Использовав первоначальную обучающую выборку в 2000 документов, команда проекта обучила нейронную сеть распознавать строки, расшифровывать их и группировать в смысловые блоки. На данный момент программа расшифровала уже более 4 миллионов страниц документов, которые теперь можно легко найти в поиске и прочесть, не тратя время на разбор рукописного текста.

Данные списка изображений не настроены

Текст: Михаил Дорофеев

Фото: Александр Шалгин

Фонд «История Отечества»

Мы в соцсетях

Вестник №1/2024

Поддержка научных трудов

Prev Next

Конференции поддержанные Фондом

В Твери открылась международная молодёжная историческая школа

В Твери открылась международная молодёжная историческая школа

22 апреля 2024 году в мультимедийном парке «Россия — моя история» в Твери стартовала VII Международная историческая школа. В этом году участниками Школы стали 150 студентов и молодых учёных из 31 страны мира.

 

В Оренбурге стартовала международная конференция «XII Большаковские чтения»

В Оренбурге стартовала международная конференция «XII Большаковские чтения»

17 апреля 2024 года в Оренбурге стартовала ежегодная международная конференция «XII Большаковские чтения». Участие в конференции принимают около 200 специалистов, включая более 80 докторов и 90 кандидатов наук из научных центров России, а также учёных из Казахстана, Узбекистана и Киргизстана.

 

В Твери состоялась церемония награждения победителей второй Школы-съезда

В Твери состоялась церемония награждения победителей второй Школы-съезда

26 ноября 2023 года в коворкинге «Точка кипения» Тверского государственного университета прошла церемония награждения участников Школы-съезда молодых историков и представителей Молодёжного медиацентра при Минобрнауки России.

 

Выставки и экспозиции поддержанные Фондом

В Москве открылась выставка к 105-летию выхода первого «Окна сатиры РОСТА»

23 апреля 2024 года в Выставочном зале федеральных архивов в Москве открылась выставка «Владимир Маяковский: “Пятнами красок и звоном лозунгов”. К 105-летию выхода первого “Окна сатиры РОСТА”»

23 апреля 2024 года в Выставочном зале федеральных архивов в Москве открылась выставка «Владимир Маяковский: “Пятнами красок и звоном лозунгов”. К 105-летию выхода первого “Окна сатиры РОСТА”».

 

В Алтайском крае состоялось открытие выставки «Обыкновенный нацизм»

В Алтайском крае состоялось открытие выставки «Обыкновенный нацизм»

19 апреля 2024 года в Барнауле в галерее Universum Алтайского государственного университета прошло торжественное открытие выставки «Обыкновенный нацизм», посвящённой трагедии мирного населения Донбасса и преступлениям украинских неонацистов.

 

В Доме Российского исторического общества открылась выставка, посвящённая ордену Святого Георгия

В Доме Российского исторического общества открылась выставка, посвящённая ордену Святого Георгия

18 марта 2024 года в Доме Российского исторического общества состоялось открытие выставки, посвящённой ордену Святого Георгия.

 

Документальные фильмы поддержанные Фондом

Фильм о Софье Федорченко — призёр II кинофестиваля «Российский хронограф»

Фильм о Софье Федорченко — призёр II кинофестиваля «Российский хронограф»

Фильм «Софья Федорченко, сестра милосердия, или Как отомстил Демьян», поддержанный фондом «История Отечества», занял 2-е место в номинации «Историческое наследие в архивных источниках» II Всероссийского кинофестиваля архивных фильмов «Российский хронограф».

 

Документальный фильм «Империя: воля и мир» о Великой Российской империи

763254812547519725491242.jpg

«А мы попробуем любовью, а там посмотрим, что сильней», - эти слова великого российского поэта Ф.И. Тютчева можно привести в качестве эпиграфа к фильму.

 

Документальный фильм «Путешествие в Архив» к 100-летию Архивной службы России

82159861982956192598612985691652986192856125.jpg

Кинопроект «Путешествие в Архив» посвящен 100-летию Архивной службы России. «Россия - великая архивная держава, архивная отрасль отвечает за сохранение национальной памяти», - эти слова, произнесенные в эксклюзивном интервью создателям фильма руководителем Федерального архивного агентства Андреем Артизовым в полной мере отражают роль и предназначение отечественных архивов.

 

Археологические экспедиции и исследования поддержанные Фондом

В Кыргызстане завершилась Центральноазиатская археологическая полевая школа

В Кыргызстане завершилась Центральноазиатская археологическая полевая школа

С 10 по 20 июля 2023 года в Кыргызстане состоялась Центральноазиатская археологическая полевая школа. Международный научный проект организован Институтом археологии и этнографии СО РАН совместно с Кыргызским национальным университетом им. Ж. Баласагына, Ошским государственным университетом и международной лабораторией ZooSCAn.

 

Молодёжная полевая школа «Археологическое наследие Алтая» стартовала в Новосибирске

Молодёжная полевая школа «Археологическое наследие Алтая» стартовала в Новосибирске

5 июля 2023 года в Новосибирске начала работу молодежная полевая школа «Археологическое наследие Алтая», которая направлена на продолжение традиции участия молодёжи в академических экспедициях, популяризацию археологического наследия исторического региона и повышение престижа профессии археолога.

 

В ИАЭТ пройдёт молодёжная конференция и студенческие полевые школы

В ИАЭТ пройдёт молодёжная конференция и студенческие полевые школы

В Институте археологии и этнографии Сибирского отделения РАН пройдёт молодёжная конференция и студенческие полевые школы в Киргизии и на Алтае. Эти проекты поддержал фонд «История Отечества».

 

ОНЛАЙН ПРОЕКТЫ поддержанные Фондом

Историко-документальная интернет-выставка «Обстоятельства повелительно требуют»

Федеральное архивное агентство, Российское Историческое Общество, Российский государственный архив социально-политической истории, при участии Государственного архива Российской Федерации, при поддержке фонда «История Отечества» представляют историко-документальную интернет-выставку к 100-летию образования СССР

 

Онлайн-проект посвящённый Михаилу Пришвину запущен в Смоленске

В Смоленске запущен онлайн-проект про Михаила Пришвина

При поддержке фонда «История Отечества» успешно реализован историко-просветительский онлайн-проект «Смоленский текст: пришвинские главы», приуроченный к 150-летию Михаила Пришвина.

 

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

1 ноября на официальном сайте музея был опубликован онлайн-каталог «“…Можете рассчитывать на меня”: научное наследие В.К. Арсеньева в собрании Российского этнографического музея».