Научно-практическая конференция «Приоритизация оцифровки архивных документов»

8 июня 2023 года в Российском государственном социальном университете стартовала Всероссийская научно-практическая конференция «Приоритизация оцифровки архивных документов для образовательных, научных и иных социальных целей».

Дискуссия, проходящая при поддержке фонда «История Отечества», посвящена вопросу внедрения возможностей искусственного интеллекта в архивную отрасль и научные исследования.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.


С приветственным словом к участникам мероприятия обратился ректор Российского государственного социального университета, академик РАХ Андрей Хазин. Он отметил, что идея проведения конференции принадлежит Российскому историческому обществу, и сообщил, что оцифровка документов открывает много возможностей и позволяет по-новому взглянуть на историю России.

«Уверен, результаты сегодняшней конференции будут способствовать решению масштабной задачи по сохранению богатейшего исторического и духовного наследия нашей многонациональной страны. Искренне желаю всем участникам конференции яркой плодотворной работы, творческих успехов и новых решений во благо нашего Отечества. В добрый путь»,

— заключил он.

Научно-практическая конференция «Приоритизация оцифровки архивных документов»

Также участников конференции поприветствовал заместитель Министра науки и высшего образования, член Президиума Российского исторического общества Константин Могилевский, обративший внимание на роль искусственного интеллекта в процессе обработки архивных документов:

«Не бывает исторической науки без использования архивных документов. Говоря об исторической науке, говоря об источниках исторического знания, мы, конечно, говорим об архивах, думаем о совершенствовании архивного дела. В этой связи, учитывая очень быстрые изменения, которые происходят в мире, в котором мы живём, в мире, который очень быстро становится цифровым, нельзя обойти вниманием и вопросы оцифровки архивных документов».

Он отметил, что одной из важнейших задач, стоящих перед архивным и историческим сообществом, является необходимость определить, что такое оцифровка архивных документов.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.


«Сегодня совершенно понятно, что искусственный интеллект с быстрой и пугающей скоростью входит в нашу жизнь. Понятно, что оцифровка в современном понимании никак не может исключать вопросы искусственного интеллекта. На мой взгляд, мы стоим на пороге больших перемен, связанных с возможностью анализа большого количества данных. Они касаются не только упрощения физического доступа к архивным документам, но и обработки архивных документов при помощи искусственного интеллекта»,

— подчеркнул Константин Могилевский.

В свою очередь, ВРИО председателя Правления Российского исторического общества Руслан Гагкуев отметил, что предстоит большая работа по выработке инструментария, который позволит наилучшим образом реализовать оцифровку архивных документов, и рассказал о трёх уже работающих проектах по оцифровке архивных документов.

«Для Российского исторического общества оцифровка архивных источников — одно из приоритетных направлений работы. По мнению многих экспертов РИО, оцифровка на нынешнем этапе может заключаться в двух этапах: это сканирование, которое сейчас ведётся в федеральных и региональных архивах. Второй этап, о котором сейчас говорил Константин Ильич, — это использование современных технологий для распознавания текста. Здесь предстоит большая работа»,

— отметил он.


На фото: Руслан Гагкуев

Одним из проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I РИО, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в удобном и понятном формате расшифровку рукописей Петра Первого. С помощью технологии глубокого обучения на основе девяти тысяч строк петровских текстов разных лет авторы проекта адаптировали параметры нейронной сети под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.

Работа по цифровизации письменного наследия с помощью искусственного интеллекта ведётся во многих регионах России. Одна из подобных инициатив — проект Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН. В 2021 году Сибирское отделение РАН, Новосибирский государственный университет и Центр искусственного интеллекта МТС запустили пилотный проект по применению ИИ для распознавания тибетской письменности. С помощью глубокого обучения в ходе проекта удалось добиться точности распознавания отдельных тибетских символов в 94 %.

Над оцифровкой архивных документов работают и специалисты из Татарстана. В Центре письменного наследия Института языка, литературы и искусства Академии наук Республики Татарстан реализуется проект по цифровизации арабографичных письменных источников. Команда проекта разработала программу «Miras-Tat», позволяющую переводить старотатарские печатные источники сначала в арабицу, а потом в кириллицу. Сейчас результат машинного распознавания текстов достигает 75%. В перспективе программа может быть масштабирована и обучена работе с рукописным текстом, а также с арабографичными источниками на других тюркских языках


Пилотный проект по организации оцифровки документов Архивного фонда разработан и в Российском государственном социальном университете. О нём в ходе конференции рассказал заведующий кафедрой генеалогии и современной архивной работы РГСУ Александр Барков.

Напомним, оцифровке архивных документов и перспективам использования искусственного интеллекта в архивной отрасли был посвящён круглый стол «Цифровизация письменного наследия России: проблемы и перспективы», состоявшийся 22 марта 2023 года в Доме Российского исторического общества.

Текст: Диана Шакирова

Фото: Александр Шалгин

Фонд «История Отечества»

Мы в соцсетях

Вестник №3/2024

Поддержка научных трудов

Конференции поддержанные Фондом

В Архангельске состоялась XI Всероссийская исследовательская историческая школа молодых учёных

В Архангельске состоялась XI Всероссийская исследовательская историческая школа молодых учёных

6 ноября 2024 года в Северном (Арктическом) федеральном университете имени Михаила Ломоносова прошло открытие XI Всероссийской исследовательской школы студентов, аспирантов и молодых учёных «Русский Север и Арктика: фундаментальные проблемы истории и современности».

 

В Новосибирске подвели итоги конференции, посвящённой творчеству каменного века

В Новосибирске подвели итоги конференции, посвящённой творчеству каменного века

С 21 по 24 октября 2024 года в Институте археологии и этнографии Сибирского отделения Российской академии наук в Новосибирске работала всероссийская (с международным участием) научная конференция «Знаки и образы в искусстве каменного века», приуроченная к 300-летию Российской академии наук.

 

В Омске состоялись IV военно-исторические чтения


В Омске состоялись IV военно-исторические чтения

1 ноября 2024 года в столице Омской области прошли IV Омские военно-исторические чтения «Сибирские формирования в военных конфликтах XVI–XXI веков. На пути к 80-летию Великой Победы».

 

Выставки и экспозиции поддержанные Фондом

В РНБ открылась выставка, посвящённая первому русскому книгопечатнику Ивану Фёдорову

В РНБ открылась выставка, посвящённая первому русскому книгопечатнику Ивану Фёдорову

30 октября 2024 года в Российской национальной библиотеке состоялось открытие планшетной выставки «Иван Фёдоров и начало книгопечатания в восточнославянских землях», созданная при поддержке фонда «История Отечества».

 

В Астраханском краеведческом музее открылась выставка буддийских артефактов

В Астраханском краеведческом музее открылась выставка буддийских артефактов

Выставка «Традиционная буддийская культура калмыков в исследованиях академических экспедиций. Из коллекции Астраханского музея-заповедника XIX — начала XX веков» создана в рамках одноимённого экспозиционно-выставочного проекта, который реализуется при поддержке фонда «История Отечества». Она приурочена к 300-летнему юбилею Российской академии наук.

 

В Государственном историческом музее состоялось открытие выставки «Ленин»

В Государственном историческом музее состоялось открытие выставки «Ленин»

16 октября 2024 года в Государственном историческом музее открылась выставка «Ленин». Экспозиция, посвящённая 100-летию со дня смерти основателя большевистской партии, подготовлена при поддержке фонда «История Отечества».

 

Документальные фильмы поддержанные Фондом

Презентация книги о Борисе Вилькицком и исследовании Арктики состоялась в Доме РИО

В РИО состоялась презентация книги о Борисе Вилькицком и исследовании Арктики

24 августа в Доме Российского исторического общества состоялась презентации книги «Б.А. Вилькицкий и Гидрографическая экспедиция Северного Ледовитого океана. 1914–1915» и документального фильма «Борис Вилькицкий. Северный морской путь», созданного при поддержке фонда «История Отечества».

 

Фильм о Софье Федорченко — призёр II кинофестиваля «Российский хронограф»

Фильм о Софье Федорченко — призёр II кинофестиваля «Российский хронограф»

Фильм «Софья Федорченко, сестра милосердия, или Как отомстил Демьян», поддержанный фондом «История Отечества», занял 2-е место в номинации «Историческое наследие в архивных источниках» II Всероссийского кинофестиваля архивных фильмов «Российский хронограф».

 

Документальный фильм об уникальной русской деревне Александровка

9178258916925618259819256125.jpg

Фильм рассказывает об уникальной русской деревне Александровка, расположенной в Потсдаме, в самом центре Германии. Это русское поселение, построенное еще в начале XIX века, до сегодняшнего дня хранит память о своей далекой Родине.

 

Археологические экспедиции и исследования поддержанные Фондом

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

С 10 по 12 сентября 2024 года в Екатеринбурге состоялись «IX Уральские археографические чтения», посвящённые 50-летию Уральского археографического центра.

 

В Амурской области продолжаются археологические раскопки городища около реки Зея

В Амурской области продолжаются археологические раскопки городища около реки Зея

1 июля 2024 года стартовала спасательная археологическая экспедиция Центра по сохранению историко-культурного наследия Амурской области на памятнике археологии «Гащенка, городище-1».

 

Стартовала молодёжная полевая школа «Археологическое наследие Алтая-2024»

Стартовала молодёжная полевая школа «Археологическое наследие Алтая-2024»

В июле 2024 года на Алтае при поддержке фонда «История Отечества» в третий раз работает молодёжная полевая археологическая школа. Занятия организованы Институтом археологии и этнографии Сибирского отделения РАН совместно с Гуманитарным институтом Новосибирского государственного университета.

 

ОНЛАЙН ПРОЕКТЫ поддержанные Фондом

Историко-документальная интернет-выставка «Обстоятельства повелительно требуют»

Федеральное архивное агентство, Российское Историческое Общество, Российский государственный архив социально-политической истории, при участии Государственного архива Российской Федерации, при поддержке фонда «История Отечества» представляют историко-документальную интернет-выставку к 100-летию образования СССР

 

Онлайн-проект посвящённый Михаилу Пришвину запущен в Смоленске

В Смоленске запущен онлайн-проект про Михаила Пришвина

При поддержке фонда «История Отечества» успешно реализован историко-просветительский онлайн-проект «Смоленский текст: пришвинские главы», приуроченный к 150-летию Михаила Пришвина.

 

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

1 ноября на официальном сайте музея был опубликован онлайн-каталог «“…Можете рассчитывать на меня”: научное наследие В.К. Арсеньева в собрании Российского этнографического музея».