Научно-практическая конференция «Приоритизация оцифровки архивных документов»

8 июня 2023 года в Российском государственном социальном университете стартовала Всероссийская научно-практическая конференция «Приоритизация оцифровки архивных документов для образовательных, научных и иных социальных целей».

Дискуссия, проходящая при поддержке фонда «История Отечества», посвящена вопросу внедрения возможностей искусственного интеллекта в архивную отрасль и научные исследования.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.


С приветственным словом к участникам мероприятия обратился ректор Российского государственного социального университета, академик РАХ Андрей Хазин. Он отметил, что идея проведения конференции принадлежит Российскому историческому обществу, и сообщил, что оцифровка документов открывает много возможностей и позволяет по-новому взглянуть на историю России.

«Уверен, результаты сегодняшней конференции будут способствовать решению масштабной задачи по сохранению богатейшего исторического и духовного наследия нашей многонациональной страны. Искренне желаю всем участникам конференции яркой плодотворной работы, творческих успехов и новых решений во благо нашего Отечества. В добрый путь»,

— заключил он.

Научно-практическая конференция «Приоритизация оцифровки архивных документов»

Также участников конференции поприветствовал заместитель Министра науки и высшего образования, член Президиума Российского исторического общества Константин Могилевский, обративший внимание на роль искусственного интеллекта в процессе обработки архивных документов:

«Не бывает исторической науки без использования архивных документов. Говоря об исторической науке, говоря об источниках исторического знания, мы, конечно, говорим об архивах, думаем о совершенствовании архивного дела. В этой связи, учитывая очень быстрые изменения, которые происходят в мире, в котором мы живём, в мире, который очень быстро становится цифровым, нельзя обойти вниманием и вопросы оцифровки архивных документов».

Он отметил, что одной из важнейших задач, стоящих перед архивным и историческим сообществом, является необходимость определить, что такое оцифровка архивных документов.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.


«Сегодня совершенно понятно, что искусственный интеллект с быстрой и пугающей скоростью входит в нашу жизнь. Понятно, что оцифровка в современном понимании никак не может исключать вопросы искусственного интеллекта. На мой взгляд, мы стоим на пороге больших перемен, связанных с возможностью анализа большого количества данных. Они касаются не только упрощения физического доступа к архивным документам, но и обработки архивных документов при помощи искусственного интеллекта»,

— подчеркнул Константин Могилевский.

В свою очередь, ВРИО председателя Правления Российского исторического общества Руслан Гагкуев отметил, что предстоит большая работа по выработке инструментария, который позволит наилучшим образом реализовать оцифровку архивных документов, и рассказал о трёх уже работающих проектах по оцифровке архивных документов.

«Для Российского исторического общества оцифровка архивных источников — одно из приоритетных направлений работы. По мнению многих экспертов РИО, оцифровка на нынешнем этапе может заключаться в двух этапах: это сканирование, которое сейчас ведётся в федеральных и региональных архивах. Второй этап, о котором сейчас говорил Константин Ильич, — это использование современных технологий для распознавания текста. Здесь предстоит большая работа»,

— отметил он.


На фото: Руслан Гагкуев

Одним из проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I РИО, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в удобном и понятном формате расшифровку рукописей Петра Первого. С помощью технологии глубокого обучения на основе девяти тысяч строк петровских текстов разных лет авторы проекта адаптировали параметры нейронной сети под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.

Работа по цифровизации письменного наследия с помощью искусственного интеллекта ведётся во многих регионах России. Одна из подобных инициатив — проект Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН. В 2021 году Сибирское отделение РАН, Новосибирский государственный университет и Центр искусственного интеллекта МТС запустили пилотный проект по применению ИИ для распознавания тибетской письменности. С помощью глубокого обучения в ходе проекта удалось добиться точности распознавания отдельных тибетских символов в 94 %.

Над оцифровкой архивных документов работают и специалисты из Татарстана. В Центре письменного наследия Института языка, литературы и искусства Академии наук Республики Татарстан реализуется проект по цифровизации арабографичных письменных источников. Команда проекта разработала программу «Miras-Tat», позволяющую переводить старотатарские печатные источники сначала в арабицу, а потом в кириллицу. Сейчас результат машинного распознавания текстов достигает 75%. В перспективе программа может быть масштабирована и обучена работе с рукописным текстом, а также с арабографичными источниками на других тюркских языках


Пилотный проект по организации оцифровки документов Архивного фонда разработан и в Российском государственном социальном университете. О нём в ходе конференции рассказал заведующий кафедрой генеалогии и современной архивной работы РГСУ Александр Барков.

Напомним, оцифровке архивных документов и перспективам использования искусственного интеллекта в архивной отрасли был посвящён круглый стол «Цифровизация письменного наследия России: проблемы и перспективы», состоявшийся 22 марта 2023 года в Доме Российского исторического общества.

Текст: Диана Шакирова

Фото: Александр Шалгин

Фонд «История Отечества»

Мы в соцсетях

Вестник №2/2025

Поддержка научных трудов

Конференции поддержанные Фондом

В Перми состоялось открытие XVI Конгресса антропологов и этнологов России

В Перми состоялось открытие XVI Конгресса антропологов и этнологов России

2 июля 2025 года в Перми состоялось торжественное открытие XVI Конгресса антропологов и этнологов России. Конгресс, ведущий свою историю с 1995 года, является крупнейшим научным событием в области отечественной этнологии и проходит раз в два года в разных городах России.

 

Проведение XVI Конгресса антропологов и этнологов России обсудили на пресс-конференции в Перми

Проведение XVI Конгресса антропологов и этнологов России обсудили на пресс-конференции в Перми

2 июля 2025 года в Перми состоялась пресс-конференция, предваряющая открытие XVI Конгресса антропологов и этнологов России.

 

В Туве состоялась конференция, посвящённая кочевым цивилизациям Центральной и Северной Азии

В Туве состоялась конференция, посвящённая кочевым цивилизациям Центральной и Северной Азии

С 19 по 21 июня 2025 года Туве состоялась IV Всероссийская научно-практическая конференция «Кочевые цивилизации народов Центральной и Северной Азии: история, состояние, проблемы».

 

Выставки и экспозиции поддержанные Фондом

Выставка «Этнофото: традиция и культура в объективе» открылась в рамках Конгресса антропологов и этнологов

На XVI Конгрессе антропологов и этнологов России открылась выставка

2 июля 2025 года на полях XVI Конгресса антропологов и этнологов России открылась фотовыставка «Этнофото: традиция и культура в объективе».

 

В Пскове открылась планшетная выставка «80 лет Великой Победе. Факты против мифов»

В Пскове открылась планшетная выставка «80 лет Великой Победе. Факты против мифов»

На площадке Псковской областной научной библиотеки имени В.Я. Курбатова открылась планшетная выставка «80 лет Великой Победе. Факты против мифов».

 

В Кирове открылась выставка, посвящённая фронтовым корреспондентам в годы войны

В Кирове открылась выставка, посвящённая фронтовым корреспондентам в годы войны

7 мая 2025 года на набережной Грина в Кирове в рамках масштабного историко-документального проекта «Поколение Победителей» открылась выставка «Военкоры на защите Отечества», посвящённая летописцам войны — уроженцам и жителям Кировской области, чей подвиг вошёл в историю несчётными тиражами газетных статей, фронтовых сводок, фотографий и кинохроникой с мест событий.

 

Документальные фильмы поддержанные Фондом

Документальный фильм «Ледокол "Красин". Миссия спасать»

krasin1625t1252.jpg

Фильм «Ледокол "Красин". Миссия спасать» рассказывает о жизненном пути легендарного судна, стяжавшего славу своими героическими спасательными операциями.

 

Документальный фильм «Генерал Пушкин», приурочен к 225-летию со дня рождения поэта

Фильм приурочен к 225-летию со дня рождения Александра Сергеевича Пушкина и рассказывает о его сыне, выдающемся русском офицере и государственном деятеле Александре Александровиче Пушкине.

 

Специальный приз кинофестиваля «Русское зарубежье» получил фильм «Я найду тебя, отец!»

Специальный приз кинофестиваля «Русское зарубежье» получил фильм «Я найду тебя, отец!»

14 ноября 2024 года в Доме русского зарубежья имени Александра Солженицына состоялось вручение наград XVIII Международного кинофестиваля «Русское зарубежье». Фильм «Я найду тебя, отец!», созданный при поддержке фонда «История Отечества», получил специальный приз жюри в номинации лучших неигровых фильмов.

 

Археологические экспедиции и исследования поддержанные Фондом

В Новосибирске молодые археологи приступили к занятиям в полевой школе «Древности Саяно-Алтая»

В Новосибирске молодые археологи приступили к занятиям в полевой школе «Древности Саяно-Алтая»

В Институте археологии и этнографии Сибирского отделения РАН стартовала молодёжная полевая школа «Древности Саяно-Алтая». Школа работает при поддержке фонда «История Отечества» и предоставляет студентам уникальную возможность стать участниками археологических экспедиций под руководством ведущих специалистов института.

 

В Институте археологии РАН обсудили новые материалы и методы археологического исследования

В Институте археологии РАН обсудили новые материалы и методы археологического исследования

С 1 по 4 апреля 2025 года в Институте археологии РАН состоялась VIII конференция молодых учёных «Новые материалы и методы археологического исследования: территории и границы в археологическом измерении».

 

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

С 10 по 12 сентября 2024 года в Екатеринбурге состоялись «IX Уральские археографические чтения», посвящённые 50-летию Уральского археографического центра.

 

ОНЛАЙН ПРОЕКТЫ поддержанные Фондом

Историко-документальная интернет-выставка «Обстоятельства повелительно требуют»

Федеральное архивное агентство, Российское Историческое Общество, Российский государственный архив социально-политической истории, при участии Государственного архива Российской Федерации, при поддержке фонда «История Отечества» представляют историко-документальную интернет-выставку к 100-летию образования СССР

 

Онлайн-проект посвящённый Михаилу Пришвину запущен в Смоленске

В Смоленске запущен онлайн-проект про Михаила Пришвина

При поддержке фонда «История Отечества» успешно реализован историко-просветительский онлайн-проект «Смоленский текст: пришвинские главы», приуроченный к 150-летию Михаила Пришвина.

 

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

1 ноября на официальном сайте музея был опубликован онлайн-каталог «“…Можете рассчитывать на меня”: научное наследие В.К. Арсеньева в собрании Российского этнографического музея».