Научно-практическая конференция «Приоритизация оцифровки архивных документов»

8 июня 2023 года в Российском государственном социальном университете стартовала Всероссийская научно-практическая конференция «Приоритизация оцифровки архивных документов для образовательных, научных и иных социальных целей».

Дискуссия, проходящая при поддержке фонда «История Отечества», посвящена вопросу внедрения возможностей искусственного интеллекта в архивную отрасль и научные исследования.

Оцифровка документов Архивного фонда Российской Федерации и других архивных документов, которая ведётся уже несколько лет, даёт исследователям и посетителям архивов несколько неоспоримых преимуществ — это и возможность легко получить доступ к интересующему документу, и обеспечение его сохранности, и возможность высвобождения архивных площадей.


С приветственным словом к участникам мероприятия обратился ректор Российского государственного социального университета, академик РАХ Андрей Хазин. Он отметил, что идея проведения конференции принадлежит Российскому историческому обществу, и сообщил, что оцифровка документов открывает много возможностей и позволяет по-новому взглянуть на историю России.

«Уверен, результаты сегодняшней конференции будут способствовать решению масштабной задачи по сохранению богатейшего исторического и духовного наследия нашей многонациональной страны. Искренне желаю всем участникам конференции яркой плодотворной работы, творческих успехов и новых решений во благо нашего Отечества. В добрый путь»,

— заключил он.

Научно-практическая конференция «Приоритизация оцифровки архивных документов»

Также участников конференции поприветствовал заместитель Министра науки и высшего образования, член Президиума Российского исторического общества Константин Могилевский, обративший внимание на роль искусственного интеллекта в процессе обработки архивных документов:

«Не бывает исторической науки без использования архивных документов. Говоря об исторической науке, говоря об источниках исторического знания, мы, конечно, говорим об архивах, думаем о совершенствовании архивного дела. В этой связи, учитывая очень быстрые изменения, которые происходят в мире, в котором мы живём, в мире, который очень быстро становится цифровым, нельзя обойти вниманием и вопросы оцифровки архивных документов».

Он отметил, что одной из важнейших задач, стоящих перед архивным и историческим сообществом, является необходимость определить, что такое оцифровка архивных документов.

Оцифровка является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.


«Сегодня совершенно понятно, что искусственный интеллект с быстрой и пугающей скоростью входит в нашу жизнь. Понятно, что оцифровка в современном понимании никак не может исключать вопросы искусственного интеллекта. На мой взгляд, мы стоим на пороге больших перемен, связанных с возможностью анализа большого количества данных. Они касаются не только упрощения физического доступа к архивным документам, но и обработки архивных документов при помощи искусственного интеллекта»,

— подчеркнул Константин Могилевский.

В свою очередь, ВРИО председателя Правления Российского исторического общества Руслан Гагкуев отметил, что предстоит большая работа по выработке инструментария, который позволит наилучшим образом реализовать оцифровку архивных документов, и рассказал о трёх уже работающих проектах по оцифровке архивных документов.

«Для Российского исторического общества оцифровка архивных источников — одно из приоритетных направлений работы. По мнению многих экспертов РИО, оцифровка на нынешнем этапе может заключаться в двух этапах: это сканирование, которое сейчас ведётся в федеральных и региональных архивах. Второй этап, о котором сейчас говорил Константин Ильич, — это использование современных технологий для распознавания текста. Здесь предстоит большая работа»,

— отметил он.


На фото: Руслан Гагкуев

Одним из проектов в области оцифровки архивных документов с применением искусственного интеллекта является «Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I РИО, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в удобном и понятном формате расшифровку рукописей Петра Первого. С помощью технологии глубокого обучения на основе девяти тысяч строк петровских текстов разных лет авторы проекта адаптировали параметры нейронной сети под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97 %, при этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.

Работа по цифровизации письменного наследия с помощью искусственного интеллекта ведётся во многих регионах России. Одна из подобных инициатив — проект Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН. В 2021 году Сибирское отделение РАН, Новосибирский государственный университет и Центр искусственного интеллекта МТС запустили пилотный проект по применению ИИ для распознавания тибетской письменности. С помощью глубокого обучения в ходе проекта удалось добиться точности распознавания отдельных тибетских символов в 94 %.

Над оцифровкой архивных документов работают и специалисты из Татарстана. В Центре письменного наследия Института языка, литературы и искусства Академии наук Республики Татарстан реализуется проект по цифровизации арабографичных письменных источников. Команда проекта разработала программу «Miras-Tat», позволяющую переводить старотатарские печатные источники сначала в арабицу, а потом в кириллицу. Сейчас результат машинного распознавания текстов достигает 75%. В перспективе программа может быть масштабирована и обучена работе с рукописным текстом, а также с арабографичными источниками на других тюркских языках


Пилотный проект по организации оцифровки документов Архивного фонда разработан и в Российском государственном социальном университете. О нём в ходе конференции рассказал заведующий кафедрой генеалогии и современной архивной работы РГСУ Александр Барков.

Напомним, оцифровке архивных документов и перспективам использования искусственного интеллекта в архивной отрасли был посвящён круглый стол «Цифровизация письменного наследия России: проблемы и перспективы», состоявшийся 22 марта 2023 года в Доме Российского исторического общества.

Текст: Диана Шакирова

Фото: Александр Шалгин

Фонд «История Отечества»

Мы в соцсетях

Вестник №1/2025

Поддержка научных трудов

Конференции поддержанные Фондом

Деятели науки и культуры Бурятии отмечены наградами Посольства России в Монголии

Деятели науки и культуры Бурятии отмечены наградами Посольства России в Монголии

Вклад учёных Института монголоведения, буддологии и тибетологии СО РАН и сотрудников Национального музея Республики Бурятия в изучение и сохранение памяти о Победе советско-монгольских войск на реке Халхин-Гол отмечен наградами Посольства Российской Федерации в Монголии.

 

Круглый стол, посвящённый 150-летию со дня рождения А.В. Колчака, прошёл в Тюмени

Круглый стол, посвящённый 150-летию со дня рождения А.В. Колчака, прошёл в Тюмени

28 ноября 2024 года в Институте социально-гуманитарных наук Тюменского государственного университета прошёл круглый стол, посвящённый 150-летию со дня рождения Александра Васильевича Колчака.

 

В ходе Конференции молодых учёных обсудили вопросы развития гуманитарной науки в Новороссии

В ходе Конференции молодых учёных обсудили вопросы развития гуманитарной науки в Новороссии

27 ноября 2024 года на федеральной территории «Сириус» стартовал IV Конгресс молодых учёных – ключевое события в рамках Десятилетия науки и технологий в России. В рамках Конгресса состоялась историческая секция «Наука на переднем крае: развитие гуманитарного знания в Новороссии».

 

Выставки и экспозиции поддержанные Фондом

Выставка об истории военной медицины открылась в музее «Подвиг» Бердянска

Выставка об истории военной медицины открылась в музее «Подвиг» Бердянска

В музее «Подвиг» Бердянска Запорожской области состоялось открытие планшетной выставки «Неся любовь и милосердие в той немилосердной войне…», охватывающей ключевые периоды российской военной истории — от Отечественной войны 1812 года до сегодняшних событий СВО.

 

На круглом столе в Музее медицины обсудили историческую преемственность военных медиков

На круглом столе в Музее медицины обсудили историческую преемственность военных медиков

27 февраля 2025 года в Российском музее медицины Национального НИИ общественного здоровья имени Н.А. Семашко состоялся круглый стол, посвящённый истории военной медицины в XX-XXI веках.

 

В Доме РИО обсудили историю ИАИ РГГУ и развитие архивного образования в России

В Доме РИО обсудили историю ИАИ РГГУ и развитие архивного образования в России

12 декабря 2024 года в Доме Российского исторического общества состоялся круглый стол, посвящённый истории Историко-архивного института РГГУ и развитию архивного образования в России.

 

Документальные фильмы поддержанные Фондом

Фильм «Революция и Конституция или мина замедленного действия»

127659816256129851252.jpg

Фильм «Революция и Конституция» - экранизация истории борьбы за правовое государство в России, которая разворачивалась на ландшафте Российской империи на протяжении 19-го - первой четверти 20-го века.

 

Цикл документальных фильмов «Моя война. Освобождение Европы»

Цикл документальных фильмов «Моя война. Освобождение Европы»

Цикл фильмов «Моя война. Освобождение Европы» посвящен 80-летию начала освобождения Красной армией стран Европы и включает 4 документальных фильма.

 

Фильм о Софье Федорченко — призёр XV кинофестиваля «Русское зарубежье»

Фильм о Софье Федорченко — призёр XV Международного кинофестиваля «Русское зарубежье»

Фильм «Софья Федорченко, сестра милосердия, или Как отомстил Демьян», поддержанный фондом «История Отечества», получил главный приз конкурса неигровых картин XV Международного кинофестиваля «Русское зарубежье». Торжественная церемония прошла в Москве.

 

Археологические экспедиции и исследования поддержанные Фондом

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

В Екатеринбурге состоялась конференция «IX Уральские археографические чтения»

С 10 по 12 сентября 2024 года в Екатеринбурге состоялись «IX Уральские археографические чтения», посвящённые 50-летию Уральского археографического центра.

 

В Амурской области продолжаются археологические раскопки городища около реки Зея

В Амурской области продолжаются археологические раскопки городища около реки Зея

1 июля 2024 года стартовала спасательная археологическая экспедиция Центра по сохранению историко-культурного наследия Амурской области на памятнике археологии «Гащенка, городище-1».

 

Стартовала молодёжная полевая школа «Археологическое наследие Алтая-2024»

Стартовала молодёжная полевая школа «Археологическое наследие Алтая-2024»

В июле 2024 года на Алтае при поддержке фонда «История Отечества» в третий раз работает молодёжная полевая археологическая школа. Занятия организованы Институтом археологии и этнографии Сибирского отделения РАН совместно с Гуманитарным институтом Новосибирского государственного университета.

 

ОНЛАЙН ПРОЕКТЫ поддержанные Фондом

Историко-документальная интернет-выставка «Обстоятельства повелительно требуют»

Федеральное архивное агентство, Российское Историческое Общество, Российский государственный архив социально-политической истории, при участии Государственного архива Российской Федерации, при поддержке фонда «История Отечества» представляют историко-документальную интернет-выставку к 100-летию образования СССР

 

Онлайн-проект посвящённый Михаилу Пришвину запущен в Смоленске

В Смоленске запущен онлайн-проект про Михаила Пришвина

При поддержке фонда «История Отечества» успешно реализован историко-просветительский онлайн-проект «Смоленский текст: пришвинские главы», приуроченный к 150-летию Михаила Пришвина.

 

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

Российский этнографический музей представил проект к 150-летию Владимира Арсеньева

1 ноября на официальном сайте музея был опубликован онлайн-каталог «“…Можете рассчитывать на меня”: научное наследие В.К. Арсеньева в собрании Российского этнографического музея».