Российские ученые обучили ИИ читать хрупкие свитки, не раскрывая их

Российские ученые обучили ИИ читать хрупкие свитки и книги нажатием одной кнопки

Российские ученые обучили искусственный интеллект читать хрупкие свитки и книги нажатием одной кнопки, не раскрывая их, это поможет сохранить ценные старинные источники и снизить риски их повреждения, сообщили в компании-разработчике данной технологии Smart Engines (SE).

Это первая полностью автоматическая система виртуального разворачивания свитков, не требующая вмешательства человека

"Ученые российской компании Smart Engines и ФИЦ ИУ РАН (Федерального исследовательского центра "Информатика и управление" РАН – ред.) обучили искусственный интеллект извлекать содержимое хрупких свитков, не разворачивая их. Теперь получить восстановленный текст из манускрипта можно нажатием одной кнопки. Разработка позволит изучать тексты бумажных, берестяных и серебряных свитков и печатных книг, которые пострадали вследствие естественного старения, воздействия влажности или пожаров, и хранятся в особых условиях", - говорится в сообщении.

Как рассказали в компании, российские исследователи применили неразрушающий метод рентгеновской томографии и алгоритмы машинного зрения: объект, который нельзя разворачивать, помещается в томограф. Затем реконструируется цифровая копия документа, над которой и производятся все дальнейшие манипуляции.

В SE подчеркнули, что мировое научное сообщество уже более 20 лет пыталось решить более двадцати лет проблему анализа старых свитков с привлечением томографии, предлагая разные подходы с машинным обучением. При этом вопрос полной автоматизации процесса до сегодняшнего дня никому не удавалось решить.

Для обучения новой нейросети использовался созданный учеными Smart Engines корпус данных, включающий шесть образцов свернутых разными способами документов. На них были нанесены буквы и цифры разного размера и схемы с различными графическими элементами.

"Мы надеемся, что наша разработка позволит сделать шаг на пути исследования и сохранения культурного наследия и откроет новые возможности для историков, археологов и других специалистов в области гуманитарных наук. Сейчас мы активно ищем партнеров для проведения дальнейших исследований", – рассказал гендиректор Smart Engines, доктор технических наук Владимир Арлазаров.

Ожидается, что результаты работы по данному проекту будут представлены российскими учёными в августе 2024 года на The International Conference on Document Analysis and Recognition (ICDAR) – ведущей международной научной конференции в области анализа и распознавания документов (Афины, Греция).

SE основана в 2016 году учеными с 25-летним опытом работы в сфере распознавания символов, изображений и обработки документов. Такие программные продукты компании, как Smart ID Engine, Smart Code Engine и Smart Document Engine применяют 10 из 13 системно значимых кредитных организаций России – Альфа-Банк, ВТБ, Газпромбанк, МКБ, банк "Открытие", Промсвязьбанк, Райффайзенбанк, Росбанк, Совкомбанк и "Тинькофф". Решения SE также используют при продаже билетов в кассах РЖД, на автоматическом паспортном контроле в "Шереметьево", при регистрации самозанятых в приложении ФНС "Мой налог" и в других проектах.

Материал опубликован при поддержке сайта ria.ru
Комментарии

    Актуальные новости по теме "Array"