Ученые научили искусственный интеллект расшифровывать надписи на древнейших языках мира

“Древнейшие языки мира”, запечатленные на скрижалях возрастом 5000 лет, теперь могут быть расшифрованы искусственным интеллектом так же быстро, как при помощи онлайн-переводчика. Обычно программы для обнаружения скриптов могут работать только с 2D-письмом. Новая программа могла читать как 3D-таблички, так и их 2D-фотографии. Искусственный интеллект может помочь раскрыть подробности жизни в древней Месопотамии.

Таинственный диалект жителей древнего мира наконец-то может быть расшифрован полностью благодаря искусственному интеллекту, пишет Daily Mail.

По оценкам экспертов, в мире до сих пор существует миллион клинописных табличек, но эти письмена, оставленные древними жителями Месопотамии, требуют кропотливой работы археологов по переводу и каталогизации их содержимого. Было подсчитано, что 90 процентов клинописных текстов остаются непереведенными.

Но теперь команда немецких исследователей придумала новый способ обучить компьютеры распознавать клинопись и даже сделать содержимое табличек тысячелетней давности доступным для поиска, как на веб-сайте, что позволяет оцифровывать и собирать большие библиотеки этих древних текстов.

Это могло бы раскрыть ранее неизвестные подробности о жизни древних, поскольку таблички содержали подробности о таких значительных подвигах, как строительство храмов, вплоть до таких мелких ссор, как жалобы на обслуживание клиентов.

Немецкие ученые обучили ИИ двум клинописным языкам, шумерскому и аккадскому. Как пишет Daily Mail, на шумерском говорили примерно 5000 лет назад, и в конечном итоге он был заменен аккадским, но оба языка использовались в письменной форме до начала христианской эры в Месопотамии, которая занимала территории современного Ирака и части того, что стало Ираном, Кувейтом, Сирией и Турцией.

Таким образом, оставленные клинописные таблички не только написаны на нескольких языках, но и имеют возраст в тысячи лет. Клинописные знаки в форме клина, которые легли в основу письменности в древней Месопотамии, были вырезаны на глиняных табличках, поэтому они трехмерные.

В сочетании с тем фактом, что древняя письменность выветрилась от времени и неправильного обращения, их свойства могут затруднить их сканирование в компьютер для историков и археологов, которые могли бы использовать их для исследований.

Теперь, используя 3D-модели примерно 2000 табличек, они обучили компьютерную программу сканировать их текст и расшифровывать его - как с помощью камеры смартфона превратить рукописную заметку в текстовый документ.

Цель этого исследования состояла не в том, чтобы перевести содержимое таблеток, а скорее в том, чтобы другим исследователям было легче это сделать.

И как пишет Daily Mail, не только разрушительное воздействие времени стерло их необожженную глиняную поверхность, затруднив перевод, но и отдельную табличку или даже небольшую строку текста может быть трудно понять без контекста - все равно что пытаться понять книгу, прочитав одно предложение на одной странице прямо посередине.

Новая программа искусственного интеллекта могла бы помочь восполнить пробелы, позволив переводчикам работать более эффективно.

"До сих пор было трудно получить доступ к содержимому многих клинописных табличек одновременно - вам вроде как нужно точно знать, что вы ищете и где", - отметил в своем заявлении старший автор исследования Хуберт Мара, доцент Университета Мартина Лютера в Галле-Виттенбурге в Германии.

Таблички, которые немецкие ученые использовали для обучения своей компьютерной программе, были взяты из доступного в открытом доступе набора 3D-сканирований, содержащего шумерские клинописные таблички - самой ранней известной цивилизации южной Месопотамии, которая сейчас является юго-центральным Ираком.

Помимо помощи исследователям в расшифровке содержимого клинописных табличек, новая система позволяет им создавать своего рода поисковую систему.

Содержимое этих табличек поможет исследователям гуманитарных наук лучше понять, какой была жизнь в древней Месопотамии. "На них можно найти все: от списков покупок до судебных решений. Таблички позволяют заглянуть в прошлое человечества на несколько тысячелетий назад. Однако они сильно выветрились, и поэтому их трудно расшифровать даже опытному глазу", - говорит Хуберт Мара.

Частью задачи было обучение искусственного интеллекта распознавать клинья и знаки, составляющие клинопись, отмечает Daily Mail.

Исследователи загрузили в программу десятки тысяч знаков, создав новый набор данных, который могут использовать другие исследователи, желающие изучать клинопись. После обучения ИИ они протестировали его на других табличках, чтобы увидеть, насколько он надежен.

Они обнаружили, что искусственный интеллект может точно распознавать клинописные тексты и знаки примерно с 76-процентной точностью. И это работало не только при высококачественном трехмерном сканировании.

"Мы были удивлены, обнаружив, что наша система хорошо работает даже с фотографиями, которые на самом деле являются более бедным исходным материалом", - сказал Эрнст Штецнер, студент лаборатории Хуберта Мары.

Команда Штецнера и Мары планирует использовать еще большую выборку табличек для обучения своего искусственного интеллекта и достижения более точных показаний. Ученые подозревают, что относительно небольшое количество табличек могло ограничить его точность.

Для сравнения, другой искусственный интеллект, обученный распознавать другой язык, основанный на клинописи, достиг 90-процентной точности. Другой возможностью было бы разбить изображения на табличке на более мелкие сегменты, чтобы ИИ мог обрабатывать меньший объем информации за один раз.

Материал опубликован при поддержке сайта mk.ru
Комментарии

    Актуальные новости по теме "Array"