Ученые разработали ИИ-модель, которая читает клинописные таблички намного быстрее человека
Исследователи Корнеллского и Тель-Авивского университетов разработали ИИ-модель, которая может распознавать клинописные знаки вне зависимости от их индивидуальных вариаций.
Наряду с египетскими иероглифами, клинопись является одной из древнейших известных форм письма и состоит из более чем 1000 уникальных знаков. Внешний вид этих знаков может различаться в зависимости от эпохи, культуры, географии и даже отдельных писцов, что очень затрудняет интерпретацию текстов.
Исследователи Корнеллского и Тель-Авивского университетов разработали ИИ-модель для чтения клинописных табличек. Она получила название ProtoSnap и опубликована на сайте a href="https://tau-vailab.github.io/ProtoSnap/" target="_blank">Github.
"Когда вы погружаетесь в древний мир, вы видите огромное разнообразие форм символов, – a href="https://phys.org/news/2025-03-ai-precise-cuneiform-characters.html" target="_blank">говорит соавтор работы Адар Авербух-Элор. – Даже один и тот же символ со временем меняется, поэтому бывает очень сложно его узнать".
По оценкам ученых, в музеях хранится около 500 тысяч клинописных табличек, но лишь небольшая часть из них переведена на современные языки и переводы опубликованы. "Существует бесконечное количество 2D-сканов этих клинописей, но прочитанных очень мало", – говорит Авербух-Элор.
Чтобы вычислить сходство между конкретным попиксельным изображением символа на конкретной табличке и общим прототипом всех вариаций символа, команда применила модель диффузии – тип генеративной модели ИИ, часто используемый для задач компьютерного зрения и генерации изображений.
Ученые фиксировали прототип символа и сопоставляли ему вариации конкретных изображений. Зафиксированные символы они использовали для обучения ИИ-модели, которая выполняет оптическое распознавание. Эта модель фактически превращает рукописные изображения на табличке в "печатный" текст. Исследователи показали, что при обучении с использованием этих размеченных данных ИИ достаточно хорошо распознает клинописные символы, даже редкие и вариативные.
Ученые считают, что новая ИИ-модель поможет автоматизировать процесс чтения табличек. Это сэкономит экспертам бесчисленное количество часов и позволит проводить масштабные сравнения символов разных времен, городов и индивидуальных писцов.
"В основе нашего исследования лежит цель – увеличить количество доступных нам древних источников в десять раз, – говорит соавтор работы Йорам Коэн. – Это позволит нам впервые работать с большими данными и даст новые знания о древних обществах – их религии, экономике, социальной и правовой жизни".