ИИ выявил скрытые языковые модели и стили библейских текстов

Команда израильских ученых совместно с коллегами из других стран применила инновационный статистический метод на основе ИИ для анализа языковых стилей первых девяти книг Библии.

В команду вошли ученые из Университета Дьюка (США), Протестантского теологического института (Франция), Университета Райхмана, Тель-Авивского и Хайфского университетов. Команда состоит из археологов, библеистов, физиков, математиков и специалистов по информатике. Работа опубликована в журнале PLOS One.

Исследование было направлено на выявление стилистических особенностей библейских текстов. В отличие от стандартных методов машинного обучения, требующих больших объемов данных, команда разработала специальную модель, способную работать с короткими и фрагментарными текстами, характерными для древних рукописей. Методика основана на сравнении частот употребления отдельных слов и корней в различных разделах текста. Ученые анализировали первые 9 книг Танаха.

Метод позволил четко различить три традиции письма, что совпадает с существующими научными представлениями. Книги Бытие, Исход, Левит и Числа модель отнесла в основном к "священнической традиции", причем наиболее последовательно стилевые отличия выражены в книге Левит. Книга Второзаконие имеет особый стиль, который ближе к книгам "второзаконной истории", чем к священнической традиции. Книги второзаконной истории (книги Иисуса Навина, Судей, Самуила и Царей) имеют стилистические отличия и от священнической традиции, и от Второзакония. В книге Царей метод позволил выделить главу, которая не относится ни к одному из трех стилей.

Для каждой главы модель объясняла, какие лексические особенности стали определяющими для классификации, что делает анализ прозрачным и воспроизводимым.

Ученые считают, что разработанный метод можно использовать для анализа и других текстов, в том числе для проверки подлинности исторических документов. Работа открывает новые возможности для объективного и воспроизводимого анализа древних рукописей, сочетая методы искусственного интеллекта с филологией и историей.