«А кто автор?»: ученые НГУ предложили новый метод атрибуции литературных текстов

Вопрос авторства некоторых литературных произведений возникает перед литературоведами в тех случаях, когда авторы сознательно скрывали свое имя из политических,  коммерческих или иных соображений. Один из наиболее известных примеров – так называемый «Шекспировский вопрос», вызванный тем, что многие исследователи ставят под сомнение авторство Шекспира для целого ряда произведений. Доктор технических наук, профессор кафедры компьютерных систем Факультета информационных технологий НГУ, сотрудник Федерального исследовательского центра информационных и вычислительных технологий (ФИЦ ИВТ) СО РАН Борис Рябко вместе с коллегами и студентами НГУ разработал основанный на «сжатии данных» метод атрибуции художественных текстов, благодаря которому можно подтвердить или опровергнуть авторство с высокой статистической точностью.

Все экспериментальные науки представляют свои результаты, полученные в рамках математической статистики. Принципиальное отличие и новизна нашего метода – проведение экспериментов для исследования атрибуции литературных текстов в рамках проверки статистических гипотез, что дает возможность получать достоверные результаты при определении авторства того или иного текста. Из ограничений метода самое простое – объем анализируемого материала. Произведение должно быть достаточно большим, чтобы метод работал корректно и предоставлял результат с высокой точностью. Второе условие – наличие текстов, авторство которых точно известно, что необходимо для оценивания параметров анализа неидентифицированных текстов. В проведенных исследованиях эти условия выполнялись и вероятность ошибочных выводов (то есть ошибки при проверке гипотез) меньше 10 в степени -9, — рассказал о методе Борис Рябко.

Для экспериментов были взяты две литературных проблемы. Первая связана с утверждением Ирины Амлински и ряда других исследователей о том, что автором романов «Двенадцать стульев» и «Золотой теленок» является Михаил Булгаков, а не Илья Ильф и Евгений Петров. Вторая проблема касается авторства различных частей романов «Три страны света» и «Мертвое озеро», которое приписывается Николаю Некрасову и Авдотье Панаевой. В анализе данных произведений в поиске ответа на вопросы участвовала студентка ФИТ НГУ Ангелина Щеголева. В результате экспериментального исследования выяснилось, что авторство Михаила Булгакова в первом случае абсолютно исключено, а для романов «Три страны света» и «Мертвое озеро» были определены авторы различных частей. 

Сейчас Ангелина является студенткой 1 курса магистратуры ФИТ НГУ и преподавателем СУНЦ НГУ и применяет новый метод в другой области литературоведения: сравнивает переводы англоязычных текстов и определяет, насколько тот или иной перевод ближе к оригинальному изложению. Для решения этой проблемы девушка использует переводы текстов Марка Твена, Джека Лондона, Роберта Стивенсона и некоторых других англоязычных авторов, выполненные Сергеем Заяицким, Корнеем Чуковским, Николаем Чуковским и Иеронимом Ясинским.

Корней Иванович Чуковский писал: «Перевод – это автопортрет переводчика». Научному и  мне стало крайне интересно узнать, насколько стиль переводчика отражается в текстах, поэтому и появилась идея исследования. Хотя работа еще не закончена, уже можно заметить, что у различных переводчиков степень «сохранения стиля» оригинального произведения весьма различна, — прокомментировала Ангелина Щеголева.

На данный момент разработка приложения или сервиса, который позволит любому желающему использовать математический метод применительно к литературным текстам, не планируется, так как количество задач атрибуции сравнительно невелико, и, главное, эти проблемы должны решаться с участием литературоведов, учитывающих в том числе исторический контекст возникновения исследуемой проблемы.