Нарышкин: Использовать ИИ можно только в отношении оцифрованных документов
По данным ВЦИОМ, в прошлом году к помощи нейросетей обращались более половины российских интернет-пользователей, причем среди молодежи эта доля превысила 80%. То есть граждане успешно применяют искусственный интеллект для поиска информации, в том числе и исторической. По мнению председателя Российского исторического общества (РИО) Сергея Нарышкина, особенно важно, чтобы нейросети выдавали достоверные, без ошибок и намеренных искажений, ответы на вопросы пользователей.
"Для этого необходимо системно обучать российские языковые модели с опорой на верифицированные данные о нашей культуре, истории, традициях и ценностях", - заявил он на круглом столе, посвященном вопросам информационного суверенитета и применения отечественных моделей искусственного интеллекта в сферах истории и культуры.
Размышляя о возможностях ИИ быстро обрабатывать огромные массивы архивных данных в историческом просвещении, глава РИО вспомнил о знаменитом проекте минобороны России "Память народа".
"Когда человек без какой-либо специальной исторической подготовки может при помощи пары кликов мыши отыскать информацию о своих старших родственниках - участниках Великой Отечественной войны - это оказывает на него огромное моральное воздействие, помогает ощутить преемственность истории на примере своей собственной семьи", - подчеркнул Сергей Нарышкин.
Помогают нейросети и профессиональным историкам. Например, в Институте археологии РАН методы "машинного обучения" применяются для выявления признаков авторских стилей в керамике. А под эгидой Института истории материальной культуры РАН осуществлялась виртуальная реконструкция взорванной террористами Триумфальной арки Пальмиры.
Председатель РИО назвал также технологию "компьютерного зрения", в результате которой был расшифрован трудночитаемый почерк Петра I. "Аналогичным образом при помощи искусственного интеллекта ученые из Института монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук сумели распознать порядка 500 страниц древнетибетских рукописей", - добавил он.
Однако использовать методики ИИ можно только в отношении оцифрованных документов, и этот процесс необходимо ускорить.
"В Архивном фонде Российской Федерации - более 550 миллионов единиц хранения. Работа по их переводу в электронный вид стартовала еще четверть века назад, однако оцифровано пока что лишь около 3% от всего массива источников. Не говорю уже о том, что большая часть этих "оцифрованных" документов попросту отсканирована, а значит, не распознается поисковыми системами. Так что, если мы всерьез хотим использовать все преимущества искусственного интеллекта в работе с историческими источниками, то темпы оцифровки следует нарастить", - считает Нарышкин.
Придется задуматься о подготовке и переподготовке кадров. Сегодняшних студентов-гуманитариев - историков, архивистов, музееведов - уже нельзя учить по-старому, считает глава РИО.
"Следует вооружать их актуальными цифровыми инструментами, обучать использовать их в работе. Где-то это может потребовать пересмотра рабочих программ, а где-то - переподготовки преподавательского состава", - подытожил он.