Цифровая эра библиотек: как технологии трансформируют книгохранилища в экосистемы знаний

Цифровая эпоха задает новые стандарты для библиотек, меняя привычные способы работы с информацией. Многие библиотеки сейчас существуют как бы в двух измерениях – классический офлайн и онлайн.С одной стороны, библиотеки остаются хранителями накопленных знаний в традиционном бумажном формате, а живое общение с читателями остается по-прежнему важным элементом работы. С другой, переходом индустрии от классического книгохранения к онлайн-платформам и высокотехнологичным сервисам дает читателям доступ к их ресурсам и услугам в режиме 24/7 из любой точки земного шара.

Цифровая эра библиотек: как технологии трансформируют книгохранилища в экосистемы знаний
© It-world

Из бумаги в цифру

Цифровизация библиотек начиналась с перевода бумажных книг в электронный формат. Онлайн-версии отличались от печатных только одним: их можно было читать на электронных носителях. По данным на 2023 год, в электронный формат было переведено свыше 80% книжных фондов всего мира. В том числе около 30% фонда Национальной библиотеки России.

Одна из крупнейших библиотек в мире - Российская государственная библиотека («Ленинка») по данным на 2019 год оцифровала 1,2 млн изданий из 45,5 млн книг. Как говорил генеральный директор РГБ Вадим Дуда в одном из своих интервью порталу Tadviser, для того, чтобы оцифровать весь фонд «Ленинки», потребуется примерно 2 тыс. лет. Фонд Президентской библиотеки имени Бориса Ельцина из 380 тыс. изданий полностью оцифрован. Российской национальной библиотеки имеют электронную копию 530 тысяч, По состоянию на начало 2022 года Электронная библиотека Российской национальной библиотеки (ЭБ РНБ) включает в себя свыше 800 тысяч электронных копий окументов: книг, журналов, газет, изданий нотной печати, изобразительных материалов, карт, планов, атласов, аудиозаписей. Оцифровка библиотечного фонда ведется также в рамках федерального проекта «Цифровая культура». По официальным планам, с 2019-го по 2024 годы в электронный формат предполагалось перевести 48 тыс. книжных памятников (по 8 тыс. ежегодно). Оцифровка книжных памятников включена в федеральный проект «Цифровая культура» нацпроекта «Культура».

В наши дни электронно-библиотечные системы (ЭБС) предоставляют пользователям не просто интернет-копии изданий, вышедших из типографии. Работая с электронными книгами, люди быстро находят источники по тематическим запросам, создают закладки на страницах, выделяют блоки текста. Стало удобно сортировать материалы в зависимости от личных предпочтений, смотреть посматривать документы на разных устройствах. За последние 5 лет люди стали запрашивать книги в бумажном виде на 20% реже, а число скачиваний с онлайн-ресурсов выросло на 50%, отмечает Национальная библиотека в Пекине. Похожие данные (25% и 60%, соответственно) приводит и Шанхайская библиотека.

В России, согласно данным опроса ВЦИОМ, 71% россиян читают литературу на компьютерах или смартфонах. В исследовании НАФИ 32% респондентов ответили, что посещают электронные библиотеки. По данным экспертов, в 2023 году в России спрос на онлайн-книги вырос на 50%.

В библиотечной отрасли внедряется большое количество инноваций. Облака обеспечивают хранение огромных массивов данных. С технологиями дополненной и виртуальной реальности (AR/VR) сотрудники ЭБС создают интерактивные программы. Например, в SMART-библиотеке им. Анны Ахматовой посетители фотографируются с 3D-моделью поэтессы через мобильное приложение. Большие данные помогают учреждениям изучать предпочтения читателей, создавать каталоги. Блокчейн используется для защиты авторских прав и прозрачности работы с лицензиями.

GPT: помощник или обманщик?

Настоящую революцию в библиотечном деле произвела технология GPT. ИИ-модель способна не только искать и находить читателям нужные источники информации, но и делать краткий обзор содержания и подобрать цитаты для научной работы.

Но тут же возникла и невероятно острая проблема верификации данных. Библиотека должна предоставлять читателю точную и правильную информацию, а в эпоху изобилия цифрового контента понять, какие источники заслуживают доверия, не всегда легко. С появлением GPT недобросовестным ученым стало проще создавать научные статьи по методу художественной литературы – просто сочинять их.

В 2023 году аналитики Forbes обнародовали итоги исследования, которое выявило: тексты, написанные ChatGPT о несуществующих экспериментах, включая аннотации (abstracts) и полностью сгенерированные статьи (fake papers), почти в трети случаев не распознаются рецензентами как подделка. К тому же, как выяснилось, большие языковые модели уровня GPT4 при отсутствии точных данных часто грешат «галлюцинациями».

Очевидно: с развитием возможностей создания фейковых текстов должны совершенствоваться и способы оценки надежности данных. Осенью 2024 года издание Business standard сообщало о новом ИИ-инструменте xFakeSci. В ходе тестовых испытаний он с точность около 94% выявил подделки в наборе из 300 официальных и реальных научных работ.

Тема верификации данных актуальна не только из-за мошенничеств в научных публикациях. В 2014 году в Daily Dot вышел материал американской журналистки Эй Джей Диксон (E.J. Dickson). Она призналась, что ради шутки добавила в «Википедию» описание несуществующего факта – о том, что калифорнийская детская писательница Пэгги Пэриш (Peggy Parish), создавая персонажа Амелия Беделия, вдохновилась личностью горничной из Камеруна, которая коллекционировала шляпки. Пользователи «Википедии» не распознали фейк. СМИ, блогеры-литературоведы и даже тайваньский профессор-лингвист в докладах, публикациях, телепередачах всерьез упоминали африканскую служанку как прототип Амелии Беделии. В факт поверил и племянник Пэгги Пэриш. Между тем, «Википедию» часто используют школьники и взрослые, включая учителей. Поисковые роботы распознают ее домен как авторитетный (с высоким рейтингом) и показывают на первых строках в ответ на запросы пользователей.

В Высшей школе экономики, по сообщению ТАСС, разработали систему машинного обучения, которая способна решать одну из самых сложных и актуальных задач – фактчекинг. Российская разработка имеет высокую точность и надежность, может работать с различными типами утверждений, и в качестве базы для проведения фактчекинга использовать как открытую информацию (например, онлайн-энциклопедии), так и наборы специализированных данных из узких областей знаний.

Определяет ли Google тексты, написанные ИИ? Как это влияет на поисковую выдачу?

Сами ЭБС также разрабатывают технологии, позволяющие оценить надежность источника данных. Например, анализировать биографию человека и устанавливать, соответствует ли она тому, что указано в подписи к его научной статье.

ИИ для поиска и рекомендаций

Новая эра внедрения информационных технологий в библиотечное дело началась с развитием искусственного интеллекта и машинного обучения. С помощью цифровых сервисов ЭБС получили возможность составлять каждого посетителя рекомендательные подборки свежих статей и книг, проведя анализ его предпочтений с помощью нейросетей, составлять перечень литературы, которая будет интересна читателю. И, как сообщают СМИ, для этих целей ИИ уже используют издательства.

ИИ анализирует информацию в десятки раз быстрее, чем человек, и процесс работы с литературой и для читателей, что для сотрудников библиотек становится эффективнее. Посетителям стало легче учиться, повышать квалификацию, быть в курсе новинок в профессии. Персонал библиотек и может применять технологии машинного обучения для анализа книжного фонда. С внедрением ИИ ЭБС становятся инновационными хабами. Сотрудники библиотек и посетители переосмысливают привычные способы работы с литературой.

В современных автоматизированных системах ЭБС читателям гораздо легче и быстрее находить нужные материалы, даже когда они не могут точно сформулировать запрос. ИИ-алгоритмы способны вести поиск, если читатель не помнить точного названия книги (документа) – достаточно произвольного набора слов, лишь примерно описывающих содержание.

В 2024 году группа ученых Санкт-Петербургского политехнического университета Петра Великого провела анализ книжного фонда «Литрес» с помощью авторского ПО: его результаты помогут понять, на закупках произведений каких жанров и направлений стоит акцентироваться. Виртуальные помощники способны отвечать на вопросы читателей, оказывать помощь в поиске нужных сведений, давать советы в выборе материалов. А голосового ассистента «Алису» обучили заказывать и оплачивать аудиокниги в библиотеке «Литрес».

Интерактивное взаимодействие и образование

Процесс обучения и общения с читателями становится интерактивным. К примеру, в Президентской библиотеке виртуальные туры и экскурсии. В Российской национальной библиотеке работает видеолекторий. В Библиотеке Мохаммеда Бен Рашида (ОАЭ) найти нужную книгу посетителям помогают роботы - они находят нужную литературу с помощью электронной системы поиска и хранения книг, содержащей около 1 млн наименований, и доставляют ее читателям на любой из семи этажей библиотеки.

ЭБС способны играть важную роль в образовании за счет интеграции с платформами школ, училищ, колледжей и университетов. Удачным примером является Саудовская цифровая библиотека. Ей удалось создать единую базу источников информации всех вузов государства. Аналитики рекомендуют включить в систему этой библиотеки частные и государственные организации из других отраслей страны — прежде всего, торговли и промышленности.

У ЭБС появляются возможности привлекать читателей и зарабатывать, создавая информационные базы и сервисы. Например, Шанхайская библиотека позиционирует себя в качестве исследовательского учреждения. Она оказывает услуги поиска сведений, давая читателям доступ к ценным цифровым ресурсам. Кроме того, у организации есть сервис взаиморасчета и предоставления документов (Interlending and Document Supply, ILDS), с помощью которого посетители получают материалы, принадлежащие другим библиотекам.

Управленческому и рядовому персоналу библиотек цифровизация несет много плюсов. Снижаются затраты на хранение бумажных фондов. В Публичных библиотеках Дели и Ченная (Индия) благодаря внедрению радиочастотной идентификации удалось сократить потери книг. С помощью нейросетей более эффективно расшифровываются старинные документы. Архивы Москвы, Новгородской и Оренбургской областей уже используют для этого ИИ-технологии Яндекса. К примеру, на расшифровку рукописного документа начала XX века у нейросети уходит несколько секунд, у специалиста – около получаса.

Цифровая трансформация библиотек — путь к созданию интеллектуальных экосистем, объединяющих читателей, педагогов и исследователей, формируя новое пространство культурного наследия.