KPMG убрала с части своих сайтов отчет об агентном ИИ после того, как в нем нашли десятки проблемных ссылок и неподтвержденных кейсов. Документ Total Experience: Redefining Excellence in the Age of Agentic AI должен был показывать, как бизнес внедряет ИИ-агентов. Вместо этого он сам стал примером того, что происходит, когда генеративный ИИ начинает производить не только тексты, но и правдоподобные доказательства к ним.
Доклад об ИИ, вероятно, сам готовился с помощью ИИ, а признаки надежности — уверенный тон, отраслевые кейсы, ссылки на источники, глобальные компании в примерах — стали частью проблемы. Текст выглядел как нормальный консалтинговый продукт, но при проверке в нем обнаружились вымышленные и искаженные источники.
Команда GPTZero разобрала ссылки в отчете и пришла к выводу, что из 45 источников только пять корректно указывают на реальные материалы. Остальные либо содержали искаженные названия и смешанные элементы, либо были слишком расплывчаты, чтобы понять, на какой источник они ссылаются. Financial Times проверила часть кейсов у самих компаний, и несколько организаций не подтвердили утверждения, приписанные им в отчете.
Но KPMG в этой истории – это скорее это удобная точка входа в более широкий разговор. ИИ уже не просто ошибается в ответах. Он научился производить неправду в форме готового знания, со ссылками, кейсами, объяснениями, цифрами и спокойным экспертным тоном. А текст выглядит достаточно профессионально, чтобы его переслали коллегам, положили в презентацию, процитировали в стратегии или использовали как аргумент на совещании.
Выдуманные источники
Самый опасный вариант — когда ИИ придумывает не только ответ, но и доказательство к нему. Ссылка в тексте обычно говорит о надежности. Читатель видит источник и предполагает, что утверждение можно проверить. В юридической сфере это уже стало отдельной проблемой. Один из самых известных случаев — дело Mata v. Avianca. Адвокаты подали в суд материалы со ссылками на несуществующие судебные решения, сгенерированные ChatGPT. Суд счел это основанием для санкций.
Похожая история разворачивается в науке. В работе LLM hallucinations in the wild исследователи проверили 111 млн ссылок в 2,5 млн научных работах и оценили число несуществующих ссылок в публикациях 2025 года почти в 147 тыс. Еще одно исследование, посвященное материалам NeurIPS 2025, нашло 100 сфабрикованных ссылок в 53 принятых статьях. Особенно тревожно, что часть таких ошибок прошла экспертное рецензирование. Значит, традиционные фильтры научной проверки не всегда готовы к тексту, который выглядит академически убедительно, но содержит фиктивные элементы.
Российская судебная практика тоже уже сталкивается с этой проблемой. В мае 2026 года Арбитражный суд Западно-Сибирского округа оштрафовал ООО «ЦСС» на 50 тыс. рублей за кассационную жалобу со ссылками на несуществующую судебную практику. В документе были приведены судебные акты и выводы из них, но при проверке выяснилось, что часть актов не существует, а в других нет процитированных позиций. Отдельно суд отметил, что использование ИИ при подготовке обращения не оправдывает заявителя: ответственность за достоверность сгенерированного текста несет тот, кто применил эту технологию. Поэтому ссылка на нейросеть не снимает ответственность с того, кто подписывает документ.
Искаженные реальные источники
Второй тип ошибки сложнее, потому что там не всегда есть полная выдумка. Источник существует, компания существует, пресс-релиз существует, но в нем нет того, что ИИ ему приписывает.
Именно сюда ложится история KPMG. В отчете были кейсы компаний, которые должны были показать, как бизнес уже использует ИИ-агентов. Но при проверке выяснилось, что многие ссылки либо неточны, либо ведут к материалам, где заявленных утверждений нет. Такой прием исследователи GPTZero называют vibe citing: ссылка выглядит правильной «по ощущению», но при ручной проверке разваливается.
Это опаснее обычной ошибки в библиографии. Читатель видит знакомое название компании, узнаваемую тему, похожий источник и не сразу замечает подмену. Реальный документ становится декорацией для утверждения, которого в нем не было.
Для бизнеса это неприятно. Генеративный ИИ хорошо умеет достраивать недостающее. Если нужно найти пример «агентного ИИ в транспорте», он может взять реальный пресс-релиз транспортной компании, добавить туда агентность, прогнозирование, персонализацию и получить красивый кейс. Внешне все выглядит убедительно, но проблема начинается, когда кто-то открывает первоисточник.
Ложные обещания от имени компании
Третий тип ИИ-неправды возникает не в отчетах, а в клиентских сервисах. Чат-бот может не просто ошибиться, а дать клиенту инструкцию, которую тот воспримет как официальную позицию компании.
История Air Canada стала хорошим примером. Чат-бот авиакомпании неверно объяснил пассажиру правила возврата по льготному тарифу. Клиент действовал на основании этого ответа, а компания потом пыталась дистанцироваться от слов собственного бота. Но для пользователя интерфейс на сайте авиакомпании не был «экспериментом». Это был канал общения с компанией. Если бот обещает скидку, возврат, замену, срок доставки или способ решения проблемы, кто за это отвечает? Технический подрядчик? Маркетинг? Клиентский сервис? ИТ? Юристы? Или компания целиком, потому что именно она поставила этот интерфейс перед клиентом?
Для бизнеса это уже тема обязательств. ИИ может создать ожидание, которое потом придется исполнять или оспаривать.
Уверенный абсурд в массовых интерфейсах
Четвертый тип выглядит смешно, пока не попадает в чувствительную область. Google AI Overviews стал самым массовым примером: ИИ-ответы в поиске иногда выдавали абсурдные советы вроде добавления клея в пиццу. В интернете это быстро превратилось в мем, но сама проблема гораздо серьезнее.
Поиск долго работал как список источников. Пользователь видел несколько ссылок, сравнивал, открывал, проверял. ИИ-ответ меняет логику. Он сразу выдает синтезированную справку и тем самым берет на себя часть редакционной функции. Ошибка становится менее заметной, потому что она уже встроена в готовый ответ.
Свежие исследования показывают, что проблема не сводится к нескольким вирусным скриншотам. В работе Measuring Google AI Overviews авторы разобрали 98 тыс. отдельных утверждений в AI Overviews и пришли к выводу, что 11% из них не подтверждались страницами, на которые ссылался сам поиск. То есть даже там, где источник вроде бы указан, он не всегда подтверждает вывод, который видит пользователь.
Сегодня это клей в пицце, а завтра это может быть здоровье, финансы, налоги, право, безопасность или техническая настройка. Там, где пользователь раньше получил бы несколько источников, он получает один уверенный совет. И чем удобнее такой интерфейс, тем выше риск, что его не будут проверять.
Есть и еще один слой проблемы. ИИ может ошибаться сам, но на его ответы уже пытаются влиять извне. IT-World писал о «слоптимизации» — намеренном создании контента, который должен повлиять на ответы ИИ-ассистентов. Если раньше компании боролись за место в поисковой выдаче, теперь они стремятся попасть в готовую рекомендацию нейросети. Для пользователя это выглядит не как рекламный или самопродвигающий материал, а как нейтральная подсказка ИИ.
Это делает проблему галлюцинаций еще сложнее. Модель может не только сама придумать источник или неверно пересказать реальный документ. Она может опереться на контент, который специально написан так, чтобы выглядеть полезным для ИИ и продвинуть нужную версию ответа. В одном случае мы имеем дело с ошибкой машины, в другом — с попыткой использовать машину как канал влияния.
Ошибки в экспертных объяснениях
Пятый тип особенно коварен, потому что не выглядит фантастикой. Это обычная статья, справка, инструкция или финансовое объяснение, где ИИ ошибся в деталях.
История CNET показала этот риск еще в начале массового увлечения генеративным ИИ. Издание публиковало материалы, написанные с помощью ИИ, а потом вынуждено было исправлять значительную часть таких текстов. Формально это были не сенсационные фейки, а объяснительные статьи на финансовые темы. Но именно в таких жанрах ошибка особенно токсична, так как читатель пришел не за мнением, а за понятным ответом.
Экспертный текст опасен тем, что выглядит нейтрально. Он объясняет проценты, кредиты, инвестиции, тарифы, юридические процедуры или технологические настройки. Если ошибка спрятана внутри такого объяснения, она может пройти незаметно и быть использована дальше.
Почему это уже корпоративный риск
Все эти истории объединяет одна вещь. ИИ не просто производит неправильный текст. Он производит неправильный текст в правильной форме.
Судебная ссылка выглядит как судебная ссылка, а научная библиография выглядит как научная библиография. Чат-бот на сайте компании выглядит как официальный канал поддержки. Поисковый ответ выглядит как справка. Финансовая статья выглядит как экспертное объяснение.
Поэтому компаниям придется проверять не только очевидно опасные зоны вроде персональных данных, кода или доступа к системам. Проверять нужно весь слой корпоративного знания. Все отчеты, презентации, исследования, клиентские ответы, инструкции, справки, маркетинговые материалы, внутреннюю аналитику.
Потому что главный риск генеративного ИИ сегодня не в том, что он иногда не знает ответа. Главный риск в том, что он умеет быть очень убедительным.