Если AI для вас спасение, значит, что-то пошло не так

На каждом первом созвоне слышу одно и то же: «А кого мы можем заменить на AI?» — и у меня уже немного нервный тик из-за происходящего.

Если AI для вас спасение, значит, что-то пошло не так
© It-world

Ставка ЦБ 14,5%, так что кредиты для бизнеса достаточно дорогие, венчурные фонды в РФ в целом не особо развиты были всегда — в общем, выжить бизнесу по старинке уже тяжело, нанять больше людей не выйдет, это попросту уже слишком дорого, и я уж не говорю даже про серверы. Словом, все ищут простую, безопасную и, самое важное — эффективную серебряную пулю. И вот тут становится очень интересно, бизнес начинает верить, что можно заменить людей на AI — ведь это та самая панацея от всех бед.

Суть вот в чем: пока медиа пишут заголовки в духе «AI вытесняет профессию X», давайте просто посчитаем, как это работает на самом деле.

Меня зовут Эдгар Сипки, я работаю на стыке AI и инженерии и, самое важное, бизнеса, консультирую компании по внедрению LLM в бизнес-процессы. И после десятков таких консультаций вижу одно и то же: бизнес задает правильный вопрос: «Как снизить время вывода на рынок?», но ждет плохой ответ: «Замените людей на AI».

Вендоры продают иллюзию

В конце 2025 года стэндфордские исследователи опубликовали работу «Canaries in the Coal Mine?» на данных ADP. Это крупная компания и провайдер payroll/HR-данных в США, чьи агрегированные данные по занятости часто используют в исследованиях и статистике по десяткам тысяч американских компаний.

Занятость в возрастном сегменте 22–25 лет в подверженных влиянию AI профессиях упала на 13%. По отдельным специальностям, например, разработчиков ПО, падение доходило аж до 20% от пика. Медиаканалы, конечно же, подхватили: «AI вытесняет джунов». Но, в феврале-марте 2026 года Anthropic опубликовал собственный отчет, ссылаясь на эти данные. Впрочем, сам отчет звучит уже заметно умереннее, чем его пересказы: авторы констатируют «нет статистически значимого роста безработицы» а лишь «предварительные признаки» замедления найма молодых.

ИИ снижает стоимость кода, но повышает требования к разработке

Но масштаб не сходится, ведь по данным Census Bureau и ФРС, к концу 2025 года AI применяли 18% американских компаний, а глобально картина еще жестче: по данным MIT State of AI in Business 2025, 95% корпоративных GenAI-пилотов не дают измеримого эффекта на P&L, а по независимым оценкам, в России доля пилотов, не доходящих в целом до продакшена, аналогичная. Но вот Гарвардское исследование (62 млн работников, 285 тыс. фирм) разложило эффект: AI снизил найм джуниоров на 7–12% за шесть кварталов после внедрения; в отдельных секторах (оптовая и розничная торговля) разрыв с non-adopters доходил до 40%; остальное — макроэкономика, дорогие деньги, коррекция после пандемийного перенайма.

И вот тут нужно понять одну важную деталь: Anthropic — заинтересованная сторона. Им, как и другим провайдерам LLM, выгодно показать, что их продукт меняет рынок труда, что впоследствии должно повышать эффективность бизнеса, но спрашиваете ли вы у баристы, пора ли вам пить кофе, или же сами выбираете, когда хотите его взять? Здесь то же самое.

Но если вы CEO/CTO/CIO/CFO, да кто угодно в целом, кто управляет бизнесом, — вам явно не до их капитализации, у вас бюджет горит, а дедлайны, как обычно, были еще вчера.

Мультипликатор не замена

Но если вендоры преувеличивают, что в целом естественно для любого вендора, то как же лучше разобраться в реальной пользе?

И вот неплохо работающая формула, которую стоит держать в голове: один разработчик с AI = 1 * X разработчика без кодингового агента. Но вот в чем суть. X — это коэффициент степени умения работать с агентскими инструментами, так что это может быть как 1,4, так и все 3, но ноль разработчиков с AI = ноль. Все и никак иначе. Остальное лишь детали.

Сколько стоит одна фича, один тикет, один релиз? Чтобы правильно оценить стоимость — берем зарплаты, инфраструктуры, время ожидания, тестирования и ряда других накладных. AI меняет это уравнение, но не так, как все ожидают, где мы просто выкидываем инженера из уравнения.

По данным разных экспериментов (GitHub, 4867 разработчиков; University of Chicago/Cursor, 1000+ организаций), AI-инструменты повышают продуктивность на 10–40% в зависимости от зрелости внедрения. Не в 10 раз. Не в 5. Хороший, рабочий, но не заменитель, а мультипликатор. И тут вспоминаются слова Сатьи Наделлы: «Важно не достичь сверхинтелекта, а достичь скорости роста ВВП хотя бы на 2%».

Но разброс результатов еще шире, чем любит показывать маркетинг. Исследование METR 2025 года на реальных задачах вообще зафиксировало замедление разработчиков с AI на 19%, тогда как исследование Harness дало скромные +10,6% по PR. И тут важно понимать: дело не в AI, ведь выигрыш не автоматический — он буквально зависит от зрелости процессов, типа задач и того, насколько честно команда умеет пользоваться инструментом, что буквально является самым важным шагом в понимании, насколько эффективно может влиять AI на ваши процессы в разработке.

Живой пример из нашей практики: в компании, с которой мы работали, купили claude code всей команде разработки, ждали примерно +30% velocity. Через полгода измерили, ребята получили всего 4% роста :) Доля реального использования была около 25%. Формально-то внедрили, но фактически платят за лицензии (причем объективно очень дорогие), но получают лишь четверть внедривших сотрудников.

Тут работает зеркальный принцип 20/80: 20% команды дают 80% эффекта от мультипликатора. Команда из пяти разработчиков, где полная стоимость будет достигать в среднем 500 000 руб./мес. на человека (зарплата + НДФЛ + страховые + оборудование + лицензии). При мультипликаторе 1,3× пятерка выдает результат как 6,5 человек. Экономия на один-два дополнительных найма — 12–24 млн руб./год, а при ставке 15% — это деньги, которые уже начинают влиять на вашу экономику.

Правильная модель не «уволить троих и заменить AI», а «пять человек с AI делают столько же, сколько семь без него». Ведь башенный кран не строит дом без крановщика, перфоратор не строит дом, лишь в руках строителя он становится полноценным инструментом.

И теперь самая важная мысль: задача растить коэффициент мультипликатора, ведь вопрос времени, когда все внедрят AI в процессы, важно то, как внедрят и как с ним работать.

Почему AI не становится дешевле

А теперь самое контринтуитивное в нашей индустрии, GPT-4 стоил $60 за миллион токенов, а GPT-4o — $10, в 6 раз дешевле примерно за полтора года, но счета почему-то не уменьшаются. Чем дешевле ресурс — тем больше его жгут.

Есть такой эффект — эффект Джевонса. Когда ресурс дешевеет, потребление растет быстрее, чем падает цена, особенно если ресурс очень ценный. К примеру, электричество подешевело в 100 раз с начала XX века, но вот общий счет за энергию вырос в тысячи раз, ну, просто потому что мы начали потреблять несравнимо больше. С AI все то же самое, промпты становятся длиннее, цепочки сложнее, агенты делают 10–50 вызовов на одну задачу, каждый из которых съедает тысячи десятки тысяч токенов. В итоге мы получаем, что средний расход токенов на пользователя растет быстрее, чем падает цена за каждый токен :).

Как GenAI-платформа SimpleOne превращает ИИ из эксперимента в рабочий инструмент бизнеса

Но, помимо этого, есть еще скрытая стоимость внедрения. К примеру, API-ключ (а именно стоимость расходов токена) обойдется вам в $100/мес., но вот реальное внедрение — другая история. Интеграция в CI/CD, подготовка данных, настройка RAG, обучение команды, проверка безопасности, итерации над промптами — это месяцы работы инженеров. И эта стоимость не масштабируется вниз вместе с ценой токена, а дальше еще грустнее! 95% пилотов не доходят до P&L. Эту цифру дает MIT State of AI in Business 2025 на международном рынке, и да, независимые оценки по российскому рынку схожи по результатам (а по моим оценкам, даже хуже). И это не значит, что AI не работает — это значит, что дистанция от «работает в демо» до «работает в продакшне» измеряется годами и десятками миллионов рублей.

А при этом мы еще не затронули любимые игрушки всех разработчиков — все современные агенты для разработки, от cursor до claude code (субсидированные). Они все безумно убыточны для компании-поставщика, и это очень важно осознавать, особенно с учетом того, что все они начали повышать цену поэтапно, а некоторые и вовсе стали отказываться от субсидий, но об этом уже в следующем материале.

А теперь еще и вспоминаем, что нам наши данные важны

А сейчас сделаем небольшой шаг в сторону, чтобы объяснить еще одну важную деталь. AI-инструменты для разработки работают с кодом, аналитические же инструменты — с данными компаний. Есть еще множество ассистентов, которых тоже подключают ко всем корпоративным данным. В итоге внутренние чат-боты обращаются к конфиденциальной документации, что ведь логично, чтобы они могли в целом работать.

В итоге для банков, телекома, госсектора, медтеха, да и в целом практически всем, кому ценны свои данные, — отправка чего-либо в API OpenAI или Anthropic часто попросту невозможна. Compliance, ФЗ-152, внутренние политики ИБ. А по данным Сбераналитики, 79% крупных промышленных предприятий РФ в целом исключают публичные GenAI-сервисы из-за требований к безопасности данных, и тут на сцену выходят OSS-модели — модели, которые можно развернуть (причем даже в коммерческом использовании) полностью бесплатно, важно лишь одно: на своем «железе» (а оно точно не бесплатное).

Да, чаще всего проприетарные модели гораздо умнее и эффективнее, но при грамотном управлении контекстом, а также правильном агентском workflow вы можете получить результаты, близкие к средним крупным закрытым моделям, и самое важное — в долгосрочной перспективе это даже дешевле.

Вот как выглядит сравнение трех форматов работы:

Критерий API (OpenAI/Anthropic) Свой контур (свои GPU), цена за среднюю инсталляцию Инференс в облаке Стоимость/мес. 150 тыс. - 500 тыс. Руб. 5 млн. -10 млн. руб. 200 тыс. - 2 млн. Руб. Предсказуемость счета Низкая (зависящая от потребления) Высокая (фикс. аренда) Высокая (зависит от предсказуемости вашего облака) Compliance (ФЗ-152) Нет Да (полная изоляция) Да (зависит от облака) Порог входа Дни Месяцы Дни-недели Геополитический риск Высокий Нет Нет Кому подходит Стартапы, R&D, нечувствительные данные Банки, телеком, госсектор, промпред Банки, телеком, госсектор, промпред, крупный бизнес со смешанным ландшафтом

Граница, где свой контур начинает выигрывать у API, обычно появляется при 15–20 активных пользователях с интенсивным применением (50+ запросов в день). Если у вас 10 разработчиков и умеренный usage, API чаще всего дешевле. Если 30+ пользователей или жесткие требования по комплаенсу, свой контур обычно окупается на средней дистанции (от года и более).

Для инференса важно две вещи: предсказуемая производительность (выделенные ресурсы, без shared CPU и «шумных соседей») и предсказуемый счет. API с плавающим биллингом — это такси без счетчика: доедете, но сумма в конце не всегда ожидаемая :).

И тут важно знать, к кому лучше идти за инференсом. Я мало кому предложу собирать свою инсталляцию целиком, но взять инференс у облака, соответствующий ФЗ-152 и предоставляющий вам эксклюзивный инстанс, — вполне хорошее решение. Здесь обычно я рекомендую Yandex Cloud как самого крупного из игроков на облаках (но главное не забывать, что они вполне могут посреди года поднять цены на свою инфраструктуру), так и h3llo cloud, которое полностью частное и на данный момент имеет самые мощные ресурсы под инференс крупных OSS-моделей. Впрочем, и это не полный список, вопрос всегда в модели, нагрузке и требовании к изоляции.

Как измерить эффект AI в команде

Окей, возвращаемся к основной теме — вы внедрили AI, заплатили за все, и теперь главный вопрос, а как понять, что это работает? Не «ребята довольны», а «где циферки?»

Тема в целом для отдельной статьи, но я взял несколько достаточно популярных метрик, которые можно начать смотреть с первого дня внедрения, а дальше уже масштабировать под реалии вашего бизнеса.

Cost per deliverable. Сколько стоит фича, тикет, релиз до и после AI, если падает, значит мультипликатор работает, а если не меняется — значит вы просто платите за AI и эффект где-то теряется.

Скорость PR/время до мержа. AI ускоряет написание кода, но если узкое место в ревью — эффекта вы не увидите. Метрика покажет, где настоящая пробка, и часто оказывается, что AI здесь вообще не виноват.

Adoption rate. Процент команды, реально использующей AI каждый день. И это самая болезненная метрика. Помните кейс с claude code из начала статьи? Где работали 25%, а остальные 75% — деньги на ветер, причем самые дорогие лицензии в стеке, и, к несчастью, это далеко не редкость.

Не нужен дашборд из 50 графиков (сразу). Нужно несколько метрик, которые вы реально сможете проверять раз в неделю, и если сейчас у вас 30 — большинство вы не открываете уже месяцами.

Так к чему все это?

AI — рычаг, который работает. Но с тремя условиями.

AI — это хороший инструмент, который работает, если вы умете им пользоваться.

Первое: есть команда, на которую умножать, без людей это все бесполезно, так что не обманывайте себя, что вы можете всех выкинуть и заменить, улучшайте команду, а не убирайте ее из уравнения.

Второе: если данные не могут покинуть контур — инференс должен быть внутри. Это дороже на старте и дольше в запуске, чем API-ключ, но окупается в долгосрочной перспективе и, что не менее важно, безопаснее.

И вот тут важно не путать два разных решения, каждое из которых дает «свой контур». Первый вариант — строить собственную GPU-инсталляцию. Это значит самостоятельно нести весь CAPEX, весь оверхед на эксплуатацию и принимать на себя риск что простоев, что апгрейдов «железа». И облачный инференс на выделенном инстансе — это тоже свой контур с точки зрения изоляции данных, но без этого оверхеда облако эффективнее утилизирует ресурсы за счет масштаба. И эта эффективность еще и чаще выгоднее по ценам, но, тут нужно считать. Поэтому выбор здесь не «свой контур vs. API», а «свой сервер vs. облачный инференс vs. публичный API», и единственный правильный способ выбрать — посчитать полное TCO, а именно «железо» или аренда, команда эксплуатации, время до запуска, стоимость простоев и стоимость масштабирования. Цена токена — лишь одна строчка в этом счете, и далеко не самая большая.

Третье: учитесь считать реальную стоимость, а не маркетинговую. Цена за токен — это не стоимость внедрения. Горизонт планирования должен быть в кварталах, а не в неделях. 95% пилотов не доходят до P&L не потому, что AI плохой, а потому, что бюджет на внедрение был «цена API-ключа».

Да, деньги сейчас дорогие, бюджет конечный. Поэтому давайте без иллюзий. Мультипликатор работает. Но он стоит дороже, чем обещает маркетинг, работает медленнее, чем хочет бизнес, и/или требует инфраструктуры, которая есть не у всех. Мультипликатор на ноль даст вам ноль.

AI вас не спасет, правильное планирование вас спасет. В общем, учимся считать по факту, а не по презентации вендора.