Forklog
2026-07-03 09:45:02

Пользуемся, но экономно

Еще год назад крупные компании требовали от сотрудников использовать ИИ по максимуму — токены раздавали как корпоративный бонус, а внутренние рейтинги поощряли тех, кто сжигает больше всего. Теперь же руководители в панике отключают доступы к моделям или вводят жесткие лимиты на их использование, параллельно пересматривая бюджеты. Разбираемся, как токены из «бесплатного топлива» превратились в главную статью непредвиденных расходов и почему корпорации это проглядели. Что такое токен и зачем за него платить Токеном в контексте искусственного интеллекта называют минимальную единицу памяти, которую обрабатывает языковая модель. В зависимости от типа LLM один токен может соответствовать нескольким символам или целому слову. Модели используют их для обработки запроса пользователя и последующей генерации текстовых ответов, строк кода и изображений. В среднем 100 слов разбиваются примерно на 130–140 токенов. Они деляться на два типа: входные (промпт, запрос пользователя) и выходные (ответ модели). Долгое время токены воспринимались как обычная единица информации в API-системах нейросетей, которая мало на что влияла. Так было до момента их монетизации. Ранее публичные ИИ-проекты вроде OpenAI предоставляли доступ к своим продуктам по модели подписки или через корпоративные планы. Однако в марте 2023 года стартап Сэма Альтмана выпустил GPT-4 и установил публичные тарифы на основе токенов — $30 за 1 млн входных и $60 за 1 млн выходных. С этого момента токены постепенно начали становиться единицей измерения стоимости для инструментов на основе искусственного интеллекта. С 2023 по 2025 год была «эпоха субсидирования»: компании по-прежнему распрораняли сервисы для обычных пользователей по подписке, однако корпоративные разработчики уже платили за токены. Тогда ценообразование было более мягким, позволяя массово внедрять LLM-системы. С весны 2026 года все основные поставщики полностью перешли на монетизацию запросов, ссылаясь на высокие затраты на обработку данных. В апреле такое решение принял Anthropic, а в июле — GitHub Copilot. Средние цены на токены разных LLM по состоянию на декабрь 2025 года. Источник: FourWeekMBA. Текущий период некоторые наблюдатели называют началом эры «токенапокалипсиса», когда помимо трат на вычислительные мощности компаниям приходится в спешке включать в бюджеты дополнительные издержки и оптимизировать стратегии. Цена падает, спрос растет Парадокс текущей ситуации в том, что за последние три года фактическая стоимость токенов только снизилась. Средняя цена входного токена упала примерно на 98%, подсчитали в The Next Web. Тем не менее, по данным многочисленных отраслевых анализов, ИИ-расходы предприятий подскочили примерно на 320%. Средний годовой бюджет фирм на искусственный интеллект увеличился с $1,2 млн в 2024 до $7 млн в 2026 году. Всему виной увеличение внедрения ИИ-решений и как следствие кратно подросшие объемы использования самих токенов. Особенно большую нагрузку обеспечивают агентные технологии. Простой линейный рабочий процесс в 2023 году стоил около $0,04 за взаимодействие. Запрос к полноценной агентной системе — примерно $1,2 (в 30 раз больше). По подсчетам аналитиков, агентные рабочие процессы умножают потребление токенов в несколько раз по сравнению с «ручным использованием». Для самых сложных рабочих процессов затраты вырастают от 50 до 500 раз. Хотя более дешевые модели и методы оптимизации токенов продолжают набирать популярность, корпоративные покупатели по-прежнему предпочитают платить за передовые характеристики моделей, несмотря на раздувание бюджетов, утверждают исследователи из yipitData. Затраты на токенов в API разных моделей. Источник: yipitData. Экономисты называют подобные ситуации парадоксом Джевонса — снижение цены единицы ресурса ведет к росту его общего потребления. В случае с ИИ эффект оказался гипертрофированным. Кто просчитался? Кризис токенов проявляется не только «на бумаге». Многие крупные компании публично заявили о проблемах в этом направлении и пересмотре дальнейшей стратегии использования ИИ-инструментов. Лимиты в Uber Компания-автоперевозчик Uber активно внедряла ИИ-инструменты Claude Code и Cursor в свои рабочие процессы последние несколько лет. В мае генеральный директор Дара Хосровшахи утверждал, что автономные агенты уже пишут примерно 10% всего кода фирмы. Однако менее чем через месяц после этого заявления появились новости об ограничениях на ИИ внутри Uber. Компания установила лимит в $1500 в месяц на одного сотрудника для использования подобных сервисов. Всему виной оказалось не самое «сдержанное» применение технологии. В апреле технический директор Правин Непалли Нага рассказал The Information, что фирма исчерпала годовой бюджет на программирование. Он вспомнил случай, когда лично потратил $1200 на токены за одну двухчасовую демонстрацию. «Мне пришлось начинать все с нуля: бюджет, который я рассчитал, оказался недостаточным», — отмечал Нага. До обнаружения непредвиденных расходов Uber поощряла сотрудников использовать ИИ «как можно больше» и составляла внутренние рейтинги активности команд. Теперь разработчики должны сами контролировать свои расходы и при превышении установленного лимита запрашивать дополнительное финансирование. Неудачный эксперимент Microsoft В декабре 2025 года Microsoft выдала тысячам своих разработчиков, менеджеров и дизайнеров доступ к Claude Code от Anthropic — за счет компании. К весне инструмент распространился далеко за пределы инженерных команд. Внутри корпорации внедрение представляли как учебный процесс. Однако за пределами ситуация выглядела страннее: при наличии собственного инструмента в виде GitHub Copilot использовались решения конкурентов. Шесть месяцев спустя Microsoft все же свернула эксперимент, отменив большинство прямых лицензий Claude Code в своем подразделении Experiences and Devices (Windows, Microsoft 365, Outlook, Teams, Surface). Разработчикам поручили мигрировать на Copilot CLI до 30 июня — последнего дня финансового года. В интервью изданию The Verge вице-президент Microsoft по разработке пользовательского опыта и устройств Раджеш Джа отметил, что целью внедрения Claude Code было быстрое освоение инструментов и оценка их эффективности. При этом, согласно внутренним опросам, большинство инженеров отдавало предпочтение инструменту от Anthropic. Журналисты предполагают, что его чрезмерное применение могло ударить по расходам корпорации. По мнению исследователей The Next Web, отказ Microsoft от Claude — убедительный сигнал того, что экономика корпоративного ИИ-кодинга при текущих ценах на токены не работает. Не потому, что инструменты плохие. Напротив, они настолько хороши, что их используют постоянно. Кроме того, в апреле GitHub приостановил регистрацию новых пользователей Copilot Pro и Pro+, поскольку затраты платформы на платежных агентов превышали стоимость их ежемесячного тарифного плана. Новый контракт Amazon В июне The Information сообщило о реструктуризации партнерства между Amazon и Anthropic. Начиная со следующего года корпорация будет платить не за использованные вычислительные часы, а за израсходованные токены. Источники издания считают, что изменение может увеличить затраты Amazon на языковые модели семейства Claude. Однако в Amazon опровергли это утверждение. Компания Джефа Безоса использует ИИ-модели для работы над несколькими сервисами искусственного интеллекта, включая голосового помощника Alexa, инструмент для программирования Kiro и помощника Quick. В рамках сотрудничества Anthropic также интегрировала системы Amazon Web Services и использовала чипы партнера для обучения LLM. Конечно, «токенапокалипсис» слабо повлияет на гигантов вроде Microsoft и Amazon, в том числе из-за их прямого инвестиционного участия во многих ИИ-проектах. Однако более скромные фирмы рискуют столкнуться или уже столкнулись с финансовыми трудностями. Дорогие ошибки В качестве примера чрезмерных трат на токены журналисты Axios приводили анонимную компанию, которая забыла установить лимиты на использование Claude Opus для сотрудников. В конце месяца фирма получила счет на $500 млн за ИИ-вычисления, повисший в виде долга. Представители сервиса Priceline также рассказывали о трудностях с решениями искусственного интеллекта: «Это как эпидемия крэк-кокаина. Они дают вам попробовать, чтобы подсадить вас, и теперь вы в некотором роде зависимы», — описал проблему старший IT-директор Крис Рид, отметив, что компания начала устанавливать лимиты на количество токенов для определенных групп сотрудников. В то же время генеральный директор платформы Faros AI Виталий Гордон вспомнил одного разработчика, который за месяц потратил более $40 000 на токены. Руководитель исследовательского отдела Jellyfish Николас Арколано сообщил TechCrunch, что расходы на ИИ стремительно растут во многом из-за агентных функций. Потребление токенов на одного разработчика увеличилось примерно в 18,6 раз за девять месяцев. «При этом окупаемость чрезмерных затрат зависит от конечной коммерческой ценности выпущенного кода (например, выручки), которую большинство компаний до сих пор не могут измерить», — подчеркнул Арколано. Не самое туманное будущее Трудно оценить реальные финансовые последствия «токенапокалипсиса», но этот термин явно преувеличивает проблему. Крупные корпорации без труда заплатят «по счетам», а небольшие компании смогут адаптироваться, если будут разумно потреблять. Именно на этом фоне Linux Foundation представила проект Tokenomics Foundation — новый стандарт, который внедрит «дисциплину» в контексте затрат на ИИ. Похожую модель применила FinOps к расходам на облачные сервисы. Токены уже стали новой статьей для бюджета, и желающим идти в ногу с технологиями предприятиям стоит это учитывать. Вероятно, по мере развития решений искусственного интеллекта подобные траты станут такими же легко прогнозируемыми, как и расходы на базовые корпоративные подписки.