Яндекс открыл доступ к крупнейшей нейросети в стране — бизнесу дали конструктор ИИ-агентов
Yandex B2B Tech дал доступ к инструменту, который способен изменить правила игры
На фоне активной кастомизации LLM-сервисов под локальные задачи, Yandex B2B Tech открыл облачный доступ к крупнейшей языковой модели в России — Qwen3-235B. Она уже доступна бизнесу через API и умеет обрабатывать до 256 000 токенов в сессии. По возможностям модель сопоставима с флагманами от OpenAI и DeepSeek AI.
Контекст длиною в 256 тысяч токенов
Yandex B2B Tech открыл облачный доступ к самой большой языковой модели в стране. Модель получила маркировку Qwen3-235B-A22B-Instruct-2507 и уже доступна бизнесу через API в AI Studio. По техническим характеристикам она соответствует, а местами и превосходит международные аналоги от OpenAI и DeepSeek AI. Главное преимущество — огромное контекстное окно на 256 000 токенов, которое позволяет удерживать в памяти массивы информации, делать персонализированные ответы и вести сложные цепочки взаимодействия.
Модель умеет анализировать большие объемы данных в одной сессии, что важно для задач поддержки, генерации рекомендаций или работы с клиентскими кейсами. Она поддерживает 119 языков и диалектов, что делает её применимой в мультинациональных продуктах.
CEO онлайн-университета «Зерокодер» Кирилл Пшинник подтверждает: Qwen3 — не просто маркетинг, это реальный техологический шаг.
«Qwen3‑235B выглядит не как маркетинговый фантик, а как реальный технологический шаг: MoE‑архитектура насчитывает 235 млрд параметров, но активирует лишь часть, что позволяет запускать её на более слабом железе. Более того, Alibaba объединила режимы «мышление» и «быстрый ответ», дав разработчикам настраиваемый thinking budget. [...] В целом воспринимаю Qwen3‑235B как самый убедительный ответ открытого рынка на закрытые GPT‑4‑уровневые решения», — подчеркнул Пшинник.
Агент как сервис: бизнесу открылся быстрый вход в генеративную автоматизацию
Qwen3 можно использовать как основу для создания ИИ-агентов — систем, которые взаимодействуют с клиентами, анализируют вводные и предлагают решения. На базе модели можно собирать:
- ассистентов для e-commerce, которые помогают выбрать товар, оформить возврат и решить логистику;
- технических агентов для ИТ, способных анализировать ошибки и рекомендовать действия;
- внутренние помощники, автоматизирующие рутину и поддержку.
Alibaba уже внедряет таких агентов в своей экосистеме. Теперь аналогичная возможность появилась и у российского бизнеса.
Без железа, но с возможностями: инференс доступен по API
Развёртывание модели такого масштаба требует серьёзной инфраструктуры. Чтобы снять этот барьер, Yandex Cloud сделал модель доступной по подписке через API в AI Studio. Цена — 50 копеек за 1000 токенов.
«Мы предоставляем бизнесу один из самых больших парков моделей в России. При этом гибко адаптируем опенсорс-модели под локальные особенности и задачи, чтобы компании могли безопасно интегрировать нейросети в свои веб-приложения и разрабатывать собственных ИИ-агентов», — отметил Артур Самигуллин, руководитель ML-направления Yandex Cloud.
По мнению Пшинника, для российских пользователей такая модель, развернутая на серверах Яндекса, выглядит как доступный и мощный инструмент: компании могут использовать ее в своих проектах, оставаясь в юридическом контуре Российской Федерации.
Использовать или нет — зависит от задач
По словам Кирилла Пшинника, Qwen3 нельзя назвать универсальной моделью, которую можно брать «по умолчанию» для любых сценариев. Её использование оправдано в тех случаях, когда требуется рассуждение, а не просто быстрый ответ.
«Модель Qwen3 — это модель с рассуждением, а значит, она отвечает медленно и обработка каждого запроса стоит дороже. В большинстве случаев при разработке ассистентов используют модели без рассуждений, чтобы сэкономить токены. Однако если бы стояла задача делать качественные ответы на основе рассуждений — я бы точно рассмотрел эту модель для использования», — подчеркнул он.
По мнению эксперта, для типовых ассистентов чаще выбирают модели полегче — чтобы снизить затраты на инференс и ускорить обработку запроса. Но если нужен осмысленный вывод, Qwen3 стоит рассматривать всерьёз.
Кто уже использует AI Studio
Yandex Cloud AI Studio стала главной точкой входа в генеративные технологии для российского бизнеса. По данным платформы, на ней работают более 44 тысяч компаний, из которых свыше 17 тысяч уже применяют YandexGPT в продуктах и процессах. По словам Кирилла Пшинника, Studio не просто предоставляет доступ к языковым моделям, а объединяет ключевые ИИ-сервисы Яндекса в едином интерфейсе:
«Yandex Cloud AI Studio уже стала точкой входа в ИИ для российского бизнеса: в целом на Yandex Cloud работают более 44 тыс. компаний, из них свыше 17 тыс. уже используют языковую модель YandexGPT. А доля ИИ‑сервисов в выручке платформы выросла до 5% и прогнозно поднимется до 8% к концу года», — поделился статистикой Пшинник.
Он уточняет, что клиенты используют платформу не только для генерации текста, но и для построения полноценной автоматизации — от чат-ботов до голосовых ассистентов и систем анализа данных:
«Сама AI Studio объединяет эти сервисы, и, по данным компании, ей доверяют «тысячи клиентов», которые через единый интерфейс собирают чат-ботов, голосовых роботов и системы анализа текста. Среди публичных кейсов — Яндекс Маркет генерирует до 10 000 описаний товаров в день, Skyeng обрабатывает 30 000 звонков в неделю, а Fix Price автоматизировал приглашение на собеседование 15 000 кандидатов», — подытожил он.
Что это меняет
Яндекс снял главный барьер для внедрения масштабных LLM в российский B2B. Теперь любой бизнес может строить ИИ-агентов на модели GPT-класса, не закупая железо и не нарушая регуляторных требований. Qwen3-235B — это не демо, а реально доступный инструмент. И если сейчас его берут для пилотов, то следующий шаг — массовые внедрения, особенно там, где важна юридическая локализация и стоимость обработки запроса.
Фото: Adi Goldstein / Unsplash
-
Партнёрский материал Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 16 июня 2026, 15:52
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Технологии Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 09 июня 2026, 12:14
-
Бизнес Как бренд пазлов «Харди Гарди» получил рекламу у блогера-миллионника, просто рассказав о своём проекте 05 июня 2026, 14:23
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Деньги Налоговый вычет через личный кабинет в 2026 году: пошаговая инструкция 24 апреля 2026, 21:57
-
Карьера Переговоры о зарплате: 5 неочевидных шагов для возможного повышения 15 июня 2026, 20:20
-
Реклама На первом месте идея: девелоперы выяснили, что рекламный бюджет — уже не главный фактор для узнаваемости бренда 16 июня 2026, 20:00
-
Маркетплейсы Ozon погасил 7,4 млн акций, выпущенных для мотивации сотрудников — компания устранила размытие капитала 16 июня 2026, 19:00
-
Деньги Состояние Илона Маска превысило $1,4 трлн — он стал самым богатым человеком на планете 16 июня 2026, 18:40
-
Деньги Минкультуры требует взыскать с «Союзмультфильма» 131 млн ₽: причина — студия не реализовала субсидию от ведомства 16 июня 2026, 17:57
-
Искусственный интеллект Разработчик DeepSeek увеличил свою оценку до $50 млрд — стартап стал самым дорогим ИИ-проектом в Китае 16 июня 2026, 16:00
-
Искусственный интеллект Конференция Conversations от Just AI в Петербурге: VK, Wildberries и другие расскажут, как зарабатывают на ИИ 16 июня 2026, 15:36
-
Россия 2ГИС запустил «Ленту друзей» — теперь пользователи могут увидеть отзывы и рекомендации мест от знакомых 16 июня 2026, 15:00
-
Бизнес Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 15 июня 2026, 18:01