Sakana AI представляет RL Conductor: Новая 7B-модель оркестрирует передовые ИИ
Содержание
Sakana AI представляет RL Conductor — 7B-оркестратор для маршрутизации между передовыми моделями
15 мая 2026 года Sakana AI выпустила RL Conductor. Эта 7B-модель на основе reinforcement learning решает, какая frontier-система справится с каждой подзадачей. Она уже показывает state-of-the-art результаты на бенчмарках по рассуждению и кодингу, при этом сокращая расходы на токены и количество API-запросов. Ранее слои оркестрации были хрупкими скриптами. Они выбирали одну модель и придерживались ее. RL Conductor рассматривает каждый запрос как задачу динамического выбора. Он отслеживает производительность, стоимость и качество вывода в реальном времени, а затем переключается посреди workflow. Результаты быстро проявляются на мультимодальных задачах. Генераторы изображений, видео-пайплайны и кодовые агенты теперь передают задачи без ручного промптинга.
Как reinforcement learning меняет правила маршрутизации
Вот в чём суть: модель обучает политику выбора моделей вместо статических правил. Она получает награду за достижение целей по качеству при меньших затратах. Именно этот цикл обучения отличает её от предыдущих роутеров. Создатели, работающие с видео- и image-стеком, почувствуют разницу первыми. Один промпт теперь может запустить GPT-5.5 для планирования, Claude Sonnet 4 для детального описания, а затем Gemini 2.5 Pro для финального рендеринга. Никакого дополнительного glue-кода не требуется. Такие разработки, как RL Conductor от Sakana, демонстрируют следующую волну интеллектуальной оркестрации, которая обеспечит более управляемые, эффективные и креативные пайплайны генерации AI-видео и изображений. Аналогичная логика маршрутизации уже встречается в экспертных разборах инструментов вроде Seedance 2.0 для специализированных adult-контент workflow.
Что RL Conductor реально даёт сегодня
Первые показатели выглядят уверенно. Расход токенов заметно снизился по сравнению с жёсткими фреймворками. Задержка оставалась конкурентной даже при выборке нескольких моделей. Самое важное — качество на креативных задачах оставалось высоким, а не скатывалось к самому дешёвому варианту. - Динамический выбор модели, адаптирующийся на каждом шаге
- Снижение расходов на API без потери качества
- Сильные результаты как в кодинге, так и в open-ended генерации
- Работает как с закрытыми frontier-системами, так и с open-source альтернативами. Интересный поворот: главный выигрыш, возможно, в простоте. Командам больше не нужно поддерживать собственную логику переключения.
Платформа Fugu и кто получит доступ первым
Sakana запускает модель через новую платформу Fugu. Корпоративные клиенты и исследовательские группы стоят первыми в очереди. Независимые создатели, скорее всего, получат ограниченный доступ позже в этом квартале. Честно говоря — ценообразование и точные сроки rollout пока остаются неясными. Первые сигналы указывают на оплату по использованию, а не на фиксированные подписки. Такая структура может сохранить разумные затраты для небольших команд, когда доступ откроется. Впечатляет: 7B-оркестратор может оказаться важнее следующей 100B базовой модели для повседневной креативной работы.
Вопросы о RL Conductor, которые задают создатели
Что такое RL Conductor?
Это 7B-модель reinforcement learning от Sakana AI, которая автоматически маршрутизирует задачи между несколькими frontier-моделями, такими как GPT-5.5, Claude Sonnet 4 и Gemini 2.5 Pro, повышая эффективность и качество вывода.
Чем RL Conductor отличается от старых инструментов оркестрации?
В отличие от статических скриптов, которые фиксируются на одной модели, RL Conductor обучает динамическую политику. Он переключается посреди задачи на основе сигналов реального времени о стоимости, скорости и качестве, сокращая расход токенов при сохранении показателей бенчмарков.
Могут ли индивидуальные создатели использовать RL Conductor уже сегодня?
Доступ сейчас идёт через платформу Fugu и в первую очередь предоставляется enterprise- и исследовательским пользователям. Более широкий доступ для создателей ожидается позже в этом квартале по модели оплаты за использование.
На каких бенчмарках лидирует RL Conductor?
Он возглавляет текущие лидерборды по рассуждению и кодингу, одновременно демонстрируя заметное сокращение API-вызовов и потребления токенов по сравнению с предыдущими жёсткими настройками оркестрации.
Создай своё AI-порно видео
Превратите любую фантазию в реалистичное Full HD видео. 1 000+ сценариев, позиций и фетишей — 100% приватно.
Начать СоздаватьОб авторе
Журналист по технологиям ИИ
Журналист по ИИ-технологиям, который говорит то, что другие побоятся. Освещает генеративный ИИ, видео-модели и глубокое обучение — без хайпа, без фильтров.