SubQ 1M-Preview: Первый субквадратичный LLM для длинноконтекстного ИИ

Alex Rivera • Опубликовано 15.05.2026 - 23:16 • Обновлено 09.06.2026 - 18:43 • 1 мин чтения • 233,627 • 15,531

3D render of glowing data streams forming a vast, infinite neural network landscape.

Содержание

SubQ 1M-Preview выходит с контекстным окном в 12 миллионов токенов
Почему субквадратичное внимание меняет экономику длинных промптов
Реальная проверка бенчмарков против GPT-5.5 и Claude Opus
Что это значит для креаторов, создающих протяжённые сцены

SubQ 1M-Preview выходит с контекстным окном в 12 миллионов токенов

По состоянию на 14 мая 2026 года Subquadratic Labs выпустила SubQ 1M-Preview — первую коммерческую субквадратичную большую языковую модель. Она обладает контекстным окном в 12 миллионов токенов и соответствует производительности передовых моделей, при этом потребляя примерно одну пятую вычислительных ресурсов для инференса по сравнению с обычными трансформерами. Доступ к API открылся сразу после анонса 5 мая и ориентирован на агентные и генеративные пайплайны с длинным контекстом. Ранние внутренние бенчмарки уже показывают, что модель справляется с протяженными цепочками рассуждений и мультимодальными входами без привычного квадратичного роста затрат. Для тех, кто наблюдал, как лимиты контекста душат детальные раскадровки, эти цифры ощущаются как настоящий прорыв, а не просто маркетинговый ход.

Почему субквадратичное внимание меняет экономику длинных промптов

Традиционные трансформеры платят квадратичный налог за каждый добавленный токен. SubQ обходит эту стену масштабирования благодаря механизму внимания, чьи вычисления растут гораздо более линейно. В результате креаторы могут загружать целые разбивки сцен, многосценарные сценарии или часовые референсные транскрипты, не опасаясь, что счёт взорвётся. Я провёл полдня, тестируя превью на 40-тысячном токеновом видео-промпте, который обычно вызывает тайм-ауты в других моделях. Модель вернула coherent покадровые указания за один проход. Честно говоря, этот тест показал, что смена архитектуры — это уже не просто исследовательская диковинка, а новая базовая реальность.

Реальная проверка бенчмарков против GPT-5.5 и Claude Opus

На бенчмарках с длинным контекстом превью показывает результаты в пределах 3–4 % от GPT-5.5, при этом используя на 78 % меньше вычислений при отметке в 1 млн токенов. По сравнению с последней версией Claude Opus модель немного уступает в креативном письме, но лидирует в устойчивой мультимодальной когерентности, когда промпты превышают 200 тыс. токенов. Стоимость за миллион токенов составляет примерно 22 % от текущих цен передовых моделей согласно опубликованному прайс-листу. Такая разница важна, когда вы итерируете 10-минутные видео-планы или собираете 50-изображенийые раскадровки. Преимущество не теоретическое — оно ощущается в реальном бюджете после недели активного использования.

Что это значит для креаторов, создающих протяжённые сцены

Длинные coherent промпты внезапно стали достаточно дешёвыми, чтобы воспринимать их как полноценный творческий материал, а не дорогую роскошь. Режиссёры теперь могут загружать полные библиотеки персонажей, референсы освещения и треки диалогов в один запрос и получать готовые списки кадров без токеновой гимнастики. Те же преимущества уже заметны и в смежных творческих областях. Достижения мультимодального ИИ уже применяются в создании adult-контента, как показано в этом анализе Seedance 2.0. Мой небольшой и совершенно ненаучный опыт подсказывает, что главный выигрыш получат итеративные рабочие процессы: генерировать, просматривать, уточнять за десятки проходов, не наблюдая за счётчиком, который раньше рос по квадратичному закону.

Открытые вопросы по релизу SubQ

Что именно представляет собой субквадратичная модель?

Субквадратичная модель заменяет стандартное внимание трансформера механизмом, чья вычислительная стоимость растёт намного медленнее, чем квадрат длины последовательности. SubQ 1M-Preview использует именно такой подход, чтобы выдавать результаты уровня передовых моделей при примерно одной пятой обычных затрат на инференс для очень длинных входов.

Как контекстное окно в 12 миллионов токенов помогает видео-промптам?

Оно позволяет креаторам вставлять целиком многоминутные сценарии, списки кадров, референсные изображения и аудиотранскрипты за один раз. Модель сохраняет когерентность на всей длине, вместо того чтобы заставлять пользователей разбивать материал и терять согласованность между сценами.

Доступен ли SubQ 1M-Preview для использования прямо сейчас?

Да. Доступ к API запустился 5 мая одновременно с анонсом превью. Разработчики могут зарегистрироваться напрямую на сайте Subquadratic Labs и сразу начать тестировать контекстное окно в 12 млн токенов.

Как цены сравниваются с текущими передовыми моделями?

Согласно опубликованным ранним тарифам, SubQ стоит около 22 % от стоимости за токен GPT-5.5 или эквивалентов Claude Opus, когда длина контекста превышает несколько сотен тысяч токенов. Экономия растёт вместе с размером промпта — именно здесь преимущество архитектуры проявляется наиболее ярко.

Создай своё AI-порно видео

Превратите любую фантазию в реалистичное Full HD видео. 1 000+ сценариев, позиций и фетишей — 100% приватно.

Начать Создавать

🔒 100% Приватно 🎬 Full HD до 60 сек 🔥 1 000+ действий

Поделиться: X Reddit Telegram WhatsApp

Об авторе

Alex Rivera

Журналист по технологиям ИИ

Журналист по ИИ-технологиям, который говорит то, что другие побоятся. Освещает генеративный ИИ, видео-модели и глубокое обучение — без хайпа, без фильтров.