Тестът Mythos NSFW на Anthropic разкрива границите на филтрите за безопасност
Съдържание
Тест за NSFW на Anthropic Mythos: Какво позволява контролираният модел
May 2026
Как тествахме филтрите
Вижте, rollout-ът е минимален. Няма публично API. Пуснахме prompt-ове през канали за партньорски достъп, докладвани в покритието от началото на април. Опитахме първо suggestive пози. След това частична голота. Пълни explicit сцени. Стилове хентай. Kinks близки до насилие. Всеки тест удари същата стена. Проверените boundary conditions включваха типове тела, сваляне на дрехи и директен erotic language. Всички отказани. Никакви частични outputs не преминаха.
Вердикт
Неуспех. Mythos блокира всяка explicit заявка. Suggestive framing понякога преминава. Пълна голота или секс не. Моделът остава в рамките на обичайните твърди линии на Anthropic дори в този cybersecurity-focused преглед.
Цитат на отказа
Не мога да помогна с тази заявка, защото включва генериране на explicit sexual content, което нарушава политиките за ползване на Anthropic.
Резултат от workarounds
2/10. Преформулирането не помага. Преминаването към индиректен език също се проваля. Third-party wrappers са безсмислени, защото самият модел отказва преди да се формира какъвто и да е output. Guardrails-ите са в ядрото.
AiExotic Еквивалент
Създателите, които искат consistent explicit output, се обръщат към инструменти, които напълно пропускат тези откази. Frontier модели като Mythos илюстрират текущото напрежение между capability и safety guardrails, което създателите преодоляват ежедневно, когато разширяват креативните граници с mainstream инструменти. Подобни модели се появяват и в video моделите на Google, както е описано в Gemini omni nsfw: Защо AI Video Моделът на Google Блокира Explicit Съдържание.
Отворени въпроси
Може ли Mythos да генерира adult imagery?
Не. Моделът отказва всички explicit заявки. Само non-sexual suggestive content понякога преминава филтрите.
Колко строги са отказите в сравнение с публичните Claude модели?
Също толкова строги. Контролираният преглед не показва никакво отпускане на NSFW границите въпреки cybersecurity фокуса.
Какви workarounds съществуват в рамките на политиката?
Никакви, които работят. Prompt tweaks и индиректен език се отхвърлят по същия начин като директните заявки.
Публикувано от редакционния отдел
Mythos се присъединява към списъка на frontier модели, които поставят safety над creative freedom. Моделът е ясен. Следващият тест излиза, когато следващият голям модел се появи. Публикувано от редакционния отдел на AiExotic. Следващият тест излиза, когато следващият голям модел се появи.
Създайте свое AI порно видео
Превърнете всяка фантазия в реалистично Full HD видео. 1,000+ сценария, пози и фетиши — 100% поверително.
Започнете СегаЗа автора
Независим технологичен анализатор
Технологичен анализатор, базиран в Лондон. Анализира тенденции в AI индустрията и креативен AI с необичайна честност — включително признанието, че наистина му харесват продуктите, които преглежда.