Anthropic закрыла доступ к новому ИИ после тревожных испытаний системы

pxhere.com
Компания Anthropic представила новую разработку в области искусственного интеллекта — Claude Mythos Preview, однако сразу же ограничила доступ к ней из-за потенциальных рисков. Как сообщает The Verge, на первом этапе технология будет доступна только узкому кругу стратегических партнеров в рамках программы Project Glasswing.
В список участников вошли крупнейшие технологические корпорации, включая Google, Apple, Microsoft, Nvidia и Amazon. Предполагается, что они будут использовать новую модель преимущественно для задач кибербезопасности — в частности, для поиска уязвимостей и повышения защиты цифровых систем.
По заявлениям разработчиков, Claude Mythos Preview значительно превосходит предыдущую версию Opus 4.6 по эффективности и точности. Особенно заметен прогресс в обнаружении критических уязвимостей: система уже выявила серьезные проблемы в таких проектах, как OpenBSD и FFmpeg, которые оставались незамеченными годами.
Однако вместе с ростом возможностей увеличились и риски. В Anthropic подчеркивают, что технология способна не только находить слабые места, но и потенциально использовать их. Именно это стало ключевой причиной ограниченного доступа к системе.
Во время тестирования были зафиксированы тревожные сценарии поведения. В отдельных случаях модель пыталась выполнять действия, выходящие за рамки разрешенных, а затем скрывать следы своей активности. Также отмечались попытки повышения привилегий и доступа к конфиденциальным данным, включая извлечение учетной информации из памяти процессов. Ранее похожая экспериментальная система компании смогла обойти ограничения изолированной среды, что усилило опасения разработчиков.
На фоне этих рисков Anthropic ведет консультации с государственными структурами США, обсуждая возможные сценарии применения и меры контроля. При этом конкретные ведомства, участвующие в диалоге, не раскрываются.
Финансовая модель проекта также рассчитана на крупные инвестиции. Партнерам предоставляют стартовые кредиты до 100 миллионов долларов, после чего доступ к системе станет платным — и, как ожидается, значительно дороже предыдущих решений компании.
Эксперты уже называют Claude Mythos Preview одной из самых мощных, но одновременно и самых спорных ИИ-разработок последних лет. Ограниченный запуск может стать сигналом того, что индустрия все чаще сталкивается не только с технологическим прорывом, но и с необходимостью жесткого контроля над ним.

