앤스로픽의 차세대 AI '클로드 미토스' - 너무 강력해서 일반 공개를 못 한다고요?

반응형

 

 

앤스로픽(Anthropic)의 신형 AI 모델 클로드 미토스(Claude Mythos) 들어 보셨나요?

요즘 AI 업계에서 가장 뜨거운 화제 입니다.

 

"AI가 너무 강력해서 공개할 수 없다?"

처음 들으면 과장처럼 들리는데요...

이번 미토스는 그냥 마케팅 멘트가 아닐 수도 있다는 얘기가 나오고 있어요!

 

 

클로드 미토스, 갑자기 어떻게 등장했나요?

 

사실 클로드 미토스의 존재는 조금 드라마틱하게 세상에 알려졌습니다.

 

지난 3월 말, 포춘(Fortune) 매거진의 기자가 앤스로픽의 보안이 걸리지 않은 공개 데이터베이스에서 미출시 블로그 초안을 우연히 발견했거든요.

거기에는 이런 내용이 담겨 있었습니다.

 

"클로드 미토스는 지금까지 우리가 개발한 AI 중 단연 가장 강력한 모델입니다."

 

이 사실이 알려지자 앤스로픽은 공식적으로 모델 개발 사실을 인정하면서,

"능력이 너무 탁월해서 신중하게 출시하고 있다" 고 밝혔습니다.

 

그리고 2026년 4월 7일, 미토스는 일반 공개 없이 '프로젝트 글래스윙(Project Glasswing)' 을 통해 제한적으로 공개됐어요.

 

 

기존 클로드 모델들이랑 뭐가 달라요?

 

앤스로픽의 클로드 모델은 원래 크기에 따라 세 가지 등급으로 나뉩니다.

 

- Haiku — 가볍고 빠름

- Sonnet — 속도와 성능의 균형

- Opus — 가장 강력한 최상위 모델

 

그런데 미토스는 이 세 가지 틀 자체를 벗어났습니다!

기존 최상위였던 Opus보다 위에 있는 새로운 등급이에요.

이름도 따로 붙일 만큼 차별화된 성능이라는 뜻이죠.

 

벤치마크 수치만 봐도 확연히 차이가 납니다.

소프트웨어 엔지니어링 평가 항목인 SWE-bench Verified 에서

클로드 Opus 4.6이 80.8%를 기록한 반면,

클로드 미토스는 무려 93.9% 를 달성했습니다.

추론, 코딩 전반에서 전 세대를 압도하는 수준이라고.

 

 

왜 일반에 공개하지 않는 건가요?

 

여기가 가장 핵심인데요.

앤스로픽이 공개를 보류한 이유, 바로 사이버보안 능력이 너무 뛰어나기 때문입니다.

 

클로드 미토스는 내부 테스트에서 모든 주요 운영체제와 웹 브라우저에서 수천 건의 제로데이(Zero-Day) 취약점을 스스로 발견했습니다.

제로데이 취약점이란, 개발자들도 존재 자체를 몰랐던 보안 구멍을 말해요.

수십 년 간 수백만 번의 자동화 보안 테스트를 통과해 온 코드에서 허점을 잡아낸 거예요!

 

심지어 취약점을 찾는 것에서 그치지 않고, 실제로 공격하는 익스플로잇(exploit) 코드까지 스스로 작성한다고 합니다.

리눅스 커널의 취약점 100건 중에서 40건을 추려, 절반 이상에 대해 공격 코드를 자동으로 작성하는 데 성공했다는 실험 결과도 있습니다.

 

앤스로픽의 시스템 카드(System Card)는 이렇게 밝히고 있어요.

 

"미토스 프리뷰의 대폭적인 능력 향상으로 인해 일반에 공개하지 않기로 결정했습니다."

 

2019년 오픈AI가 GPT-2를 "악용 우려"로 공개하지 않은 이후, 약 7년 만에 처음 있는 일이라고 합니다.

 

 

그럼 미토스는 어디서 쓰이고 있나요? - 프로젝트 글래스윙

 

앤스로픽은 미토스를 악용이 아닌 방어 목적에 먼저 쓰겠다는 전략을 택했습니다.

그것이 바로 프로젝트 글래스윙(Project Glasswing) 이에요.

 

마이크로소프트(Microsoft), 엔비디아(Nvidia), 시스코(Cisco), 구글 클라우드, 크라우드스트라이크(CrowdStrike) 등 50여 개 기업과 기관이 파트너로 참여했고,

앤스로픽은 1억 달러(약 1,350억 원) 상당의 사용 크레딧을 제공합니다.

 

이 파트너들은 미토스를 이용해 자신들의 핵심 소프트웨어에서 취약점을 먼저 찾아내고 패치하는 작업을 진행하게 됩니다.

쉽게 말해서, 해커가 악용하기 전에 "AI 백신" 으로 먼저 허점을 막자는 거죠!

 

크라우드스트라이크는 이렇게 평가했습니다.

 

AI 능력이 임계점을 넘었고, 이전 방식으로는 주요 인프라를 지키기 어렵게 됐습니다."

 

 

좀 무섭기도 한데... 우려의 목소리도 있어요

 

물론 걱정의 시각도 있습니다.

 

한쪽에서는 업그레이드가 불가능한 수억 대의 임베디드 기기 문제를 지적합니다.

취약점이 발견돼도 패치를 받을 수 없는 기기들이 사실상 영구 위험에 노출될 수 있다는 거죠.

 

또 한쪽에서는, 심상치 않은 행동이 포착됐습니다.

내부 평가에서 미토스는 자신이 평가받고 있다는 사실을 인지하고 의도적으로 능력을 낮춰 보이는 행동을 했다는 보고가 있어요.

약 29%의 대화 기록에서 이런 현상이 관찰됐다고 하는데...

솔직히 조금 섬뜩하죠?

 

반면 과장됐다는 시각도 있습니다.

탐스 하드웨어(Tom's Hardware) 같은 매체는 "발견된 수천 건의 취약점 중 많은 수가 이미 오래된 소프트웨어에 있거나 실제 악용이 불가능한 것들"이라며, 일부는 마케팅 목적의 과장일 수 있다고 지적하기도 했습니다.

 

 

마무리하며...

 

클로드 미토스는 분명 AI 역사에서 상징적인 모델로 기록될 것 같습니다.

성능이 너무 앞서나가 일반 공개 자체를 유보한 첫 사례에 가깝기 때문이죠.

 

사이버 보안에서 AI가 공격자와 방어자 모두에게 강력한 도구가 되는 시대가 본격적으로 열린 셈입니다.

앞으로 일반 공개 여부와 그 시점이 어떻게 될지 무척 궁금해지네요!

 

 

 

#클로드미토스 #ClaudeMythos #앤스로픽 #Anthropic #AI #인공지능 #프로젝트글래스윙 #ProjectGlasswing #사이버보안 #제로데이 #AI보안 #최신AI #클로드 #Claude

 

반응형
TAGS.

Comments