신 Claude Mythos, 영국 AI 안전 기관의 모든 사이버 공격 시뮬레이션을 통과해 최초 모델로 등극
New Claude Mythos becomes the first AI model to clear all cyberattack simulations from Britain's AI safety agency
핵심 요약
- ▸영국 AI 안전 기관(AISI)은 AI 사이버 능력의 성장 속도를 기존 8개월에서 4.7개월로 낮췄으나, Claude Mythos와 GPT-5.5는 이보다도 빠른 속도로 성장하고 있다.
- ▸Claude Mythos는 AISI의 모든 사이버 공격 시뮬레이션을 통과한 최초의 AI 모델로 기록되었다.
- ▸Anthropic의 로그랜 Graham은 1년 내 Claude Mythos가 '매우 단순해 보일 것'이라고 경고했다.
- ▸이 소식은 AI 모델의 위협 수준과 보안 대응 전략에 대한 새로운 고민을 요구한다.
심층 분석
영국 AI 보안 연구소(AISI)는 AI 모델이 실제 공격 시나리오를 얼마나 자율적으로 수행할 수 있는지 측정하기 위해 CTF(Capture The Flag) 유형의 침투 테스트, 취약점 발견·익스플로잇 작성, 다단계 공격 체인 실행 같은 시뮬레이션을 운영한다. 모델은 도구 사용(터미널, 코드 실행, 웹 검색)이 가능한 에이전트 형태로 평가되며, 각 작업의 성공률과 인간 전문가 대비 소요 시간을 비교해 능력 배가 주기(capability doubling time)를 산출한다. AISI가 이 주기를 8개월에서 4.7개월로 한 차례 단축했고, Claude Mythos Preview와 GPT-5.5가 그 가속화된 추정치마저 추월했다는 점은 단순 LLM의 성능 향상이 아니라 장기 추론(long-horizon reasoning), 도구 호출 안정성, 자기 검증 루프 같은 에이전트 인프라가 결합되며 일어난 비선형적 도약을 의미한다.
개발자 관점에서 가장 직접적인 영향은 위협 모델 자체가 바뀐다는 점이다. 그간 자동화된 스캐너는 알려진 CVE나 패턴 매칭 수준이었지만, Mythos급 모델은 소스 코드를 읽고 비즈니스 로직 결함을 추론하며, 인증 우회 경로를 새로 설계할 수 있다. 즉 SAST/DAST 도구가 잡지 못하던 IDOR, 권한 상승, 레이스 컨디션, JWT 검증 누락 같은 "사람이 코드를 읽어야만 보이는" 취약점이 대량으로, 그리고 저렴하게 탐색 가능해진다는 뜻이다. 동시에 방어 측면에서는 동일한 모델로 코드 리뷰, 위협 모델링, 로그 이상 탐지를 자동화할 수 있어 비대칭이 일부 상쇄되지만, "1년 뒤면 Mythos가 멍청해 보일 것"이라는 Logan Graham의 발언처럼 공격자 도구의 발전 속도가 방어 도구 도입 속도보다 빠를 가능성이 크다.
실무에서 당장 점검해야 할 것은 세 가지다. 첫째, SBOM과 의존성 관리 자동화를 강화하고 시크릿 스캐닝을 PR 단계로 끌어올려, AI 에이전트가 깃 히스토리에서 노출된 자격증명을 회수하는 가장 손쉬운 공격 경로를 차단해야 한다. 둘째, 코드 리뷰 파이프라인에 LLM 기반 보안 리뷰(예: Claude Code의 `/security-review`, Semgrep AI, Snyk DeepCode)를 통합해 인증·인가·입력 검증 경로를 자동으로 더블 체크하고, 특히 IDOR과 SSRF처럼 정적 분석이 약한 영역을 보강해야 한다. 셋째, 자체 AI 에이전트를 운영 중이라면 도구 권한 최소화(파일시스템 화이트리스트, 네트워크 egress 제어), 프롬프트 인젝션 격리, 그리고 에이전트 행위 로그의 무결성 확보를 지금부터 설계에 반영해야 한다 — 향후 12개월 안에 동일한 능력의 모델이 오픈소스로 풀리면 내부 위협 모델에도 즉시 포함시켜야 하기 때문이다.
관련 기사
업무 중 ai에 물어본 영어가 나만의 퀴즈가 된다면 lingoq
Naver CLOVA Tech Blog ·
PwC는 클라우드를 도입해 기술 개발 및 거래 실행을 통해 기업 기능을 혁신하고 있다
Anthropic News ·
블랙스톤, 헬먼 앤드 프리드먼, 골드만삭스와 함께 새로운 기업 AI 서비스 회사 설립
Anthropic News ·
GITEX AI 유럽
AI Business · 방금 전
5개 실험실, 5개의 사고: 소형 모델을 기반으로 한 다중 모델 금융 드라마 구축
HuggingFace Blog · 2026년 6월 7일 AM 04:02