AI Tools3분 읽기

Claude Opus 4.8 완전 정리 — Fast 모드 3배 저렴

2026년 5월 28일 출시된 Claude Opus 4.8 핵심 정리. Fast 모드 3배 저렴, Effort Control, Dynamic Workflows까지 — 실제로 달라진 점만 뽑았습니다.

#Claude#Anthropic#AI Tools#에이전트
Claude Opus 4.8 완전 정리 — Fast 모드 3배 저렴

TL;DR

  • Fast 모드가 이전 대비 3배 저렴해졌다 ($10/$50 per 1M tokens, 2.5x 속도)
  • Effort Controlclaude.ai에서 응답 깊이를 Low~Max로 직접 조절 가능
  • Dynamic Workflows — Claude Code에서 수백 개 서브에이전트를 자동 병렬 실행
  • 코딩 벤치마크 SWE-bench Pro: 64.3% → 69.2%
  • 수학 USAMO 2026: 69.3% → 96.7% (Opus 라인 역대 최대 점프)

가격: 본체는 동일, Fast 모드가 달라졌다

Opus 4.8의 기본 가격은 Opus 4.7과 동일하다.

구분입력출력
표준$5 / 1M tokens$25 / 1M tokens
Fast 모드 (2.5x 속도)$10 / 1M tokens$50 / 1M tokens
프롬프트 캐싱최대 90% 절감
배치 처리50% 절감

undefined Fast 모드가 핵심이다. 이전 Opus 라인의 Fast 모드 대비 3배 저렴하다. 속도가 중요한 에이전트 파이프라인에서 비용 부담이 크게 줄었다.


Effort Control — 응답 깊이를 직접 조절

claude.ai와 Cowork에서 새로 생긴 컨트롤이다. Low / High / Max 중 선택하면 Claude가 응답 전에 얼마나 깊이 생각할지가 달라진다.

  • Low: 빠르고 rate limit 소비가 적다. 간단한 질답에 적합
  • High: 기본값. 품질과 속도의 균형
  • Max: 가장 깊이 생각한다. 복잡한 추론, 코드 리뷰, 긴 문서 분석에 사용

API에서는 이미 extended thinking으로 제어 가능했다. 이번에 UI로 노출됐다는 게 변화다.


Dynamic Workflows — 에이전트 오케스트레이션이 바뀐다

Claude Code에서 연구 프리뷰로 공개된 기능이다.

기존 방식은 사람이 작업을 분해해 서브에이전트에 할당했다. Dynamic Workflows는 반대다. 목표만 주면 Claude가 런타임에 직접 오케스트레이션 스크립트를 작성하고, 필요한 만큼 서브에이전트를 병렬로 돌리고, 결과를 검증한 뒤 보고한다.

실제 사용 사례:

  • 수백 개 파일에 걸친 마이그레이션
  • 대규모 코드베이스 감사
  • 전체 테스트 스위트 자동 생성

단일 지시 하나로 팀이 해야 할 작업을 처리하는 구조다. 아직 연구 프리뷰지만 방향이 명확하다 — 오케스트레이션을 사람 손에서 모델 손으로.


벤치마크: 코딩과 수학에서 눈에 띄는 점프

벤치마크Opus 4.7Opus 4.8
SWE-bench Pro (코딩)64.3%69.2%
USAMO 2026 (수학)69.3%96.7%
MMMU-Pro (멀티태스킹 추론)54.7%57.9%

undefined 수학 점프가 두드러진다. USAMO 2026 기준 69.3%에서 96.7%로 — Opus 라인 역대 최대 단일 점프다.

코드 품질도 달라졌다. 자신이 작성한 코드에서 결함을 놓치는 비율이 Opus 4.7 대비 4배 감소했다. GPT-5.5 대비 코딩 벤치마크에서도 앞선다.


정직성과 얼라인먼트

이번 릴리즈에서 Anthropic이 강조한 또 다른 축이다. 근거 없는 주장 빈도가 줄었고, 작업 진행 상황을 더 정직하게 보고한다. 얼라인먼트 수준은 "near-Mythos" 등급으로 평가됐다.

에이전트 작업에서 오래 독립적으로 실행될수록 정직성이 중요하다. 틀린 결과를 자신 있게 보고하는 모델보다, 불확실하면 불확실하다고 말하는 모델이 실제 파이프라인에서 훨씬 안전하다.


어디서 쓸 수 있나

모델 ID: claude-opus-4-8

  • Claude API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Microsoft Foundry
  • claude.ai (Effort Control UI 포함)

마무리

Opus 4.8은 큰 구조 변화보다 실용적인 개선에 집중한 릴리즈다. Fast 모드 가격 인하는 에이전트 파이프라인 비용을 즉시 줄여주고, Effort Control은 작업 성격에 맞게 속도/품질을 조절하게 해준다. Dynamic Workflows는 연구 프리뷰지만 방향은 명확하다.

공유하기Twitter / X