업계동향중요도 높음 8.0

디프시크, 75% 할인 정기화… 출력 토큰 가격 GPT-5.5 대비 34배 저렴

Deepseek makes its 75 percent discount permanent, pricing output tokens at least 34x below GPT-5.5

The Decoder·2026년 5월 24일 AM 02:10·약 3분 읽기·3회 조회

핵심 요약

▸디프시크는 최상위 모델 V4-Pro의 75% 할인을 영구히 유지합니다.
▸입력 토큰당 0.435달러로, GPT-5.5 대비 최소 11.5배 저렴합니다.
▸출력 토큰은 GPT-5.5 대비 34배 이상 저렴한 가격에 제공됩니다.
▸이 가격은 토큰 소비가 많은 에이전트 시스템에 큰 영향을 줄 수 있습니다.
▸개발자들에게는 비용 효율적인 대체 모델을 제공하여 경쟁력을 높일 수 있습니다.

심층 분석

Deepseek가 자사 최상위 모델 V4-Pro의 75% 할인 가격을 영구화하면서 입력 토큰 100만 개당 $0.435, 출력은 GPT-5.5 대비 최소 34배 저렴한 수준으로 책정했다. 이 가격은 단순히 마진을 줄인 결과가 아니라, MoE(Mixture-of-Experts) 아키텍처와 MLA(Multi-head Latent Attention) 기반의 KV 캐시 압축, FP8 혼합정밀도 학습/추론, 그리고 자체 추론 스택 최적화가 결합된 결과로 알려져 있다. 특히 MLA는 기존 MHA 대비 KV 캐시 메모리를 수배~수십배 줄여 동일 GPU에서 더 큰 배치와 더 긴 컨텍스트를 처리할 수 있게 해주고, 이는 곧 토큰당 단가를 구조적으로 낮추는 핵심 기제다. OpenAI나 Anthropic의 프론티어 모델이 dense 또는 작은 활성 파라미터 비율로 운영비를 흡수해야 하는 것과 대비된다.

개발자/엔지니어 입장에서 가장 직접적인 충격은 "토큰을 헤프게 써도 되는 영역"의 경계가 다시 그려진다는 점이다. 그동안 GPT-5.5나 Claude 4.x급 모델로 에이전트 루프(자기반성, 도구 호출 반복, 다중 에이전트 협업)를 돌리면 한 작업당 수만~수십만 토큰이 쉽게 소진돼 PoC는 가능해도 프로덕션 단가가 발목을 잡았다. 출력 34배 차이는 단순한 비용 절감이 아니라, 그동안 "이론적으로는 되지만 ROI가 안 나온다"고 판단했던 워크플로우 — 전체 코드베이스 리팩토링, 대규모 로그 분석, 장문 RAG 후속 추론, CI 단계의 자동 코드리뷰 등 — 를 한 자릿수 달러 안에서 돌릴 수 있는 영역으로 끌어내린다. 서구 프로바이더들은 단가 인하나 caching/배치 디스카운트 강화로 대응할 수밖에 없을 것이고, 단기적으로는 라우팅 계층(simple은 Deepseek, 고난이도는 GPT/Claude)을 도입하는 하이브리드 전략이 합리적이다.

다만 한국 개발자가 즉시 도입하기 전에 점검해야 할 항목이 있다. 첫째, **데이터 거버넌스** — Deepseek API는 중국 본토에서 운영되며 입력 데이터의 처리·보관 정책이 미·EU 기반 벤더와 다르다. 사내 코드, 고객 PII, 의료/금융 데이터를 보내는 경우 법무·보안 검토가 선행돼야 하며, 가능하면 V4-Pro의 오픈웨이트 버전을 자체 호스팅(SGLang, vLLM)하는 옵션을 함께 검토하는 것이 좋다. 둘째, **벤치마크 ≠ 실제 워크로드** — 한국어 도메인(법률, 사내 용어, 금융 리포트)에서는 GPT/Claude 대비 출력 일관성과 함수 호출 정확도가 떨어질 수 있으므로, 본인의 실제 프롬프트 셋으로 A/B 평가가 필수다. 셋째, **공급망 리스크** — 미국의 추가 제재나 API 차단 가능성을 가정해, OpenRouter·Fireworks·Together 같은 멀티 프로바이더 라우팅과 모델 추상화 계층(LiteLLM 등)을 깔아두는 편이 안전하다.

결론적으로 이번 가격 정책은 "프론티어 품질을 합리적 단가로"라는 명제를 다시 한 번 강하게 끌어올린 사건이며, 에이전트·대량 추론 워크로드를 다루는 팀이라면 지금이 멀티 모델 라우팅 아키텍처를 도입하고 비용 모델을 재설계할 적기다. 단, 즉시 GPT/Claude를 전면 교체하기보다는 "토큰을 많이 쓰지만 난이도는 중간 이하"인 작업부터 단계적으로 이전하면서, 보안·품질·운영 안정성에 대한 데이터를 쌓아가는 접근을 권장한다.

#디프시크#GPT-5.5#LLM 가격#토큰 가격#AI 모델

원문 보기 →

디프시크, 75% 할인 정기화… 출력 토큰 가격 GPT-5.5 대비 34배 저렴

핵심 요약

심층 분석

관련 기사