← 목록으로
업계동향중요도 높음 8.0

아마존이 AWS에서 새로운 오픈AI 제품을 제공 시작

Amazon is already offering new OpenAI products on AWS

TechCrunch AI··4분 읽기·6회 조회

핵심 요약

  • 오픈AI가 마이크로소프트와 독점권 해지 합의를 하루 만에 AWS가 오픈AI 모델 제공을 발표
  • AWS는 새로운 에이전트 서비스를 포함한 오픈AI 모델을 제공할 예정
  • 이번 발표는 클라우드 서비스 시장에서의 경쟁 심화를 반영함
  • 개발자들은 AWS에서 오픈AI 제품을 사용함으로써 다양한 AI 기능을 쉽게 활용할 수 있게 되었다.

심층 분석

이번 발표의 핵심은 OpenAI가 Microsoft Azure와 맺었던 독점 클라우드 계약이 풀린 직후, AWS가 OpenAI의 오픈웨이트 모델(gpt-oss-120b, gpt-oss-20b)과 신규 에이전트 서비스를 Bedrock 및 SageMaker JumpStart를 통해 즉시 제공하기 시작했다는 점입니다. 기술적으로 보면 이들 모델은 Mixture-of-Experts(MoE) 구조로 추론 시 일부 전문가만 활성화돼 비용 효율이 높고, Apache 2.0 라이선스로 풀려 있어 자체 호스팅·파인튜닝이 가능합니다. 새 에이전트 서비스는 OpenAI의 Responses API와 유사한 형태로 도구 호출(tool calling), 코드 실행, 웹 검색 등 멀티스텝 워크플로우를 단일 엔드포인트로 묶어주는 구조인데, AWS는 이를 자사 IAM·VPC·CloudWatch 등 보안/관측 스택에 통합해 엔터프라이즈 규제 환경에서도 그대로 쓸 수 있게 만든 것이 차별점입니다.

엔지니어 입장에서 가장 큰 변화는 "OpenAI 모델을 쓰려면 Azure로 가야 한다"는 전제가 깨졌다는 점입니다. 그동안 AWS 위에 인프라를 둔 팀들은 OpenAI 호출을 위해 별도 VPC 피어링, 데이터 egress 비용, 듀얼 클라우드 컴플라이언스 부담을 떠안아야 했지만, 이제 Bedrock 단일 SDK로 Claude(Anthropic), Llama(Meta), Nova(Amazon), 그리고 OpenAI 모델까지 동일한 IAM 정책 하에서 호출할 수 있습니다. 한국 개발자들에게 특히 의미가 큰 부분은 리전 선택의 폭인데, 서울 리전에서 Bedrock을 통해 OpenAI 모델을 직접 호출할 수 있게 되면 지연 시간과 데이터 주권(개인정보보호법, 망분리 가이드) 이슈가 동시에 해소됩니다. 또한 오픈웨이트 모델은 SageMaker에서 LoRA 파인튜닝과 자체 추론 엔드포인트 배포가 가능하므로, 사내 데이터로 도메인 특화 모델을 만들고 싶었지만 Azure OpenAI의 폐쇄성 때문에 막혔던 팀들이 새로운 선택지를 얻게 됐습니다.

실무적으로 지금 점검해야 할 것은 세 가지입니다. 첫째, 현재 OpenAI Direct API를 쓰고 있다면 Bedrock Converse API로 추상화 레이어를 한 번 감싸두는 것이 좋습니다. 모델 공급망이 다변화되는 흐름이 명확해진 만큼, 프로바이더 락인을 줄이는 어댑터 패턴(LangChain, LiteLLM, 또는 자체 게이트웨이)이 향후 비용·성능 최적화의 핵심이 됩니다. 둘째, gpt-oss 계열 모델의 가격은 동급 GPT-4 클래스 대비 상당히 낮게 책정될 가능성이 높아, RAG 파이프라인의 임베딩·재순위(reranking)·요약 단계처럼 호출량이 많은 부분부터 비용 시뮬레이션을 다시 돌려볼 필요가 있습니다. 셋째, 새 에이전트 서비스는 도구 호출 스키마와 메모리 관리 방식이 OpenAI 기존 Assistants API와 미묘하게 다를 수 있으므로, 프로덕션 도입 전 동일 프롬프트·동일 도구 셋으로 회귀 테스트를 돌려 응답 포맷·토큰 소비 패턴 차이를 미리 확인해야 합니다.

장기적으로 보면 이번 변화는 단순히 "AWS에서도 OpenAI 모델을 쓸 수 있다"를 넘어, 클라우드 사업자들이 모델 공급자에 대해 갖는 협상력이 재편되는 신호입니다. Anthropic-AWS, OpenAI-Microsoft라는 1:1 동맹 구도가 무너지고 멀티-프로바이더 시대로 진입하면서, 개발자들은 이제 모델 선택을 클라우드 종속성과 분리해 순수하게 성능·비용·라이선스 기준으로 평가할 수 있게 됐습니다. 한국 SI/SaaS 기업들은 이 흐름을 활용해 멀티 모델 라우팅 아키텍처(쿼리 복잡도에 따라 모델을 자동 선택)를 도입하면 30~50% 수준의 LLM 비용 절감 여력이 생길 것으로 보이며, 이는 향후 6~12개월 내 AI 기능을 차별화 요소가 아닌 기본 사양으로 끌어내리는 압력으로 작용할 가능성이 큽니다.

#AI#AWS#오픈AI#클라우드#에이전트
원문 보기 →

관련 기사