← 목록으로
이미지AI중요도 높음 8.0

오픈AI의 업데이트된 이미지 생성기, 웹에서 정보를 가져올 수 있게 됨

OpenAI’s updated image generator can now pull information from the web

The Verge AI··3분 읽기·9회 조회

핵심 요약

  • 오픈AI가 최신 AI 이미지 생성기 버전을 출시하며, '생각 기능'을 추가해 웹에서 정보를 검색해 이미지를 생성할 수 있음.
  • 이 기능은 ChatGPT Images 2.0에서 제공되며, 사용자 요청에 따라 더 정교한 이미지를 생성할 수 있음.
  • 새로운 GPT Image 2 모델이 사용되며, ChatGPT Plus, Pro, Business, Enterprise 구독자에게 제공됨.
  • 이 기능은 생성형 AI의 능력을 확장하여 개발자들이 더 정교하고 정확한 이미지 생성을 가능하게 함.

심층 분석

OpenAI의 ChatGPT Images 2.0은 새로운 GPT Image 2 모델을 기반으로 하며, 기존 이미지 생성기에 "thinking capabilities(추론 능력)"를 추가한 것이 핵심이다. 추론 모델이 선택되면 이미지 생성기는 단순히 프롬프트만을 해석하는 것이 아니라, 웹에서 관련 정보를 실시간으로 조회하여 이미지 생성에 반영할 수 있다. 이는 LLM의 Retrieval-Augmented Generation(RAG) 패턴이 이미지 생성 영역으로 확장된 형태로 볼 수 있으며, 단일 프롬프트에서 여러 이미지를 생성하는 멀티 이미지 출력, 지시사항 준수 능력 향상, 사용자가 지정한 세부 디테일 보존, 그리고 이미지 내 텍스트 렌더링 품질 개선이 함께 이루어졌다. 특히 텍스트 생성 품질 개선은 기존 디퓨전 기반 모델들이 가장 어려워하던 영역으로, 멀티모달 추론 파이프라인을 통해 해결을 시도한 것으로 보인다.

개발자 관점에서 이번 업데이트는 이미지 생성 API의 활용 범위를 크게 넓힌다. 기존에는 모델의 학습 시점에 고정된 지식 범위 내에서만 이미지가 생성되어, 최신 제품 로고, 실시간 통계 인포그래픽, 현재 트렌드를 반영한 시각 자료를 만드는 데 한계가 있었다. 이제 웹 검색이 통합되면서 "최신 iPhone 17 Pro의 외형을 반영한 목업", "오늘자 주식 차트가 포함된 대시보드 일러스트" 같은 시의성 있는 이미지 생성이 가능해진다. 다만 ChatGPT Plus, Pro, Business, Enterprise 구독자에게만 thinking 모델이 제공되므로, API로 동일 기능을 활용하려면 GPT Image 2 엔드포인트의 비용 구조와 레이트 리밋을 사전에 파악해야 한다. 또한 웹 검색이 포함된 만큼 생성 지연 시간(latency)이 기존 모델 대비 증가할 가능성이 높아, 실시간 서비스에 통합할 경우 비동기 큐 기반 처리 아키텍처가 필수적이다.

실무 적용 시 반드시 고려해야 할 사항은 저작권과 정보 정확성이다. 모델이 웹에서 정보를 가져와 이미지화할 때 저작권 있는 이미지, 상표, 인물 사진이 학습되지 않은 방식으로 참조될 수 있어, 상업적 산출물에 대해서는 OpenAI의 이미지 사용 약관 및 현지 저작권법을 재검토해야 한다. 또한 웹에서 가져온 정보가 잘못되었을 경우 이미지가 "그럴듯하지만 틀린" 시각 허위정보를 만들어낼 수 있으므로, 사용자 대면 서비스에서는 생성된 이미지에 출처나 생성 시점 메타데이터를 함께 노출하는 UX 설계가 권장된다. 내부 도구나 디자인 워크플로우에 통합하려는 경우, 프롬프트 엔지니어링 관점에서 "thinking 모드에서는 검색 비용을 줄이기 위해 구체적인 검색 대상을 명시하라"는 베스트 프랙티스가 곧 등장할 것으로 예상되므로, OpenAI의 공식 문서와 Cookbook을 주기적으로 모니터링하는 것이 좋다.

#AI#이미지 생성#오픈AI#GPT#챗GPT
원문 보기 →

관련 기사