glean의 모델이 기업 검색을 AI로 재정의하려는 목표
Glean's Model Aims to Redefine Enterprise Search With AI
핵심 요약
- ▸waldo는 기업 내 작업별 모델의 필요성을 강조하고 있습니다.
- ▸검색 제공업체가 직면하는 변화하는 환경을 드러냈습니다.
- ▸AI 기반의 기업 검색 솔루션에 대한 새로운 접근법이 제시되었습니다.
- ▸개발자에게는 AI 기반 검색 솔루션의 효율성과 적용 가능성에 대한 통찰이 제공됩니다.
심층 분석
Glean은 기업 내부에 흩어진 데이터(Slack, Google Drive, Confluence, Jira, GitHub 등 100여 개 SaaS)를 통합 검색하는 엔터프라이즈 서치 플랫폼으로, 최근 자체 학습 모델을 도입하며 기존 범용 LLM 의존 구조에서 벗어나는 행보를 보이고 있다. CEO Arvind Jain이 강조한 "task-specific model" 접근은 RAG(Retrieval-Augmented Generation)의 한계를 극복하기 위한 것으로, 각 기업의 권한 그래프(permission graph)와 문서 임베딩, 사용자 행동 신호를 결합해 도메인 특화 검색·추론 능력을 강화한다. 핵심은 ① 기업별 컨텍스트를 반영한 파인튜닝된 임베딩 모델, ② 권한·ACL을 보존한 vector store, ③ 워크플로우 자동화를 위한 에이전트 오케스트레이션 레이어의 결합이며, 이는 단순 키워드 매칭이나 GPT-4o 같은 범용 모델의 단순 RAG로는 도달하기 어려운 정확도와 보안 수준을 목표로 한다.
개발자/엔지니어 관점에서 가장 큰 영향은 "사내 지식 검색"이라는 일상 업무가 IDE와 워크플로우에 직접 통합된다는 점이다. 예컨대 특정 마이크로서비스의 장애 대응 가이드, 과거 인시던트 포스트모템, 관련 PR과 Slack 스레드를 한 번의 자연어 질의로 모아볼 수 있고, Glean Agents를 통해 "이 PR의 리뷰어 후보 추천", "관련 Jira 티켓 자동 링크"처럼 반복 작업을 위임할 수 있다. 반면 Microsoft Copilot, Google Agentspace, Notion AI 같은 빅테크 통합 솔루션과의 경쟁이 심화되면서, 각 벤더가 자체 모델을 들고 들어오는 흐름은 향후 사내 검색 인프라 선택 시 "범용 모델 + 벡터 DB 직접 구축"이냐 "수직 통합 SaaS"이냐의 의사결정 비용을 더 키운다.
한국 개발자가 실무에서 챙겨야 할 포인트는 세 가지다. 첫째, 기업 검색 시스템을 직접 구축한다면 단순 RAG가 아닌 권한 모델·사용자 행동 로그·도메인 어휘를 반영한 reranker와 하이브리드 검색(BM25 + dense)을 설계해야 Glean 수준에 근접할 수 있다. 둘째, 보안·컴플라이언스 측면에서 source-level ACL을 답변 생성 단계까지 일관되게 전파하는 것이 핵심이며, LangChain·LlamaIndex 같은 프레임워크를 쓰더라도 권한 필터링은 retrieval 이전에 강제해야 한다. 셋째, "task-specific model" 트렌드는 곧 자체 데이터로 소형 모델을 파인튜닝하거나 distillation해 추론 비용을 낮추는 흐름을 의미하므로, 사내 도입 검토 시 토큰 단가뿐 아니라 응답 지연(latency)과 캐시 hit rate, 사용자 피드백 루프 설계까지 함께 평가하는 것이 중요하다.
관련 기사
업무 중 ai에 물어본 영어가 나만의 퀴즈가 된다면 lingoq
Naver CLOVA Tech Blog ·
PwC는 클라우드를 도입해 기술 개발 및 거래 실행을 통해 기업 기능을 혁신하고 있다
Anthropic News ·
블랙스톤, 헬먼 앤드 프리드먼, 골드만삭스와 함께 새로운 기업 AI 서비스 회사 설립
Anthropic News ·
GITEX AI 유럽
AI Business · 방금 전
5개 실험실, 5개의 사고: 소형 모델을 기반으로 한 다중 모델 금융 드라마 구축
HuggingFace Blog · 2026년 6월 7일 AM 04:02