구글, Chrome을 AI 동료로 전환해 직장에서 활용
Google turns Chrome into an AI coworker for the workplace
핵심 요약
- ▸구글이 Gemini 기반의 '자동 탐색' 기능을 Chrome에 도입해 기업 사용자에게 제공합니다.
- ▸직원들이 연구, 데이터 입력 등 작업을 자동화할 수 있는 기능이 추가되었습니다.
- ▸이 기능은 업무 효율성을 높이고, 작업 자동화를 위한 새로운 방향을 제시합니다.
- ▸이 기능은 웹 브라우징을 기반으로 한 AI 기술의 진보를 보여주는 중요한 사례입니다.
심층 분석
구글은 Chrome 엔터프라이즈 버전에 Gemini 기반 'auto browse' 기능을 탑재하여 브라우저를 단순 렌더링 엔진에서 자율 에이전트 플랫폼으로 재정의하고 있다. 이 기술은 LLM이 DOM 트리와 접근성 트리(accessibility tree)를 분석해 페이지 구조를 이해한 뒤, 사용자 의도(자연어 프롬프트)를 클릭·입력·스크롤 등의 UI 액션 시퀀스로 변환하는 Computer-Using Agent(CUA) 패러다임에 기반한다. Chrome이 직접 제어하기 때문에 외부 자동화 도구(Selenium, Playwright)와 달리 인증 세션·쿠키·확장 프로그램을 그대로 활용할 수 있고, Gemini의 멀티모달 추론으로 SPA나 동적 렌더링 페이지도 스크린샷+DOM 혼합 방식으로 파싱하여 기존 RPA의 셀렉터 기반 자동화가 겪던 취약성을 상당 부분 해소한다.
개발자·엔지니어 관점에서 이 변화는 두 축에서 큰 파장을 가진다. 첫째, 내부 관리자 페이지·BI 대시보드·티켓 시스템 등 API가 없거나 레거시로 남아있는 사내 웹 도구들이 자연어 인터페이스로 자동화 가능해져 QA 리그레션 테스트, 배포 후 헬스체크, 운영 데이터 수집 같은 반복 작업의 비용이 급격히 낮아진다. 둘째, 반대로 본인이 개발한 웹 서비스가 'AI가 사용하는 대상'이 되므로, 시맨틱 HTML·ARIA 레이블·안정적인 data-testid 부여 같은 접근성 친화 설계가 곧 'Agent Experience(AX)' 최적화로 직결된다. 또한 CSRF·봇 탐지·캡차를 단순히 강화하면 합법적인 에이전트 워크플로까지 차단할 수 있어, 지금부터는 '사람 vs 봇' 이분법이 아닌 '승인된 에이전트 vs 악의적 자동화'를 구분하는 정책 설계가 필요해진다.
엔지니어가 당장 점검해야 할 행동 항목도 명확하다. 보안 측면에서는 브라우저가 사용자의 전 권한을 가진 상태로 LLM 판단에 따라 행동하므로 프롬프트 인젝션(웹페이지 내 숨겨진 지시문이 에이전트를 탈취하는 공격)이 새로운 OWASP급 위협으로 떠올랐다—CSP, `X-Robots-Tag`와 유사한 에이전트 제어 헤더, 도메인별 권한 화이트리스트를 조기에 검토해야 한다. 아키텍처 측면에서는 MCP(Model Context Protocol)와 Chrome DevTools Protocol을 연동하는 사내 에이전트 파이프라인이 빠르게 표준화되고 있으므로, 단일 업무 자동화 스크립트를 작성하기 전에 'tool calling + 브라우저 에이전트' 하이브리드 구조로 설계하는 편이 장기적으로 유리하다. 마지막으로 감사(audit) 로그 요구사항—어떤 에이전트가 어떤 데이터에 접근해 무엇을 수정했는지 추적하는 체계—는 GDPR·개인정보보호법 관점에서 선제적으로 대비해야 할 영역이다.