← 목록으로
업계동향중요도 높음 8.0

구글, 메타의 방식을 차용해 새로운 오디오 기반 스마트 글래스 발표

Google takes a page out of Meta’s book, announces new audio-powered smart glasses

TechCrunch AI··3분 읽기·3회 조회

핵심 요약

  • 구글은 사용자가 음성 명령을 통해 기능을 실행할 수 있는 '오디오 글래스'를 발표했습니다.
  • 이 기기에서는 구글의 앱 및 서비스 생태계, 특히 Gemini를 활용할 수 있습니다.
  • 이 발표는 구글이 스마트 글래스 분야에서 경쟁력을 강화하려는 의도를 보여줍니다.
  • 이 기술은 음성 인식과 AI 통합의 혁신을 보여주며, 개발자들에게 새로운 기능 구현 기회를 제공합니다.

심층 분석

구글이 발표한 '오디오 글래스(audio glasses)'는 디스플레이 없이 음성 입출력만으로 작동하는 경량 스마트 안경으로, 메타의 레이밴 메타 글래스와 유사한 폼팩터를 따른다. 핵심 기술 스택은 (1) 빔포밍 마이크 어레이를 통한 음성 캡처, (2) 골전도 또는 오픈이어 스피커를 통한 사적 오디오 출력, (3) 온디바이스 웨이크워드 탐지 및 클라우드 기반 Gemini 모델 호출의 결합이다. 디스플레이를 제거함으로써 배터리 소모와 무게, 발열 문제를 크게 줄였으며, 사용자의 발화는 ASR(Automatic Speech Recognition) → LLM 추론 → TTS(Text-to-Speech) 파이프라인을 통해 처리된다. 특히 Gemini Live의 실시간 멀티턴 대화 기능과 결합되어, 단순 명령 실행을 넘어 컨텍스트를 유지한 자연스러운 대화형 인터랙션이 가능해진 점이 기술적 차별점이다.

개발자 입장에서 가장 주목해야 할 변화는 '입력 인터페이스의 탈(脫)스크린화'다. 그동안 모바일 앱은 터치 UI와 GUI를 전제로 설계되었지만, 오디오 글래스 환경에서는 음성만으로 사용자의 의도를 파악하고 결과를 음성으로 돌려줘야 한다. 이는 곧 Voice-First UX 설계, 짧고 명료한 응답을 생성하는 프롬프트 엔지니어링, 그리고 백그라운드에서 동작하는 에이전트형 워크플로우(예: 일정 추가, 메시지 전송, 번역, 길찾기)의 중요성이 커진다는 의미다. 또한 안드로이드 앱은 Gemini Extensions 또는 App Actions를 통해 음성 명령에 노출되어야 진입 가능해질 가능성이 높아, 기존 딥링크/인텐트 설계를 음성 친화적으로 재정비할 필요가 생긴다.

실무적으로는 세 가지 액션 아이템을 검토할 만하다. 첫째, 자사 안드로이드 앱이 App Actions와 Gemini Extensions에 등록되어 있는지 점검하고, BII(Built-in Intent) 매핑을 보강해야 한다. 둘째, REST/gRPC API를 보유한 서비스라면 자연어 명령으로 호출 가능한 함수 시그니처를 LLM Function Calling 스키마로 노출하는 작업이 향후 웨어러블 통합의 진입점이 된다. 셋째, 오디오 응답의 지연(latency)이 UX의 핵심이므로, 응답을 스트리밍으로 분할 송출하거나 첫 토큰 지연(TTFT)을 줄이는 백엔드 최적화가 중요해진다. 한국 개발자들의 경우 한국어 ASR/TTS 품질과 한국어 컨텍스트에서의 Gemini 응답 정확도가 실사용 가능성을 좌우할 변수이므로, 정식 출시 전 베타 SDK 공개 시점에 한국어 시나리오를 우선적으로 검증하는 것이 좋다.

#구글#오디오 글래스#음성 인식#AI 통합#스마트 글래스
원문 보기 →

관련 기사