이 스타트업은 인도의 글로벌 경제가 세계의 로봇을 훈련할 수 있다고 베팅한다
This startup is betting India’s gig economy can train the world’s robots
핵심 요약
- ▸인도의 티켓을 이용해 AI 및 로봇 연구소가 필요로 하는 실제 물리적 훈련 데이터를 수집하고 있다.
- ▸인도의 프리랜서들이 카메라 장착 모자와 센서 장치를 착용해 데이터를 수집하고 있다.
- ▸이 데이터는 로봇 및 AI의 실제 세계에서의 작동을 향상시키는 데 사용된다.
- ▸이 기술은 로봇 및 AI의 실제 세계에서의 작동을 향상시키는 데 중요한 역할을 한다.
심층 분석
Human Archive는 로봇과 AI 모델 학습에 필요한 '실세계 물리 데이터(real-world physical data)'를 수집하기 위해 인도의 긱 워커들에게 카메라가 장착된 모자와 IMU(관성 측정 장치)·깊이 센서 등이 결합된 웨어러블 장비를 착용시키는 방식으로 데이터를 모은다. 기존 로봇 학습은 시뮬레이션이나 텔레오퍼레이션(원격 조작)으로 데이터를 만들어 왔지만, sim-to-real gap과 데이터 다양성 부족이 한계로 지적돼 왔다. 1인칭 시점(ego-centric) 비디오와 손·팔의 6DoF 모션, 환경 깊이 정보를 동시에 캡처하면 VLA(Vision-Language-Action) 모델이나 행동 클로닝(Behavior Cloning) 기반 휴머노이드 정책 학습에 필요한 멀티모달 데이터셋을 대규모로 확보할 수 있다. Meta의 Project Aria, Google DeepMind의 RT-2, Physical Intelligence의 π0 등이 모두 이런 데이터 갈증에 부딪힌 상황이라 'AI 데이터 노동의 글로벌 분업화'가 새 국면에 들어선 셈이다.
엔지니어 입장에서 이 흐름이 갖는 의미는 두 가지다. 첫째, LLM 시대의 데이터 라벨링이 텍스트 → 이미지 → 'embodied action'으로 확장되면서, 로봇/에이전트 스택에서 다루는 데이터 포맷이 RGB+IMU+pose+language annotation의 동기화된 시계열 데이터로 바뀌고 있다. 이는 HDF5/LeRobot dataset format, Open X-Embodiment 같은 표준에 익숙해질 필요가 있다는 뜻이다. 둘째, 인도·동남아 긱 이코노미를 활용한 데이터 수집 파이프라인이 본격화되면 Scale AI·Surge AI식 'human-in-the-loop' 인프라가 로보틱스 영역으로 확장되고, 이를 다루는 백엔드(데이터 검수·중복 제거·프라이버시 마스킹·timestamp sync)가 새로운 엔지니어링 시장으로 떠오를 가능성이 높다.
한국 개발자가 당장 체크해볼 만한 액션 포인트는 명확하다. (1) Hugging Face의 LeRobot, NVIDIA Isaac GR00T, Open X-Embodiment 같은 오픈 데이터셋·프레임워크를 직접 받아 fine-tuning을 돌려보면서 '물리 데이터 → 정책 학습' 파이프라인을 체감해 두는 것이 좋다. (2) 1인칭 비디오 데이터 처리에 필요한 SLAM, hand pose estimation(MediaPipe/HaMeR), 시간 동기화(PTP/NTP) 같은 주변 기술 스택을 미리 익혀두면 곧 늘어날 embodied AI 채용 시장에서 우위를 점할 수 있다. (3) 동시에 카메라가 부착된 웨어러블로 일반 행인·사적 공간이 무단 캡처되는 윤리·법적 이슈(GDPR, 한국의 개인정보보호법상 영상정보처리기기 규제)가 곧 표면화될 것이므로, 데이터셋을 사용할 때 라이선스·동의 범위·얼굴 블러링 여부를 반드시 확인하는 습관이 필요하다.