NAVI-Orbital: 최초의 궤도에서의 제로샷 비전-언어 모델 시연
NAVI-Orbital: First In-Orbit Demonstration of a Zero-Shot Vision-Language Model for Autonomous Earth Observation
NAVI-Orbital은 저지구 궤도(LEO) 우주선에 배포된 소프트웨어 시스템으로, 2026년 4월 16일에 비전-언어 모델을 사용하여 자율적인 다중 모드 추론을 궤도에서 수행한 최초의 사례를 기록했다. 이 시스템은 Gemma 3라는 로컬 비전-언어 모델을 활용하여 캡처된 장면을 분류하고, 그 내용과 특징 간의 관계를 설명하는 텍스트를 생성하며, 자연어 대화로 운영자의 후속 질문에 응답한다. NAVI-Orbital은 전통적인 명령어 시퀀스 대신 일반 영어 프롬프트로 재작업되며, LangGraph라는 그래프 기반 상태 기계에 의해 조정된다. 지상 벤치마킹에서 88.16%의 정확도를 기록했으며, 위성급 엣지 컴퓨터에서 기초 모델을 실행하여 지구 관측 데이터를 궤도에서 의미적으로 압축할 수 있는 가능성을 보여주었다.
이 시스템은 우주에서의 데이터 처리 방식을 혁신적으로 변화시켜, 지구 관측 데이터의 실시간 활용을 가능하게 한다.
원문 출처
arXiv cs.AI