TrackVLA 是银河通用推出的一款具有革命性的导航大模型,它具备以下八大核心能力:
1. 自然语言理解与目标识别:能够理解简单的语言指令,并识别并跟踪指定的目标,如“跟着妈妈”或“换成跟孩子”。
2. 复杂环境下的跟随能力:即使在人流密集的购物中心等复杂环境中,也能准确识别并长时间跟随原始目标。
3. 目标丢失后的找回能力:如果跟踪的目标暂时离开视野,TrackVLA能够通过空间智能和大模型推理能力重新找回目标。
4. 无需建图的导航能力:不依赖于预先建立的地图,依靠纯视觉输入来理解环境,并在陌生环境中实现稳定自主跟随。
5. 灵活避障与复杂场景适应性:能够实时识别障碍物,并分析出可通行区域,自主推理出合理的路线。
6. 强鲁棒性的环境适应性:无论是室外阳光还是室内昏暗环境,TrackVLA都能展现出强大的适应性,无需调整参数。
7. 远程可视守护:通过App,用户可以实时查看机器人的第一视角,监控家人动态,系统还能主动提醒风险行为。
8. 零样本泛化能力:TrackVLA不仅能跟随人类,还能泛化至任意移动目标,如跟随偶遇的动物,即使这些目标的形态和运动方式在训练时未被特别教导过。
TrackVLA的发布标志着机器人导航技术的重大突破,使得机器人能够无需建图、不依赖遥控、自主推理、智能交互。它的应用范围广泛,从陪伴儿童到守护老人,从商场巡逻到室内物流等多个泛服务场景。未来,TrackVLA将赋能不同形态的机器人本体,加速具身智能行业的发展,并在社会服务领域创造更多价值。