【机器人】复现 StreamVLN 具身导航 | 流式VLN | 连续导航
StreamVLN 通过在线、多轮对话的方式,输入连续视频,输出动作序列。通过结合语言指令、视觉观测和空间位姿信息,驱动模型生成导航动作(前进、左转、右转、停止)。论文地址:StreamVLN: Streaming Vision-and-Language Navigation via SlowFast Contex
