谷歌DeepMind于周二发布了一款名为Gemini Robotics On-Device的新型语言模型,该模型可在机器人上本地执行任务,无需互联网连接。 基于该公司今年3月发布的Gemini Robotics模型,Gemini Robotics On-Device能够控制机器人的运动。开发者可以使用自然语言提示来控制和微调模型 ...
今年三月,谷歌推出了Gemini Robotics的“视觉语言动作”(VLA)模型,近日,他们再次推出该模型的升级版,名为Gemini Robotics On-Device。 根据谷歌的介绍,该模型是他们最强大的VLA模型,经过优化后,可在机器人设备上本地运行。 谷歌DeepMind高级总监兼机器人主管 ...
Runway 还发布了一个 GWM-1 Robotics SDK。 这是一款面向 Runway 机器人世界模型 API 的 Python SDK,可以基于机器人动作生成视频。 该 SDK 支持多视角视频生成和长上下文序列,并提供了与现代机器人策略模型无缝衔接的接口设计。 GWM Avatars ...
2025 年,谷歌在人工智能领域交出了一份颇具分量的成绩单。 在即将过去的 2025 年,谷歌在人工智能领域交出了一份颇具分量的成绩单。 曾因「发表了 Transformer 却痛失先机」而备受外界质疑,谷歌一度深陷「大模型掉队」的舆论漩涡。但这一年,谷歌用一系列 ...