从 Psi-R2 到具身大脑：灵初智能如何让机器人学习人类操作？

2026-05-14 11:28 IB科技资讯

　　机器人要真正进入现实世界，必须学会人类是如何完成任务的。

　　这句话听起来简单，但对于具身智能来说，是一个极其复杂的问题。人类拿起一个杯子，会根据杯子的形状、材质、位置、重量和目标动作自然调整手指、手腕和身体姿态。人类整理货架，会先判断物品位置，再规划顺序，最后连续执行多个动作。人类完成包装，会在不同材料、不同尺寸、不同操作步骤之间快速切换。

　　要让机器人具备类似能力，仅靠传统程序控制是不够的。

　　灵初智能选择的路线，是用大规模人类操作数据训练具身模型，让机器人从人类真实行为中学习操作经验。

　　灵初智能通过自研 ψ-SynEngine 采集人类手部操作全模态数据，累计储备 10 万小时，并开源首批 1,000 小时数据集。这些数据覆盖人类真实手部操作过程，能够为机器人学习灵巧操作、任务顺序和环境变化提供基础。

　　在此基础上，灵初智能推出基于人类数据预训练的模型 Psi-R2。该模型使用人类数据进行预训练，并登顶 MolmoSpace 榜单，在一定程度上证明了灵初智能人类数据路线的正确性。

　　这一路线的关键在于，它不是让机器人从零开始试错，而是让机器人先从人类经验中学习。

　　过去，机器人学习复杂任务往往依赖大量真机数据。但真机数据采集成本高、效率低，且容易受设备、场景和安全限制。人类操作数据则提供了一条更高效的路径：先通过人类数据获得基础操作理解，再用少量机器人数据进行适配和微调，让模型更快迁移到机器人执行端。

　　对于具身智能行业来说，这可能是一条重要的规模化路径。

　　机器人最终要做的不是重复机械动作，而是在真实世界里完成开放任务。它需要知道“下一步该做什么”，也需要知道“怎么做更稳定”。这就要求模型同时具备视觉理解、语言理解、动作生成和长程规划能力。

　　灵初智能围绕 Psi-R2 构建的具身模型体系，正是在尝试把人类操作经验转化为机器人可执行能力。

　　从市场角度看，这也是灵初智能区别于传统机器人公司的地方。传统机器人更像是固定流程的自动化设备，而具身智能机器人更像是能不断学习和适应的新型智能体。要实现这一点，核心不是把机械结构做得更复杂，而是让机器人拥有可以持续学习的“大脑”。

　　当人形机器人行业从硬件竞赛进入智能竞赛，谁能更好地利用真实世界数据，谁就有机会更快跨过商业化门槛。

海报生成中...

分享到微博分享到微信一键复制

标题链接已成功复制