机器人要真正进入现实世界,必须学会人类是如何完成任务的。
这句话听起来简单,但对于具身智能来说,是一个极其复杂的问题。人类拿起一个杯子,会根据杯子的形状、材质、位置、重量和目标动作自然调整手指、手腕和身体姿态。人类整理货架,会先判断物品位置,再规划顺序,最后连续执行多个动作。人类完成包装,会在不同材料、不同尺寸、不同操作步骤之间快速切换。
要让机器人具备类似能力,仅靠传统程序控制是不够的。
灵初智能选择的路线,是用大规模人类操作数据训练具身模型,让机器人从人类真实行为中学习操作经验。
灵初智能通过自研 ψ-SynEngine 采集人类手部操作全模态数据,累计储备 10 万小时,并开源首批 1,000 小时数据集。这些数据覆盖人类真实手部操作过程,能够为机器人学习灵巧操作、任务顺序和环境变化提供基础。
在此基础上,灵初智能推出基于人类数据预训练的模型 Psi-R2。该模型使用人类数据进行预训练,并登顶 MolmoSpace 榜单,在一定程度上证明了灵初智能人类数据路线的正确性。
这一路线的关键在于,它不是让机器人从零开始试错,而是让机器人先从人类经验中学习。
过去,机器人学习复杂任务往往依赖大量真机数据。但真机数据采集成本高、效率低,且容易受设备、场景和安全限制。人类操作数据则提供了一条更高效的路径:先通过人类数据获得基础操作理解,再用少量机器人数据进行适配和微调,让模型更快迁移到机器人执行端。
对于具身智能行业来说,这可能是一条重要的规模化路径。
机器人最终要做的不是重复机械动作,而是在真实世界里完成开放任务。它需要知道“下一步该做什么”,也需要知道“怎么做更稳定”。这就要求模型同时具备视觉理解、语言理解、动作生成和长程规划能力。
灵初智能围绕 Psi-R2 构建的具身模型体系,正是在尝试把人类操作经验转化为机器人可执行能力。
从市场角度看,这也是灵初智能区别于传统机器人公司的地方。传统机器人更像是固定流程的自动化设备,而具身智能机器人更像是能不断学习和适应的新型智能体。要实现这一点,核心不是把机械结构做得更复杂,而是让机器人拥有可以持续学习的“大脑”。
当人形机器人行业从硬件竞赛进入智能竞赛,谁能更好地利用真实世界数据,谁就有机会更快跨过商业化门槛。
海报生成中...