南极鹅
您的位置:光伏分布式光伏工商业光伏企业正文

GEIA 2026智能制造论坛在沪举办 灵初智能温颖博士发布以人类数据为核心的具身智能技术体系

2026-05-18 09:34:53来源:互联网

近日,聚焦人工智能与智能制造深度融合前沿议题的GEIA 2026智能制造论坛在上海开幕,来自国内外学术界、产业界的代表齐聚一堂,围绕具身智能、工业大模型、智能装备等方向展开深度研讨。灵初智能首席科学家、上海交通大学人工智能学院副教授温颖博士受邀担任主讲嘉宾,系统分享了以人类数据为核心构建具身灵巧操作通用模型的技术路径与落地实践。 温颖博士提出,具身智能从实验室走向真实场景,需跨越四层能力阶梯:第一层是单一抓取泛化,对应科研实验室阶段,仅需约1000小时数据支撑;第二层是五指灵巧操作,适配泛工业场景,需积累10万小时数据;第三层是半结构化环境下的长程任务规划,可覆盖泛物流、泛零售领域,数据需求攀升至200万小时;最高阶则是开放环境下的家庭服务,数据量需突破1000万小时。每一层级的跨越,都意味着工程量级的指数级增长。目前灵初智能的产品正聚焦第二到第三层的核心区间,将泛物流、泛零售作为首个落地场景。 在这场能力跃迁中,数据是核心瓶颈。温颖博士直言,当前硬件迭代速度快,算力储备充足,算法模型也日趋成熟,但与大语言模型相比,机器人操作数据的缺口极为显著——具身智能领域至今没有像ImageNet那样的标准数据集,缺乏自然形成的数据闭环,规模化数据来源更是稀缺。如何搭建可持续的数据飞轮,成为决定具身智能能否拥有泛化能力的关键。 行业此前曾尝试过两条技术路径,但均难以支撑大规模落地:仿真数据成本低、易扩展,却受限于物理引擎对柔性物体、摩擦、流体等物理过程的模拟精度,仿真与真实场景之间存在难以逾越的鸿沟,且场景多样性远不及真实世界;真机遥操作数据质量高,但单套设备成本高达30万至50万元,采集效率和场地灵活性受限,难以规模化部署,部分采集速度甚至无法匹配工厂产线的节拍要求。 基于此,灵初智能选择了第三条路径——以人类操作数据为核心。温颖博士指出,人类数据是唯一能同时满足规模、精度、多样性三大要求的数据来源,天然蕴含真实物理世界的全部复杂性。在数据采集的优先级设定上,灵初智能明确:模态层面以精准3D位姿为先,其次是触觉,最后是2D图像特征;类别层面则优先保障任务多样性,其次是物体多样性,最后是环境多样性,为人类数据的预训练打下了工程基础。 为将这一路径落地,灵初智能自主研发了“数据采集中心2.0”及首个具身原生人类数据采集方案Psi-SynEngine。这套方案以自研外骨骼数据采集手套为核心,能以亚毫米精度捕捉人手每根手指的三维运动轨迹,同时覆盖视觉、运动学、语音/文本、触觉四类全模态信息。目前单套设备成本已压缩至几千元,未来1-2年内目标降至百元级别。轻量化设计打破了数据采集场景的限制,工厂产线、商超货架、物流分拣区等任何真实作业场景,都能成为数据采集点。截至目前,灵初智能已在上海、北京及全国多地部署数据采集网络,积累了近10万小时的人类手部操作全模态数据集。 在模型架构上,灵初智能的新一代具身基座模型由Psi-R2操作策略模型与Psi-W0动作条件型世界模型协同组成。Psi-R2以图像、机器人状态和文本指令为输入,预测动作序列,负责长程任务规划与连续子任务分解;Psi-W0则以感知信息和动作为输入,滚动预测未来帧,承担策略评估与轨迹修正的功能。当数据规模足够大时,人工设计反而会成为性能瓶颈。灵初智能仅在维度层面对齐人手与机器人的关节动作,以原始动作为训练目标,不进行人工修正或对齐重建,直接输入原始图像开展大规模训练。这一思路与Richard Sutton提出的“苦涩教训”理论一脉相承,且已在大规模实验中验证有效。温颖博士表示:“当数据量达到一定规模,这些人类数据就能在不同机器人本体上实现良好的泛化效果——这并非源于特殊设计,而是数据量本身带来的答案。” 模型性能方面,2026年4月,Psi-R2在美国艾伦人工智能研究所发起的MolmoSpaces国际权威基准评测中位列全球第一,超越PI、DreamZero等国际主流模型。同时,灵初智能联合北京大学等机构提出的首个自我增强灵巧操作数据生成框架DexFlyWheel,已被NeurIPS 2025接收为Spotlight论文(入选率约3.2%)。该框架通过模仿学习、残差强化学习与数据增强的闭环迭代,能在仿真环境中实现数据规模与场景多样性的指数级扩增,为人类数据预训练后的工程化扩展提供了可持续的数据生成机制。学术与工程领域的双重成果,共同支撑起灵初智能“人类数据底座+双模型协同+仿真数据飞轮”的完整技术体系,巩固了其在行业内的领先地位。 在场景落地方面,灵初智能将物流拣选作为商业化的首个突破口。物流分拣中,与人手灵巧操作直接相关的工序占比约60%-80%,操作类型集中在抓取、扫描、放置,与当前模型能力高度匹配。据测算,国内仓内操作的可触达市场规模约6300亿元,全球更是达到约7.35万亿元。目前,灵初智能已与多家企业达成合作,在自动化拣选与智能供包分拣方向,模型的操作成功率与作业节拍已接近人工水平。 站在2026年具身智能技术路线分化与落地竞速的关键节点,灵初智能将继续以人类数据为底座,以双模型架构为核心,聚焦泛物流与泛零售场景,推动具身智能从技术榜单走向实际产线,从单点能力转向规模化商业闭环。未来,公司将持续深耕技术演进,开放开展产业协同,与全球生态伙伴共同迈向通用具身智能的下一个发展阶段。

特别声明:南极鹅转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明南极鹅*网的内容为南极鹅原创,转载需获授权。

阳光新能源查看更多>工商业光伏查看更多>屋顶光伏查看更多>