南极鹅
您的位置:光伏分布式光伏工商业光伏企业正文

GEIA 2026上海智能制造论坛:灵初智能温颖博士详解以人类数据为核心的具身智能落地方案

2026-05-19 08:23:23来源:互联网

近日,GEIA 2026智能制造论坛在上海落下帷幕,来自国内外产学研领域的代表汇聚于此,共同探讨人工智能与智能制造深度融合的前沿方向,议题涵盖具身智能、工业大模型、智能装备等核心领域。灵初智能首席科学家、上海交通大学人工智能学院副教授温颖博士受邀作为分享环节的核心主讲,带来了题为《基于人类数据打造具身灵巧操作通用模型》的主题演讲,系统拆解了团队在具身智能领域的技术路线与落地实践。 温颖博士在分享中明确,具身智能的规模化落地并非单点技术突破,而是一场跨越四个能力层级的系统性升级:从实验室阶段的单一抓取泛化(对应约1000小时数据量),到适配泛工业场景的五指灵巧操作(10万小时数据量),再到支撑泛物流、泛零售的半结构化环境长程任务规划(200万小时数据量),最终延伸至开放家庭场景的全自主服务(超1000万小时数据量)。每一层级的跨越,都意味着工程量级的跃升。目前灵初智能的产品正聚焦L2到L3的核心能力区间,将泛物流、泛零售作为首个商业化落地赛道。 制约这场升级的核心瓶颈,温颖博士直指数据短板。他表示,当前硬件迭代速度快、算力储备充足、算法框架也趋于成熟,唯独机器人操作数据的稀缺程度,成了具身智能从实验室走向真实世界的最大障碍——这也是其与大语言模型发展路径最显著的差距所在。目前具身智能领域既无类似ImageNet的标准数据集,也缺乏自然形成的数据闭环与规模化来源,如何构建可持续的数据飞轮,成为决定技术泛化能力的关键。 回顾行业过往探索,两条曾被寄予厚望的数据路径均难以支撑大规模落地:仿真数据虽成本低、易扩展,却受限于物理引擎对柔性物体、摩擦等物理过程的模拟精度,存在难以跨越的“仿真-真实”鸿沟,且场景多样性远不及现实世界;真机遥操作数据质量较高,但单套设备成本高达30至50万元,采集效率和场地灵活性受限,无法规模化部署,部分采集速度也难以匹配工厂产线节拍。 基于此,灵初智能选择以人类操作数据为核心的第三条路径。温颖博士指出,人类数据是唯一能同时满足规模、精度、多样性三大要求的数据来源,天然蕴含真实物理世界的全部复杂特性。在数据采集的优先级设定上,灵初智能明确了两大维度:模态层面以精准3D位姿为核心,其次是触觉数据,2D图像特征权重相对靠后;类别层面优先保障任务多样性,其次是物体多样性,环境多样性则按需覆盖,为人类数据的预训练奠定了工程基础。 为实现这一路径的工程化落地,灵初智能自主研发了“数据采集中心2.0”及首个具身原生人类数据采集方案Psi-SynEngine。这套方案以自研外骨骼数据采集手套为核心,能以亚毫米精度捕捉人手每根手指的三维运动轨迹,覆盖视觉、运动学、语音/文本、触觉四类全模态信息。目前单套设备成本已降至几千元,未来1-2年内目标进一步压缩至百元级别。轻量化的设计打破了专属采集场地的限制,工厂产线、商超货架、物流分拣区等真实作业场景,都能成为数据采集的源头。截至目前,灵初智能已在上海、北京及全国多地搭建数据采集网络,积累了近10万小时的人类手部操作全模态数据集。 在模型架构上,灵初智能的新一代具身基座模型由Psi-R2操作策略模型与Psi-W0动作条件型世界模型协同组成:Psi-R2以图像、机器人状态及文本指令为输入,预测动作序列,负责长程任务规划与连续子任务分解;Psi-W0则以感知数据与动作指令为输入,滚动预测未来帧,承担策略评估与轨迹修正的功能。温颖博士强调,当数据规模足够大时,人为设计反而会成为性能瓶颈。灵初智能仅在维度层面对齐人手与机器人的关节动作,以原始动作为训练目标,不进行人工修正或重建,直接输入原始图像开展大规模训练——这一思路与Richard Sutton提出的“苦涩教训”一脉相承,且已在大规模实验中验证了有效性。“当数据量达到一定规模,这些人类数据就能在不同机器人本体上实现良好的泛化效果——不是因为我们做了什么特殊设计,而是数据量本身就是答案。” 技术实力已获得权威认可:2026年4月,Psi-R2在由美国艾伦人工智能研究所发起的MolmoSpaces国际权威基准评测中位列全球第一,超越PI、DreamZero等国际主流模型。同时,灵初智能联合北京大学等机构提出的首个自我增强灵巧操作数据生成框架DexFlyWheel,已被NeurIPS 2025接收为Spotlight论文(入选率约3.2%)。该框架通过模仿学习、残差强化学习与数据增强的闭环迭代,能在仿真环境中实现数据规模与场景多样性的指数级扩增,为人类数据预训练后的工程化扩展提供了可持续的数据生成机制。学术与工程领域的双重成果,共同支撑起灵初智能“人类数据底座+双模型协同+仿真数据飞轮”的完整技术体系,巩固了其在行业内的领先地位。 在商业化落地方面,灵初智能将物流拣选作为首个突破方向。物流分拣中,与人手灵巧操作直接相关的工序占比约60%-80%,操作类型集中于抓取、扫描、放置,与当前模型能力高度匹配。据测算,国内仓内操作的可触达市场规模约6300亿元,全球市场规模约7.35万亿元。目前,灵初智能已与多家企业达成合作,在自动化拣选与智能供包分拣方向,模型的操作成功率与作业节拍已接近人工水平。 站在2026年具身智能技术路线分化与落地竞速的关键节点,灵初智能将持续以人类数据为核心底座,依托双模型架构,聚焦泛物流、泛零售场景,推动具身智能从技术榜单走向产业一线,从单点能力突破走向规模化商业闭环。未来,公司将凭借扎实的技术演进与开放的产业协同,与全球生态伙伴共同推进通用具身智能的发展,迈向行业新的里程碑。

特别声明:南极鹅转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明南极鹅*网的内容为南极鹅原创,转载需获授权。

阳光新能源查看更多>工商业光伏查看更多>屋顶光伏查看更多>