自研超少样本具身模型,为机器人提供「大脑」,「中科第五纪」连续完成两轮近亿元融资
36氪获悉,通用具身智能公司「中科第五纪」近日完成近亿元天使轮及天使加轮融资,天使轮融资由华睿投资、鼎晖百孚领投,金融城资本、复琢资本跟投,老股东卓源亚洲、同创伟业持续加注,天使加轮由国海创新资本投资。这是继上半年连续完成种子和种子+轮融资后,中科第五纪年内完成的第四轮融资。资金将主要用于算力、商业化及研发团队扩张。
中科第五纪创立于2024年底,致力于通过研发具身多模态端到端大模型,打造通用具身机器人等产品,核心团队来自中科院自动化所和清华大学。创始人兼CEO刘年丰为中科院自动化所博士,主要研究方向为人工智能及机器人技术和产品化落地,拥有近十年的创业实践经验。公司联合创始人、首席科学家孙富春为清华大学计算机科学与技术系教授,主要从事机器人主动感知与灵巧操作、具身智能和跨模态学习等研究,是国内最早一批研究智能机器人的领域专家。
据介绍,中科第五纪近期发布的具身操作基础模型FiveAges Manipulator-1(FAM-1),通过解决传统具身模型在三维空间理解上的结构信息丢失、分布偏移和维度瓶颈问题,能够以小样本数据训练实现机器人泛化能力,将数据利用效率提高百倍。
目前,中科第五纪已成为国内头部人型本体公司的“大脑”供应商,实现“一脑多型”技术落地;其自研的本体产品也已完成某头部家电集团和头部汽车企业产线POC验证,进入小批量供货阶段。今年年底,中科第五纪计划推出第二代软硬一体的具身机器人本体产品。
自研超少样本具身模型FAM-1 数据需求量仅为传统大模型的1%
数据瓶颈是限制具身智能模型性能和产品能力提升的关键因素。和自然语言、视觉模型相比,机器人是与真实的物理世界交互,具身模型需要处理三维、实时的感知-行动闭环数据。目前业内普遍面临的问题是,可用于训练的真实场景数据稀缺且采集成本高昂,合成仿真数据的质量又难以满足复杂任务训练需求。
为了提高数据使用效率,突破数据瓶颈,中科第五纪以机器人的“大脑”——模型技术架构为突破口,自主研发设计了FAM-1模型。
有别于传统的分层架构和常见的纯端到端架,FAM-1模型采用数据和知识混合驱动的端到端架构方案。利用三维热力图对齐VLM与VLA的输出与输入,将三维信息转换为多角度二维信息,减少空间信息的损失,从而只需要对有限数量的样本微调,就能充分利用三维空间结构信息,显著降低模型对样本数量的需求,同时保证具身大脑的推理能力和高泛化性。
基于FAM-1的模型能力,中科第五纪获得 2025年计算机视觉与模式识别会议(CVPR 2025))具身操作竞赛冠军。刘年丰表示,“FAM-1模型对数据的需求量只有传统大模型的1%,机器人只需要3-5条真机数据就可以完成精准具身操作学习,成功率高达 97%。”
形成数据产品飞轮 推动具身“大脑”与本体协同发展
在刘年丰看来,具身智能企业可以分为两类,一类偏重基础模型研发。“我们算是另一类,模型研发能力与产业落地能力并重,以真实工业场景的产品交付驱动模型进化。”
目前,中科第五纪可交付的产品形态包括向本体厂商提供“大脑”,以及可直接用于工业和商业场景的具身机器人本体。在大脑方面,中科第五纪已经与某头部本体公司在电力、商业和展览展示等多个场景建立合作,为其提供自主操作模型的解决方案。
在本体硬件方面,中科第五纪自研的双臂具身机器人,今年预计有数十台落地客户产线。据介绍,不同于传统机器人只能针对某款特定产品进行检测,中科第五纪具备更强的泛化能力,适配不同款式产品型号,并且已经24小时不间断在产线上运行并采集大量真机数据。
除了架构的创新化设计,模型能力的提升也有赖于真机数据的获取能力。刘年丰透露,中科第五纪计划建设自有的数据系统,采集产品在不同行业和工厂场景下的真机数据并进行统一处理,再反哺模型训练,形成模型与产品能力提升的良性飞轮。
刘年丰介绍,“我们在工业场景的核心标签是高效率和高可靠性,现在与家电客户的合作在事业部层面,明年会上升到更高层级的合作,落地场景从一个拓展到多个,在单KA客户体系内完成泛化。而下阶段我们会在工业场景的不同客户间进一步泛化。”据悉,中科第五纪的第二代本体也将在今年底问世。
在模型层面,刘年丰表示,“依托于FAM具身模型,我们能够在前期快速交付大脑或本体产品,形成数据与产品的飞轮闭环;在数据量积累到一定量级后,我们会用真实数据代替互联网数据,推出融合力触觉的通用VLTA多模态大模型。而实现这个目标的核心在于,谁能够更高效地获取真实数据,并且更高效地利用真实数据,这是我们始终注重去塑造和提高的能力。”
转载自36氪未来产业
文丨杨越欣
如有侵权,请联系删除
粤公网安备 44030702004173号