2025 年,被称为具身智能机器人的量产元年,也被许多投资人视为交出答卷的窗口期。年中,两家国内机器人头部公司给融资市场来了个王炸。先有宇树完成了近 7 亿元的 C 轮融资交割并同步完成股份制改造,后有银河通用拿下 11 亿元 B 轮融资,刷新具身大模型机器人领域单笔融资纪录。这两家公司不仅在融资实力和产品竞争力上位居行业头部,同时也勾勒出了当下机器人创业的两条路径:做人形还是非人形的通用路线。值得一提的是,这里所指的人形指的是类人形的形态,即不仅拥有灵巧手,还拥有能运动的下肢。宇树的人形机器人代表产品是 G1 和 H1,都是仿照人类尺寸设计的双足人形机器人,银河通用的代表产品是 Galbot G1,是一款轮式双臂通用机器人,采用轮式底盘+可折叠单腿的设计。当下,入局具身智能机器人的玩家们也大多是在这道「A or B」的题里做选择,但跳出二维对立的思维框架,会发现这道看似非此即彼的选择题,答案远非唯一。
宇树与银河通用的路径分野宇树与银河通用,恰如硬币的两面,目前分别押注在机器人的两种不同形态,其选择背后是深刻的技术逻辑与商业考量。事实上,从创始团队背景差异便能窥见路径分野的端倪。王兴兴身兼宇树创始人、CEO、CTO 三职,毕业于上海大学机械工程专业的他,凭借研究生时手搓的 XDog 打开了创业大门。他是一个很典型的工程师,甚至在最近的志愿填报推荐里,他也表示想从事具身智能,需要多拧螺丝。而银河通用是由「科学家+行业老兵」搭建起来的,创始人兼 CTO 的王鹤,博士毕业于斯坦福,研究方向为具身智能、三维视觉感知与物理交互,联合创始人兼董事长的姚腾洲,曾任 ABB 集团机器人研发工程师,兼具技术背景与商业化经验。创始基因的不同使两家公司在核心技术路线上呈现出显著差异,宇树更偏向硬件,银河通用更偏向软件。宇树以硬件自研与运动控制为核心竞争力,强调机器人本体性能。其技术布局覆盖电机、减速器、激光雷达等核心零部件,自研比例超 90%,并开发了仿生 4D 激光雷达、足端力传感器等关键部件。在运动控制算法上,通过强化学习和多模态交互实现机器人在复杂地形的适应能力。其下人形机器人 G1 展现出了行业内较为领先的运动能力,不仅能跳舞、鲤鱼打挺,还能站上擂台打拳击赛。银河通用则聚焦具身智能大模型与场景泛化能力,技术路径依赖仿真数据驱动和端到端模型优化。其推出的全球首个十亿级仿真数据预训练模型 GraspVLA,突破零样本泛化能力,采用「仿真数据预训练+真实数据微调」范式,单周可生成十亿级「视觉-语言-动作」数据对,效率较传统方案提升 1000 倍。搭载自研大脑的 Galbot G1,抓取随机放置的透明、高光等物体的成功率达 95% 以上,同时也掌握了如开柜子、开抽屉、晾衣服等灵巧手泛化操作。此外,银河通用采用「大脑大模型」与「小脑大模型」分离架构,在二者联动下,Galbot G1 可以理解人类自然语言并根据语言指令与人类交互。产品形态的不同也让两家公司走上了不同的商业化路径。王兴兴在 2025 夏季达沃斯论坛表示宇树的年度营收已经达到了 10 亿元。2024 年宇树机器狗的销量达 2.37 万台,占全球近 70% 的份额,人形机器人的交付量也超过 1500 台。人形机器人方面,宇树基础款 G1 的定价为 9.9 万元一台,教育版 G1 在 17-35 万元区间,高性能版本 H1 售价 65 万元。而人形机器人的订单主要来自 B 端机构与新兴租赁市场,其中高校与科研机构是核心客户。而银河通用的商业化路径清晰指向可规模化复制的行业解决方案,深度渗透各垂直场景。目前 Galbot G1 已经应用于智慧药店、公共服务和工业制造三大场景里。王鹤预测今年将有数亿元收入。银河通用与美团合作打造无人药店,已落地 7 家门店,单店日处理 200+订单,错误率<0.1%。在药店端有一笔很明显的成本账,24 小时药店需 3 班倒人力,一台 Galbot G1 的售价是 70 万,部署机器人 3 年总成本会低于人力年支出。在奔驰、极氪工厂中,Galbot G1 承担天窗转运、料箱搬运等任务,替代工人完成重复劳作; 在比亚迪产线,机器人与无人车协同物流,提升了 15% 的装配效率。从发展逻辑和战略差异来看,宇树走的是「硬件定义体验+运动能力先行」的路线。通过自研核心零部件降低整机成本,推动人形机器人价格来到万元级,同时凭借机器人的高动态性能建立一定的技术壁垒。银河通用选择的是「模型定义场景+数据闭环驱动」,以大模型为底座,让机器人快速适配零售、工业、医疗等场景,再通过仿真训练+真实场景迭代,形成「技术-数据-商业化」正循环。可以说,宇树优先解决「如何让机器人像人一样行动」,银河通用优先解决「如何让机器人像人一样思考任务」。
做人形还是做通用,业内争论不止宇树和银河通用的选择并非孤例,它们代表了行业中两种鲜明的观点,即「做人形」还是「做通用」。围绕这一话题的争论从未停止,但深入分析,观点背后是共同的实用主义内核。「人形派」的首要论点就是终极场景适配性。人类世界是为人类身体设计的,「人形派」认为,在家庭、养老等服务场景中,人形能无缝使用人类工具和空间,因此是最适用的形态。像黄仁勋在今年的多次演讲中都表示支持人形机器人,他觉得人形可以很好地融入人类创造的世界里,同时完成人类为自己制定的任务,甚至他认为「人形是通用机器人能成功的唯一形态」。此外他也很看好特斯拉的人形机器人 Optimus。深圳市人工智能与机器人研究院常务副院长丁宁也表示,国内的工业体系想把一件事办成的话,首先需要有个对标的对象。以人类作为对标,大家会迅速地形成共识,集中精力把各项功能给发展起来。另一些「人形派」则以学习与迁移能力以及技术挑战的牵引价值作为论点。训练机器人模型需要大量的训练数据,人形这个结构更利于模仿学习人类的行为,并将仿真训练中习得的技能更有效地迁移到物理世界里。此外,做人形是对双足行走、全身协调及灵巧操作全方面的挑战。攻克这些难题,不仅能实现人形机器人的目标,更能反哺和推动整个机器人领域在驱动、控制算法、能源续航方面的技术进步,具有「技术溢出」效应。逐际动力的创始人张巍觉得机器人与物理世界交互的通用性,要靠人形机器人,而且是有两条腿的人形机器人。如果机器人要拥有通用的操作能力,做许多人能做的事,那双臂和双腿都是必须。已与多家汽车工厂合作的优必选,其创始人周剑也表示,在智能制造场景中,人形机器人是最通用的,同时也最符合人体工程学。未来人形机器人会从大规模结构化场景里走出去,拓展至商用服务场景、家庭场景。「通用派」从生产力出发,认为形态选择的第一性原则是任务需求与环境约束。像在高度结构化的工厂流水线上,机械臂是最优选;在堆满标准托盘的仓库里,AGV 会更高效;在崎岖的矿山,多足或轮式平台更为适用。百度 CEO 李彦宏、零一万物 CEO 李开复、猎豹移动 CEO 傅盛都持此观点,他们认为将机器变成人并非发展方向,机器在很多方面已经远超人类,没有必要使其拥有人形特质,而且大部分的应用场景不需要人形机器人。特斯拉机器人团队前负责人克里斯·沃尔蒂近期公开表示,擎天柱的外形设计并不实用,工业领域的大多数工作以高重复性为主,速度是关键,这类机器人在仓库、物流及制造领域效率可能较低。技术成熟度不足也是「通用派」的一大论据。谷歌创始人谢尔盖·布林表示,谷歌曾经收购过两家人形机器人初创公司,但又都转手卖掉,因为软件方面真的很不成熟,每次尝试推进的时候,都难搞出实用价值。星动纪元的创始人陈建宇指出,目前人形机器人的「小脑」相对于「大脑」「本体」的技术非常薄弱,如果只有「大脑」和「本体」,人形机器人「只是一堆会思考的烂铁」。剥开形态争论的外壳,业界不同声音的底层共识很明显,无论是选择人形还是非人形的通用平台,核心的评判标准都在于「适配性」和「实用性」。争论的焦点,最终都指向哪种形态在特定阶段、特定场景下,能更好地满足适配性与实用性的要求,从而更快、更有效地实现机器人在现实世界中的价值。
跑通具身智能与创造实用价值「All in 人形还是通用?」王兴兴和王鹤也给出了自己的答案。王兴兴表示他其实不坚持一定要做人形,他选择做人形是因为前期做机器狗,有很多可以复用的技术,人形就成了「顺理成章」的事情。轮子、底盘也是很实用的一种形态,他做人形,是因为人形机器人是结构最简单的通用机器人,人形可以提供更多情绪价值,再者从目前的 AI 技术来看,人形方便数据采集。如果未来 AGI 实现了,机器人形态一定会千奇百怪。王鹤认为通用机器人之路需要一个过程——逐步从「单一场景、多任务、可移动」过渡到「多场景、多任务」,最后实现「全场景、全任务」。在这个过程中,人形机器的形态上在不同阶段有它最适合、最经济、最稳定的载体,并实现在对应场景中「沿途下蛋」、创造价值虽然两家公司目前在产品形态上有明显的区别,但是在发展观念上,从未被当下的选择所局限。因为机器人真正活在物理世界的最后落点是跑通具身智能。评判机器人成功与否的终极标准,绝非其外形是否酷似人类,而在于它是否解决了真实世界的问题,如替代危险工种、提升生产效率,以及实现了规模化应用,影响力超越了实验室或有限的 Demo 展示。全身动态平衡、类人灵巧手操作目前在整个具身智能领域都是亟待攻克的难题,攻克这些难关,往往意味着在驱动、控制、感知、AI 等底层技术上拥有了重大突破,同时这些技术也可以迁移到其他形态的机器人身上。其次就是在终极场景验证以及降低成本的必要性上。面对像家庭等复杂环境时,人形还是具备天然的交互和操作优势,需要有人去铺路来验证可行性、探索应用模式,同时降低成本来让更多场景应用上人形机器人。宇树和银河通用看似分道扬镳的选择,其实是另一种层面上的「殊途同归」。在王兴兴看来,目前对于机器人行业最大的难点其实并不是硬件问题,而是统一的端到端的人工智能做得还不够好,而银河通用在做的就是端到端的大模型。而端到端的大模型需要投入到真实硬件中应用,加速数据收集,宇树做的正是低成本的硬件,而且推动了万元级机器人的普及,这也构成了对数据收集和大模型升级的反哺。银河通用的全球首个产品级端到端具身 FSD 大模型——TrackVLA,正是联合宇树的机器狗完成长程验证的,最近推出的 OpenWBT——一款开源的全身 VR 遥操作系统,同样是以宇树 G1 作为实验样机。从短期看,对于初创公司而言,在资金、人才、时间有限的情况下,当下聚焦于一条核心路径,人形或通用平台,是现实且明智的选择。这并非否定另一条路的价值,而是资源约束下的战略聚焦。从整个产业生态的长远发展来看,「做人形」和「做通用」绝非互相排斥的单选题,它们是互补共生的探索方向。究其本质,形态选择必须服务于价值创造。无论选择哪条路,成功的试金石都是能否让机器人真正具备在复杂物理世界中理解、决策、行动的能力,并最终在特定场景或广泛领域中落地生根,创造出实实在在的经济与社会价值。当「路线之争」回归到价值创造的朴素原点,我们便能清晰地看到,机器人产业需要有人」仰望星空」,也需要有人「脚踏实地」。