王鹤:北大90后教授,12亿资本押宝的银河通用创始人,拒绝模仿特斯拉,闯出中国具身智能新范式
作者:系统管理员 发布日期:2025-06-05 浏览次数:

图片

王鹤,图片来源:北京大学前沿计算研究中心官网

2023年,当全球创业者扎堆复制模仿特斯拉人形机器人时,北大博导王鹤——这位曾以物理竞赛金牌保送清华,又在斯坦福用自创模型(NOCS)改写了机器人抓取能力发展史的天才学者,带着他敏锐的商业思维和大胆创新的胆魄闯入具身智能创业赛道。

他用18个月拿下12亿融资,造出不做人形噱头的Galbot机器人;他砍去机器人产品双腿,换成轮式底盘,并专注开发机械臂抓取泛化能力;他从商业模式和技术逻辑两个层面破局,让中国的具身智能从实验室迈向商业战场。

01 早期经历

1.保送清华:启发硬件+算法融合思考

1992年出生的王鹤,在北京十一学校度过了六年中学时光。他在少年时代便展现出对理工科的强烈兴趣,高中时通过物理竞赛一路过关斩将,最终以优异成绩保送清华大学微纳电子学系。在本科期间主要研究半导体物理器件,参与了MEMS(微机电系统)相关研究。但他并未局限于传统电子学领域,而是主动探索交叉学科:他自学机器人学课程,加入清华大学机器人队,参与全国大学生机器人大赛(RoboMaster),在机械臂控制、视觉导航等模块中积累实践经验。这段经历让他意识到,硬件与算法的深度融合才是智能系统的未来。

2.斯坦福深造:首创NOCS模型,让机器人抓取能力更适配多种应用场景

2014年本科毕业后,王鹤赴斯坦福大学电子工程系攻读博士学位,师从美国三院院士Leonidas J.Guibas教授。这位教授是计算机图形学与机器人学领域的泰斗,在计算几何、几何建模、计算机图形学、计算机视觉、传感器网络等领域都有极高造诣。

在斯坦福期间,王鹤主导开发了归一化物体坐标空间(NOCS)模型。传统方法需要为每个物体单独训练模型,NOCS通过将物体坐标归一化,分三步对类中的每一个物体做规则化。

通俗来说,以前机器人要识别不同物体,得一个一个单独教(比如每个杯子、每个瓶子都要单独训练模型),遇到没学过的物体就不会认了。而NOCS模型就像给所有同类物体定了一个统一标准让同类物体(比如所有杯子)就有了一个统一的标准形态,机器人只需要学会识别这个标准,就能举一反三,不管遇到没见过的杯子是圆是方、是大是小,都能通过对比这个标准快速判断它的位置、朝向和大小。这样一来,机器人就不用为每个物体单独学习了,识别新物体的泛化性变强,比如能更灵活地抓取各种没见过的杯子、瓶子,让机器人的视觉系统更接近人类的通用识别能力,不再局限于死记硬背过的物体。

图片

NOCS模型物体坐标归一化示意图,图片来源:清华大学智能产业研究院

3.北大博导:教书育人与深耕科研

在还未从斯坦福毕业之时,王鹤就选定了要回国加盟北大,9月归国后他便创立了具身感知与交互实验室(EPIC Lab),继续拓展机器人视觉和操控的可泛化性。

教学方面,他开设了面向中高年级本科生的计算机视觉导论课程,取传统视觉模型的精华再辅以深度学习的优化,帮助学生在深度学习风靡的时代里更好地掌握与了解计算机视觉。

科研方面,王鹤笔耕不辍,2021-2023年间在CVPRICCVNeurIPS等顶会发表50余篇论文,三篇论文获得ICCV2023最佳论文候选、ICRA2023最佳操纵论文候选、Eurographics2019最佳论文提名奖。同时他也曾担任CVPR2022WACV2022的领域主席,Image and Vision Computing的副主编和诸多顶会的审稿人、程序委员,推动中国学者在具身智能领域的规则制定。2022年,他的论文《Normalized Object Coordinate Space for Category-Level 6D Object Pose and Size Estimation》获世界人工智能大会青年优秀论文奖,成为学术界公认的具身感知理论奠基人

02 突围:走出不同于美国具身智能模式的差异化发展道路

是什么让这位天才学者走出校园干起了创业呢?

王鹤在接受采访时提及了投身创业的初衷:他认为中国凭借硬件和本体的成熟度优势正在加速推动具身智能创业潮,2023年具身多模态大模型的出现,成为了他走出校园投身创业的关键契机。于是在20235月,王鹤和另一位联合创始人姚腾洲(硕士毕业于北京航空航天大学机器人研究所,曾就职于ABB集团上海机器人研发中心,拥有丰富的行业经验)共同建立了银河通用,王鹤很希望以具身智能为载体,让科研成果走出实验室,让机器人更好地服务于人类社会。

在创业之初,王鹤就对自己公司的商业模式做出了基本规划。他坦言美国具身智能发展的方向不是中国的发展模板,自己也不会照搬特斯拉的Optimus人形机器人。

王鹤在采访中分析美国具身智能巨头特斯拉的发展模式时提到,美国的具身智能机器人企业大多是钱多、胆大,不考虑初步的商业化落地问题,能做多少做多少。但王鹤劝诫中国企业不要照搬美国的模式,因为初创企业和他们的情况并不一致。

王鹤摒弃了美国企业先烧钱研发,再考虑商业化的传统路径,坚持边研发、边落地的策略。银河通用成立短短一年多时间,就与美团、制造业企业等达成多项合作,将技术成果迅速转化为商业价值。这种务实的发展策略,不仅让企业实现了自我造血,更赢得了资本市场的青睐。

202310月的亿元级天使+轮融资,到202467亿元天使轮融资,再到2024115亿元战略轮融资,银河通用成立一年多累计融资超12亿元,创下具身大模型领域融资纪录。

图片

Galbot机器人,图片来源:今日头条

03 革新:打破具身智能技术范式

在具身智能技术路线高度趋同的赛道中,王鹤延续了他在斯坦福开创技术范式的科研精神,重新定义了技术研发的底层逻辑。

他深刻洞察到,依赖真实场景数据采集的模式不仅效率低下,更难以满足机器人在复杂环境下的泛化需求。于是,他力排众议将三维合成数据技术确立为核心突破口。在王鹤的主导下,银河通用团队另辟蹊径,通过双目红外传感器获取多维信号,并创新性地融合扩散模型学习深度信息。这种技术路径的选择,打破了仅依赖图片模态的局限,使机器人的感知视野从二维平面拓展至三维空间。

为验证这一技术的可行性,王鹤带领团队构建了千万级规模的虚拟场景库,涵盖工业生产、家庭服务等多元场景。正是这种前瞻性思维,让银河通用在数据积累上实现了跨越式发展,相较于美国企业动辄数年的数据采集周期,其通过算法合成数据的方式,将研发效率提升数十倍。

20251月,银河通用推出全球首个完全基于合成数据预训练的具身大模型。该模型能够将人类语言指令、视觉信号与机器人全身传感器数据进行深度融合,直接输出精准的关节控制信号,在视觉理解、语言交互和动作执行三大层面展现出惊人的泛化能力。当其他企业还在为模型在新场景中的适应性问题头疼时,GraspVLA已能快速学习并执行从未训练过的任务,这背后正是王鹤对技术发展趋势的精准预判和大胆实践。

图片

银河通用公司主要的技术研究,图片来源:银河通用官网截图

04 务实:聚焦具身智能机器人实用性问题

王鹤在设计产品时会不断考量如何通过细节来增强机器人的实用性。

首先在产品外观设计上,王鹤便做出了大胆创新,砍掉了机器人的双腿。

在其他竞品公司热衷于打造人形机器人,追求类人形态时,王鹤却强调在当前技术条件下双足行走功能不仅成本高昂,而且在多数应用场景中并非刚需,反而会增加机器人的能耗与复杂性,具身智能机器人的功能点仍应聚焦在机械臂上。基于这一判断,银河通用的首款产品Galbot采用了独特的可折叠单腿+轮式底盘设计。在与美团合作的24小时无人药店项目中,Galbot凭借灵活的轮式底盘,能够在狭窄的货架间自由穿梭,通过双臂精准抓取药品,高效完成分拣与配送任务;在工厂车间,它可以轻松应对复杂地形,将货物快速搬运至指定位置,其工作效率与稳定性得到客户高度认可。

同时在设计产品时,王鹤强调要解决客户的真实痛点

为此,他带领团队深入工业生产、家庭服务等多个领域,挖掘用户在实际场景中的需求。针对工厂货品分拣中遇到的透明、高光材质物体难以抓取的问题,银河通用研发出泛化抓取技术,通过四代技术迭代,实现了对任意场景、任意堆叠、任意材质物体的高成功率抓取;在家庭服务场景中,Galbot掌握的开柜子、开抽屉、晾衣服等泛化操作技能,更是让机器人真正走进人们的日常生活,展现出具身智能的实用价值。这种以市场需求为导向的产品设计理念,让银河通用在商业化道路上走得更加稳健。

视频来源:银河通用

图片

银河通用机器人在美团买药门店的工作照片,图片来源:银河通用

从清华园的物理竞赛少年,到斯坦福实验室的科研先锋,再到北大讲台上的育人导师,王鹤始终在探索智能科技的边界。

而银河通用的诞生,不仅是他将学术理想照进现实的实践,更是中国具身智能产业蓬勃发展的缩影。

王鹤和他的银河通用正在具身智能这片新蓝海中破浪前行,他的故事,不仅是一位科研工作者的创业传奇,更是中国科技创新从实验室迈向产业化、推动未来智能生活变革的生动注脚。

人形机器人和具身智能仍处于极早期阶段,王鹤不同于特斯拉人形机器人发展模式的大胆创新以及尝试的结果将会如何?让我们拭目以待。

References:

[1]银河通用公司,https://www.galbot.com/

[2]抖音百科,王鹤词条,https://www.baike.com/wikiid/7406874560505184294?baike_source=doubao

[3]北京大学计算机学院,王鹤,https://cs.pku.edu.cn/info/1094/1777.htm

[4]北京大学前沿计算研究中心,新人新语|王鹤:在燕园探索具身人工智能,https://cfcs.pku.edu.cn/news/240467.htm

[5]晚点LatePost90后北大博导造人形机器人,不学特斯拉,https://www.toutiao.com/article/7403951037050126886/?upstream_biz=doubao&source=m_redirect

[6]铅笔道,90后北大博导干出超级独角兽:一年融资12亿,https://36kr.com/p/3051745893419656

作者:Zhu Moyi

文章来源:极思 TopMinds