对话松延动力姜哲源、胡晨旭:人形机器人从空翻炫技到商业落地的系统思考
作者:系统管理员
发布日期:2025-04-21
浏览次数:
4月19日,全球首个人形机器人半程马拉松,松延动力喜提亚军。凭借优秀的硬件结构和运控系统,松延动力印证了其在激烈的人形机器人赛道的技术实力。身高1.2米,重30公斤的“小短腿”N2机器人也成功“圈粉”。此前,它还凭借3.99万元起的“技术普惠”售价创造同类产品“全球价格最低”,引起行业热议。 近期首程资本CAN+新质生产力实验室活动,首程资本投资总监许彪与松延动力创始人团队展开深度对话,围绕"硬件先行or算法主导"技术路径、硬件构型与场景关联、炫技与价值创造、差异化竞争策略等展开详细探讨,展现了这家“产品驱动”公司对人形机器人商业落地的收敛思考。 我们整理了对谈内容,在人形机器人不断取得技术突破的当下,共同拆解背后的技术焦点与产业价值。
人形机器人如何从前后空翻到商业落地 许彪:今年开年以来,机器人赛道火爆。目前整个行业也出现了一些变化,比如两种发展路径:一种是从本体硬件入手,逐步向智能化延伸;另一种则是采取自上而下模式,优先开发控制中枢(大脑/小脑)再拓展至本体。这两种路径未来会形成竞争关系,还是可能走向技术融合? 姜哲源:松延动力作为一家产品驱动公司,一切出发点都是基于用户需求。我们之所以选择从本体往上做,是因为我们认为本体能为用户提供价值。目前为止,VLA无论做得多好,短期内都是很难提供价值的。 所有的算法公司都处在强调data的阶段,就是数据驱动算法。比如扫地机器人,用户下载APP同意协议后,它就会开始收集数据。未来的机器人公司也不可避免会去做这件事。所以我个人理解,从本体出发的企业和从算法出发的企业合作机会可能比较少,因为有一些问题无法达成共识,比如数据到底归谁?是共享吗?由谁迭代这些模型?如果无法解决数据归属问题,竞争关系更可能占主导。 许彪:近期松延动力展示了机器人连续后空翻,宇树科技展示了机器人武术等动作,但这些对于工业或ToB场景的商业价值比较难衡量。松延动力比较核心的商业价值体现有哪些?姜哲源:从长远来看,其实通用移动本质上解决的是多地形的问题,也就是我们们讲的:人能走的地方都能走,人不摔地方都不摔,这个是最核心的价值所在。目前,我们已发现多个应用场景,跟踪拍摄就是其中一个典型场景。后续我们也将针对这些场景推出小型的消费级机器人,实现价值落地。许彪:做到消费级还需要多长时间?是否会像大疆一样,先去定义硬件平台,然后给合作伙伴进行二次开发吗?姜哲源:当年可以这么干,现在就很难了。我们会直接把基础功能做到足够好,不是简单的跟拍,而是专业级的运镜,会有云台和APP协同。在无人机市场,Hover Camera及DJI Neo等已实现运镜功能,但存在明显短板:续航极短。有个股东朋友是网球重度爱好者,他买了DJI Neo用来跟拍网球,但每隔十分钟就要下来换电池,这就是一个很大的痛点。而且无人机还不稳定,容易受大风影响。 如果用我们的机器人,第一不受禁飞影响,第二续航可以长达两小时,第三运镜很稳,因为我们会使用轮足式底盘设计,路径规划、track都会很准。 许彪:今年开始,大家普遍认同强化学习是相对收敛的技术路径,强化学习在算法上还有哪些提升空间,通用移动技术还会有哪些突破? 姜哲源:从今年行业动态来看,市场上出现了很多很fancy的Demo,包括空翻、武术或拳击。这些演示几乎全部依赖于预设路径(盲走),类似于蒙住双眼行走,完全缺乏环境感知能力。这种模式与人类行为存在显著差异,是行不通的。用户更希望机器人可以跟他打招呼、随着音乐跳一支舞等等。我们未来要做的就是把听觉、视觉等各种感知能力深度融合到运动控制中,构建一个多模态的、更加通用的运动平台。目前行业内也有相关公司在探索。 许彪:从硬件构型来看,国内如宇树等公司主要采用基于半直驱执行器(QDD)的关节构型,而海外如特斯拉则采用直线关节构型。你认为未来硬件构型会趋向于统一吗?我们在硬件构型方面是否有迭代计划? 姜哲源:硬件构型的选择应基于应用场景和用户需求。特斯拉之所以采用滚柱丝杠构型,是因为适配工业场景。机器人蹲起动作中,滚柱丝杠能够保持较为稳定的电流输出,避免了半蹲状态下的高能耗问题。此外,滚柱丝杠在不同角度下的力学特性较为一致,有助于降低过热和能耗。这种构型对于工业成本控制较有优势。 国内许多公司并未采用这个方案,主要是因为其产品定位并非工业级。对于消费级或科研级场景,QDD构型更为合适,因为它控制简单、数据简单,且硬件设计更具平台化优势。我们目前对工业场景是敬而远之的,可能不会跟进滚珠丝杠方案。但对于以工业应用为基础的公司,他们可能会选择跟进。因此,针对不同场景和价值形态,我认为硬件构型的发展趋势可能会出现分化。 许彪:请问胡博士,松延动力的仿生人脸产品目前处于什么阶段?以及与人形机器人结合的进展? 胡晨旭:我们的仿生人脸与人形机器人结合预计在9月份左右会有较为成熟的亮相。她会是一个全尺寸女性形象,整体风格偏向科幻风格。身体部分会有一些结构外露,不会完全包裹在硅胶中,但脸部会使用硅胶。 许彪:与海外的索菲亚等产品相比如何? 胡晨旭:我们在技术上相对领先。今年最重要的目标是尝试量产,并在多个场景中进行部署,同时教育市场和用户。我们手头已经有明确的订单,数量在几百台左右,场景也比较清晰。关键是要将产品真正落地到场景中,打造标杆案例,这样才能进一步巩固领先地位。搭建一台样机并不难,2023年9月时,一个没有背景的团队只需要三个月就能做出一台能行走的机器人。真正的竞争力在于量产能力和场景落地的深度。只有在实际场景中经过实践,客户才会买单。 许彪:完全同意这一点。我们在量产和交互方面是否已经积累了一些经验?现在的生产方式是什么? 胡晨旭:目前我们是国内唯一能够大批量出货高仿真、高自由度人脸的企业。其他企业要么做得不够真,要么没有量产能力,还在用影视特效或“手搓”的方式在做。我们预计在下半年实现每月150台的生产能力。 目前主要依靠组装生产,随着量产规模扩大,我们会寻找更稳定的供应商。电机成本其实并不高,占总BOM的15%~20%,内部结构架的成本则较高,因为这些部件设计精巧且多为异形,一个小零件的加工成本就高达200多元,而开模后可能降至几毛钱。此外,脸皮材料上也在优化,目前使用的进口硅胶材料成本较高,我们计划寻找国产硅胶供应商,在同样效果下成本降至1/10。 许彪:目前市场上从事人形机器人研发的公司可能有三五十家,若加上具身智能领域,总量接近百家。在激烈的行业竞争中,你们的核心竞争优势是什么? 姜哲源:虽然赛道内参与者众多,但真正专注于本体研发,尤其是以产品驱动为核心的公司并不多,可能最终会收敛至10家以内。我们需要关注的是这十家之间的差异化竞争。松延动力的核心差异化优势主要有两点: 第一,把高性能机器人卖到便宜的价格带。类似当年小米手机、以及近期小米SU7 ultra的定价策略,在不同价格带与其他公司竞争。 第二,我们已经初步具备量级研发与交互能力。这两点将加速我们今年的商业化进展。 胡晨旭:差异化的前提是做好基础能力,尤其是硬件的量产能力。人形领域,我们的差异化主要包括小型化与低价策略,并配备完善的硬件平台和教学体系。场景上我们计划进一步拓展教育市场并下沉至普通本科、专科乃至中小学,通过优化教程提升产品接受度。人脸方面,我们已经处在领先身位,在当前玩家数量不多的情况下,尽力提升产品稳定性和量产能力,做好不同场景中的标杆案例。 人形机器人何时进入家庭? 许彪:预计人形机器人进入家庭的时间节点是什么?目前有哪些卡点或难点?还有哪些问题需要解决? 姜哲源:我们初步预计3-5年后。当前的主要卡点在于数据,全球具身智能领域普遍面临数据缺乏的问题。大家已经收敛达成一个共识那就是:必须使用真实机器在现实世界中采集的数据,仿真数据难以满足需求。我们正在基于一些开源工作进行改进,探索新的数据采集方案。按照目前的规划,假设今年采集10万小时数据,明年采集100万小时,我们预计三年内能够积累一个初步实现具身智能涌现的大数据集。 胡晨旭:人形机器人进入家庭的关键在于把操作做好。如果仅考虑操作功能,而不涉及底盘设计(无论是双足还是轮式),可能还要三到五年。最大的卡点在于泛化性和通用性。目前,所有厂商的演示大多局限于特定场景:虽然机器人能执行诸如抓取不同颜色的杯子等任务,但仅限于特定场景和物品。 当需要泛化能力时,通常需要额外的100条数据,但你不能让用户自行采集这些数据并部署。因此,通用性是一个重大挑战。解决这一问题的关键就在于数据。 人工智能的发展依赖于算法、算力和数据三个因素,而目前具身智能最大的短板是数据,算法和算力的问题我还没感觉到,因为尚未达到最终形态。如果数据解决后仍无法实现泛化性,那么走入家庭这件事可能就需要更长时间了。 许彪:强化学习在多个领域(包括大语言模型)的收敛上已成为明确方向,为什么仿真与强化学习的结合无法成为上肢操作的主流路线,而真机数据采集才是关键? 姜哲源:我认为还是看场景。例如,在单一场景,比如用吸盘从货架上取物,仿真完全可以解决问题,甚至不需要物理引擎,仅通过渲染器即可完成。 然而涉及到物理引擎时,仿真技术就搞不定了。我让机器人做西红柿炒鸡蛋,这个过程怎么仿?蛋清和蛋黄怎么融合?蛋怎么由液态变熟成固态?这不是简单的物理仿真,而是分子级别的模拟。如果仿真能够解决所有问题,我觉得是挺荒谬的。 Q&A:机器人投资的底层逻辑 Q:近期与部分投资人交流时,发现许多未入局的同行存在想投但是“当前估值过高、方向不明”的焦虑。可否请许彪总分享首程资本在机器人领域的投资策略和逻辑?以及未来关注方向? 许彪:过去十年甚至二十年间,机器人行业的投资并不算成功。无论是第一代工业机器人,还是第二代垂类机器人,都存在一些问题。 工业机器人高度依赖下游行业的发展,例如3C产业和汽车产业。这些行业的发展带动了国产替代的需求,但目前下游行业(如光伏、锂电)已无法支撑大规模行业增量,而且工业机器人项目大多已进入上市阶段。协作机器人也未能找到大规模商业化的应用场景,按摩、艾灸等小众场景市场规模有限。而垂类机器人更多是“面子工程”,实际替代人工的效果有限。例如,商超中部署扫地机器人更多是为了提升物业费,而非真正替代保洁工作。这些机器人的ROI难以跑通,智能化水平不足以支撑大规模商业化。 要想改变机器人行业,投资必须聚焦两点:第一是独立终端产品。人形机器人和具身智能机器人是独立终端产品,直接面向终端用户,摆脱了对下游行业的依赖。这种模式带来了更大的市场空间(如千亿甚至万亿级的市场规模)。相比之下,传统机器人产业链(如零部件产业)的上市公司数量较少,而汽车产业链的相关企业多达三四百家,机器人产业仍有巨大潜力。 第二是AI赋能。 这一轮机器人热潮主要由人工智能驱动,而非单纯的机械性能提升。AI技术的提升解决了机器人泛化性和通用性的问题。新进入机器人行业的创业者大多具有AI或具身智能背景,这推动了机器人行业的智能化。 我们投资的项目中有一半左右都是人形与具身方向,因为我们认为它会成为下一个新能源汽车主机厂,或者像AR/VR一样的智能终端。从这个角度看,人形机器人的多点布局是很有机会的。 我们会继续沿着本体往上做一些部署。人形机器人会改变整个供应链的格局,上市公司中有很多人形机器人的供应商,但是传统的减速器、电机等跟人形机器人并不是完全适配的。传感器也是今年新的突破领域,机器人必将依赖触觉等多模态输入,而不仅仅是视觉和激光雷达,这也将是我们重点关注的布局方向。同时,我们不仅关注人形机器人本身,还投资了无人机等其他形态的智能硬件,这些硬件虽形态不同,但都具备独立的场景,我们也希望在AI赋能硬件领域找到更多解决方案。 |