|
以VLA+MOE架构打造工业具身大脑,赛索德智能斩获千万级天使轮融资
作者:系统管理员
发布日期:2025-12-26
浏览次数:
作为一家深耕工业具身智能的创新企业,赛索德智能正构建"算法定义硬件"的机器人系统新范式。其核心方向是通过VLA(多模态融合)+MOE(混合专家模型)架构打造工业级具身大脑,专门适配多品种、小批量、定制化的工厂生产场景,精准填补当前市场中智能装配机器人的应用空白。 硬核团队护航技术落地,跨领域背景筑牢创新根基赛索德智能的核心团队汇聚了机器人技术、人工智能、工业场景应用等多领域的资深专家,为技术创新与商业转化提供了坚实支撑。 创始人孙鑫海拥有香港中文大学硕士学位,目前正在攻读清华-米兰理工管理工程PhD,其研究方向聚焦多模态融合下的空中交通流量预测与优化。凭借在安徽尼威动力、东方久乐汽车电子等企业的董事任职经历,他对机器人产业趋势与客户核心需求有着深刻洞察,尤其擅长将前沿技术转化为具备商业价值的产品方案。 联合创始人兼CTO周丹弟博士毕业于北京理工大学计算机系,深耕机器人感知与人工智能领域多年。作为曾任职AI独角兽企业深兰科技副总裁、CTO及首席科学家的行业专家,他在VLA多模态融合与机器人技术方面有着深厚积累,是公司双系统AI架构的核心设计者与领导者。 联合创始人兼TechLead施祥博士则专注于PhysicalAI研发,致力于实现AI能力与物理环境的深度融合,达成具身推理与行动执行的闭环。这位华盛顿州立大学天体物理系博士,曾在中芯国际负责先进制程技术验证的智能化方案,具备丰富的模型搭建与量产验证经验。 直击工业痛点,技术架构与产品形态精准适配场景通过深入大量工厂实地调研,赛索德智能团队发现,螺栓紧固、卡扣件安装、接插件安装等看似基础的工序,实则对设备的高精度与高成功率有着严苛要求,成为工业智能化升级的主要瓶颈。而工业场景特有的稠密奖励机制——与生活化场景的稀疏奖励不同,工业任务的每一步都能获得明确、连续的反馈信号,如机械臂拧螺丝时可实时监测对准角度、扭矩达标情况等指标并给予微调反馈——为算法与模型的快速收敛提供了天然优势。 在产品形态设计上,赛索德智能采用轮式结构,赋予机器人自由移动与搬运能力。这一设计源于对中高级Tire1工厂复合工位需求的精准把握:在冲压零件等工序完成后,零件需从当前工位转运至其他工位进行后续加工,这就要求智能装备具备可靠的locomotion(运动控制)能力,而这正是工业场景下具身智能相较于传统机械臂的核心优势所在。 图片:企业提供 目前,公司的主要交付形式为整机销售,同时为降低客户前期投入门槛,推出了灵活的租赁方案——最低六个月起租,月付金额约6000-7000元。未来,赛索德智能还计划拓展RaaS(Robot-as-a-Service,机器人即服务)模式,以按需付费的服务形态进一步拓宽市场覆盖。 在硬件配置上,产品搭载了英伟达JetsonThor芯片、RGBD深度相机、工业RGB相机、激光雷达、五指灵巧手、7自由度机械臂及扬声器&麦克阵列等核心组件,为高精度作业与多模态交互提供了硬件保障。 技术路线创新突破,聚焦真实场景价值交付在技术方案的选择上,赛索德智能基于第一性原理,并未采用行业主流的UMI(手眼协作)方案——如硅谷的Generalist和Sunday等企业所采用的便携式数据采集方法——而是自主研发了ROI(兴趣区域)技术。该技术通过在视觉感知中显式聚焦手部操作区域并进行独立建模,显著强化了模型对精细动作的感知能力。 这一技术被融入公司独创的"大脑–桥脑–小脑"VLA架构:大脑系统负责高层语义理解与任务规划,桥脑系统承担感知与动作之间的中介与调制功能,小脑系统则专注于实现快速、稳定的动作执行。ROI技术通过约束感知信息流,让低层执行系统能够集中处理与当前操作高度相关的局部交互信息,大幅提升了作业精准度与效率。 图片:企业提供 创始人孙鑫海分享了其对具身智能行业的深度思考: 1.具身智能的核心价值在于通过算法与模型体系实现系统性能力交付,突破传统工业智能单次定制开发的局限。尽管前期需要高投入构建感知-规划-执行的全栈技术架构,但后续可通过标准化复用摊薄研发成本,这一思路已获得众多工业客户的认可。 2.从市场定价来看,结合沿海制造业工人月均1万元的人力成本,两班制运作的年度人力成本可达36万元(18个月回本周期)或48万元(24个月回本周期),因此具备真实场景交付能力、满足工业化精准度与成功率要求的轮式双足具身机器人,定价三四十万能够被大量工业客户接受。 3.当前具身行业出现的价格竞争,本质上是由于许多业务场景未能真正落地。一旦产品切实解决了客户的核心需求,价格将不再是主要考量因素。 4.行业常用LIBERO、ManiSkill、VLABench三大Benchmark衡量具身模型能力,但这些主流基准存在明显局限性:一是仿真环境与真实部署的性能差异较大;二是VLA模型需要额外微调,其性能受超参数设置、机器人构型等变量影响,难以实现公正对比。 5.行业真正的落地与突破依赖两大核心概念:强化学习与持续学习。强化学习已逐步从算法演变为价值函数驱动的范式,而尽管Agent和RAG尚未在参数层面实现真正的持续学习,但通过系统级记忆与决策机制,已为大模型提供了可行的非参数化持续适应方案。 6.世界模型虽被认为是通往AGI的可能路径,但对工业具身场景的帮助有限。一方面,世界模型依赖大量高质量预训练数据集;另一方面,其能力边界仍存在局限,仍需进行预训练。更重要的是,具身任务具有明显的任务导向和交互局部性,核心挑战集中在稳定的locomotion(运动控制)或精细的dexterity(灵巧操作)等特定能力维度,而非对环境中所有可能情形的全面建模——这与自动驾驶系统难以穷尽所有cornercase的问题类似,实际系统的可靠性并非通过覆盖所有可能状态实现,而是依靠在关键能力和高频交互场景上达到足够的鲁棒性。 此次千万级天使轮融资的完成,将为赛索德智能的技术研发与市场拓展注入强劲动力。未来,公司将持续深耕工业具身智能领域,通过技术创新与场景深耕,为制造业智能化升级提供更高效、更可靠的解决方案,推动工业具身智能从概念走向规模化应用。 |


