|
2026,具身智能火了,互联网巨头集体涌入
作者:系统管理员
发布日期:2026-06-24
浏览次数:
图源:豆包AI 人工智能,正加速迈向物理世界。 《2026 年度人形机器人与具身智能实景实训专项行动》提出,到 2026年底,人形机器人等重点产品将在一批代表性场景中率先完成应用验证与常态化部署,同时凝练形成百个以上高价值应用场景,持续丰富具身智能的应用谱系,并推动形成万台级规模的落地能力。 政策与产业的共振之下,具身智能赛道正迎来爆发式增长。据公开数据显示,目前全国具身智能相关企业已突破万家,其中民营企业占比约85%,另有 269家上市公司参与布局,既有宇树科技、智元机器人等专注整机与本体研发的企业,也涵盖小鹏、蔚来等跨界进入的车企,同时也有阿里巴巴、字节跳动等互联网公司积极参与其中。 作为上一代信息革命的重要推动者,互联网公司曾深度参与并塑造移动互联网与数字平台生态,进入 AI时代后,它们持续在大模型与生成式 AI领域加码布局,并在这轮竞争中占据先发优势。 而今,随着具身智能逐渐成为新的竞争焦点,多元玩家竞相入局,产业竞争格局正在被快速重塑。互联网公司能否此轮竞争中延续优势,值得深思。 01 从数字世界走向物理世界 阿里巴巴发布首个具身智能大模型 纵观近几年的人工智能演进,大模型竞争主要集中在数字世界。无论是字节跳动的Seedance2.5 Pro、腾讯的 Hy3 Preview,还是阿里巴巴的 Qwen3.7-Max,其能力更多体现在视频生成、文本写作、代码编程与 Agent 办公等任务上,本质上仍是在“屏幕之内”完成工作。 然而,如果要让AI真正从屏幕走向现实世界,仅依靠现有模型显然远远不够。在真实物理环境中,AI不仅需要具备理解与推理能力,还必须依托机器载体执行动作,在复杂场景中完成持续、稳定的任务。显然,越来越多互联网公司已经意识到这一点,并开始向“物理世界”加速延伸,其中阿里巴巴最新发布的具身智能模型,也在一定程度上加速了这一进程。 图源:阿里巴巴 据悉,6月6日,阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列,包括操作模型Qwen-RobotManip、导航模型 Qwen-RobotNav,以及世界模型 Qwen-RobotWorld。三者既可独立运行,也可协同工作,使不同形态的机器人具备更通用的感知、决策与执行能力具体来看,这三种模型分别相当于机器人的“手”“脚”“大脑”。 其中 Qwen-RobotManip负责操作能力构建,其基于超过38,000小时开源语料预训练,并在 RoboChallenge Table30v1真机评测中表现领先;Qwen-RobotNav 负责“导航能力”,其将语言导航、目标搜索自动驾驶等五类任务统一纳入同一框架,实现多任务协同处理,目前已在宇树 Go2 四足机器人上实现零样本真实环境部署,展现出较强的泛化能力;而 Qwen-RobotWorld 则负责"认知与推演”,模型不仅能够识别物体,还具备对物理世界动态变化的预测与推理能力。 要知道,当前全球具身智能行业正处于从“实验室研发”迈向“真实场景商业化”的关键临界点能否在陌生环境中准确理解指令并稳定执行任务,正成为衡量技术落地能力的核心门槛。而Qwen-Robot 通过三类关键模型的协同设计与训练,使系统能够更好地理解人类自然语言感知三维环境并建模物理规律,从而指挥机器人在真实世界中自主执行复杂操作与精准移动甚至完成此前未曾见过的任务,在一定程度上推动了 AI在物理世界中的最后一公里。 02 具身智能赛道升温 互联网大厂入局的竞争优势 事实上,除阿里巴巴之外,多家互联网公司正依托自身优势,围绕不同路径加速布局具身智能赛道。 例如,腾讯推出具身智能开放平台 Tairos,通过模块化架构降低具身智能的开发与应用门槛;小米依托消费电子与 IoT 生态优势,布局消费级人形机器人,探索家庭服务与儿童陪伴等应用场景;京东发布“智能机器人产业加速计划”,推动机器人在超百万终端场景落地,重点覆盖物流与零售体系;美团围绕外卖、商超与本地生活服务全链路,加速机器人在末端配送与即时履约等场景中的应用落地..... 据不完全统计,2024—2026 三年期间,美团、阿里、小米、京东、腾讯五家互联网公司在具身智能与机器人领域的累计公开投资规模已超过 165 亿元,覆盖人形机器人、核心零部件、具身智能算法以及系统平台等多个关键环节,产业链正在加速成型。 图由AI生成 可以看到,互联网大厂入局具身智能赛道已然成为趋势。而在个赛道下,互联网公司相较于其他参与者,显然在场景落地能力、数据积累规模以及系统能力等方面具备天然优势。 要理解这一点,首先需要回到传统机器人的发展路径。长期以来,机器人多采用专用化开发模式,通常针对单一场景进行定制设计,每新增一个任务或环境,就需要工程师重新编写控制逻辑,适配周期往往以月甚至季度计。相比之下,互联网大厂深度嵌入现实经济运行体系,天然具备大规模真实世界的“试验场”。就好比,京东物流体系覆盖全国超40个“亚洲一号”智能仓储中心,美团构建起日均数千万单级别的即时配送网络,这些高频、复杂且持续运行的业务场景,本质上就可以为具身智能提供了极为稀缺的训练与验证环境。 其次,具身智能的核心在于让机器理解并作用于真实物理世界,这对多模态数据提出了更高要求。互联网公司长期积累的图像、文本、视频以及真实业务交互数据,使其具备天然的数据基础。同时,业务运行过程中持续生成的动态数据流,也构建起实时反馈的闭环机制,使模型能够在运行中不断优化,从而显著区别于传统机器人依赖小规模、离线数据训练的路径。 此外,互联网公司在云计算、大模型训练、分布式系统以及工程化落地方面,已形成较为完整的技术体系,能够将感知、决策与执行能力整合为端到端系统,而不仅停留在单点算法优化层面。种种优势叠加在一起,互联网公司正持续强化技术与产业之间的协同效率,推动机器人产业向更高阶的智能化阶段加速演进,使具身智能逐步从概念走向规模化落地。 03 资本竞相涌入 具身智能进入爆发期 除了互联网公司之外,各类资本正加速涌入具身智能赛道,推动行业进入新一轮爆发式增长阶段。 据不完全统计,2026年上半年国内具身智能赛道融资规模已达约438亿元,接近2025年全年554亿元的水平,显著高于2024年的137亿元。从增长曲线来看,行业融资规模持续上行,若当前趋势延续,2026年全年有望再度刷新历史纪录。与此同时,全球人形机器人市场也同步扩张。根据麦肯锡《2026年全球人形机器人产业报告》,2025年全球人形机器人市场规模达45亿美元,2026年预计将突破95亿美元。 从这里可以发现,资本密集进入的背后,很大程度是源于对人形机器人“劳动价值”的长期预期。人形机器人的核心优势在于对人类社会环境的高度兼容性,现有工厂、办公、家庭、楼梯及工具体系,本身就是围绕人类形态构建,因此人形机器人无需对基础设施进行大规模改造,即可快速进入多类应用场景。 从能力结构来看,人形机器人是承载通用智能的重要物理载体。一方面,其形态具备高度通用性,可避免为不同场景重复开发专用机器人的资源浪费;另一方面,在工业制造领域,其有望承担高危、重复性与重体力劳动任务同时,在服务业与消费端,随着技术成熟,它还可能逐步渗透新零售、养老康养、家庭照护等场景,提供更高复杂度的服务能力。 可以预见,具身智能已经不再只是单一技术方向的演进,而是在逐步成为重塑生产方式与产业结构的关键变量。随着真实场景不断被打开,机器人不再只是实验室中的样机,而将逐步进入工厂、城市与家庭,成为现实世界中的新型基础生产力。 而这一轮变革,或许才刚刚开始。 |


