IEEE TRO从《沙丘》走进现实:清华团队打造"沙虫"机器人,用振动感知地下世界
作者:系统管理员 发布日期:2026-01-22 浏览次数:

科幻电影中令人敬畏的沙漠巨兽,如今化身为一条能钻沙、会感知的仿生机器人,正在改变我们探索地下世界的方式。

当科幻照进现实

在电影《沙丘》中,沙漠星球厄拉科斯上的巨型沙虫对振动极度敏感,任何有节奏的震颤都会引来这些沙漠霸主。这一经典设定不仅塑造了令人难忘的科幻意象,也揭示了一个深刻的物理现实:在视线无法穿透的颗粒介质中,振动蕴含着丰富的信息

清华大学深圳国际研究生院SSR团队正是从这一灵感出发,结合海底蠕虫的运动方式,研发了SandWorm仿生沙虫机器人,该项工作目前已经被IEEE Transactions on Robotics接收。与电影中被动感知振动的沙虫不同,这条机器人更进一步——主动制造振动,将振动从环境干扰转化为感知媒介,从而"看见"地下世界的隐藏细节。

地下探索的三重困境

城市地下管道检修、地震废墟搜救、考古发掘、火星探测……这些场景都要求机器人穿越沙子、土壤、碎石等颗粒介质。然而,颗粒介质的物理特性极为复杂:每一次推进都会导致颗粒重新排列,摩擦力和阻力变幻莫测,机器人极易陷入卡顿甚至损坏。沙土几乎完全遮挡光线,普通摄像头一旦钻入地下便成了"睁眼瞎"。而钻探过程中产生的剧烈振动,会让压阻、应变片等电子元件损坏,普通摄像头则会产生严重的运动模糊和拖影。

长期以来,机器人在地下环境里面临的困境可以概括为:看不见、摸不准、走不动

仿生驱动:像蚯蚓一样钻沙

SandWorm的机械结构设计充分借鉴了海底蠕虫的运动智慧,整体采用模块化设计,可配置为自主蛇形机器人或手持钻探设备。

螺旋推进是运动的核心。机器人外壳采用铝镁合金螺旋结构,由无刷电机驱动持续旋转,如同螺丝钻入木头,能够有效分散沙土阻力并产生持续的推进力。蠕动驱动则模拟蚯蚓肌肉的周期性收缩,内部推杆-弹簧机构通过伺服电机驱动,实现精确的伸缩运动。

这套系统的精妙之处在于其两相非对称运动机制:在伸展相,推杆向前推进,与螺旋旋转产生的推力叠加,形成快速前进冲程;在收缩相,推杆回缩,但螺旋旋转仍在持续,机器人几乎不会后退。这种类似于"划船"的运动模式,使得每个周期都能产生净位移,推进效率比传统单一螺旋驱动提升了62%,最高速度达到12.5 mm/s

机器人还具备三自由度协同能力:螺旋壳体的旋转提供主推进力;伺服电机驱动的垂直摆动实现转向;推杆的蠕动平移增强直线穿越能力。尾部采用可折叠波纹管结构,内置线性导轨和加强金属连接件,在承受负载时保持足够刚度,同时通过柔性软管提供支撑反作用力。这种组合让SandWorm能够在弯管、分叉、非均匀介质等复杂环境中灵活前进、转弯、避障。

核心创新:主动振动触觉传感器SWTac

SandWorm"灵魂"在于其搭载的SWTac事件驱动触觉传感器。这是一套将振动从"干扰源"转化为"感知工具"的创新系统。

事件相机:为振动环境而生

与传统摄像头逐帧曝光不同,事件相机(DVXplorer Mini)以异步方式工作:每个像素独立监测光强变化,只有当变化超过阈值时才输出"事件",每个事件包含微秒级时间戳、像素坐标和极性(光强增减方向)。

这种机制赋予事件相机三大优势:极高时间分辨率可达1000 Hz,是传统摄像头的30倍以上;超大动态范围120 dB,远超传统摄像头的60 dB天然抗模糊,无需长时间曝光,在剧烈振动环境下依然清晰成像。

主动振动:让静止的世界""起来

事件相机有一个天然局限:它只能"看见"变化,静止物体对它来说是隐形的SWTac用一个巧妙的设计破解了这一难题——主动振动弹性体

传感器前端的PDMS(聚二甲基硅氧烷)透明弹性体在双轴振动系统驱动下持续运动:电磁阀提供垂直振动分量,偏心电机提供水平振动分量。即使接触的是完全静止的物体,振动的弹性体也会在接触面产生周期性的光强变化,从而被事件相机捕捉。

这一设计实现了双重目标:一是静态触觉成像,克服了事件相机无法感知静止物体的固有限制;二是降低钻探阻力,振动使周围颗粒流态化,减小穿透阻力,实现了感知与驱动的有机统一。

机械隔离:动静分离的精妙结构

传感器内部采用"动静分离"的双区架构。振动区的设计目标是在紧凑空间内产生可控的多轴振动:电磁阀和偏心电机安装在共享的振动连接器上,整个动态组件通过滑轨与固定内壳连接,滑轨将运动约束在垂直方向,同时容纳装配公差。

隔离区的核心目标是将事件相机与高振动组件机械解耦:8个弹簧提供水平隔离,2个柔性轴连接器提供垂直隔离,相机安装在独立支架上,与振动源完全分离。这种设计确保弹性体能够充分振动以产生事件信号,而精密电子元件则被保护得安安稳稳,不会因长期振动而损坏。

光学系统:为事件相机优化的照明

光照对事件相机至关重要。SWTac采用14LED组成环形阵列,配合扩散板实现均匀的漫射明场照明。扩散板不仅能消除镜面反射带来的干扰,其中心开孔还为后续图像处理提供了硬件级的感兴趣区域掩膜。弹性体采用透明PDMS材料,厚度经过专门优化,既保证光学透明度,又具备足够的耐磨性以承受长期钻探。

智能算法:从"看见""看懂"

硬件创新只是第一步,团队还开发了一整套智能感知算法,构建了完整的处理流水线。

事件流重建与IMU引导滤波

事件相机输出的原始数据是异步事件流,需要转换为可处理的图像格式。算法将事件按时间窗口累积,通过指数衰减加权重建灰度图像,使最近发生的事件权重更高,在保持时间分辨率的同时获得清晰的触觉图像。

由于弹性体周期性振动,事件流的质量会随振动相位变化:当弹性体处于运动峰值时,产生的事件最多、边缘最清晰;而在运动谷值时,事件稀疏、噪声占比增加。团队建立了振动-成像理论模型,利用传感器内置IMU实时监测加速度信号,智能筛选出弹性体处于高速运动阶段的事件流片段进行图像重建。当IMU检测到加速度过零点(对应速度峰值)时,系统采集该时刻前后的事件窗口。实验表明,这一算法使掩膜信噪比(MSNR)提升了24%,成像结果更加稳定一致。

U-Net接触面估计

事件相机本质上捕捉的是光强变化,重建图像主要呈现边缘特征而非完整的接触区域。团队通过有限元分析揭示了关键物理规律:弹性体接触物体时,接触区域会产生特征性的非对称边缘——内部边缘较暗(弹性体被压缩,反射光减少),外部边缘较亮(弹性体隆起,反射光增加)。

基于这一物理规律,团队训练了U-Net深度学习网络,输入事件重建的边缘图像,输出完整的接触区域掩膜,结构相似度(SSIM)达到0.97。这意味着机器人不仅能"看见"物体轮廓,还能准确判断哪些区域正在与目标接触。

力估计与物体分类

力估计模型让机器人具备了定量的"触觉"。通过追踪弹性体在接触过程中的形变面积和形变模式,结合材料力学模型,机器人能够估算接触力,法向力和剪切力估计误差均为0.15 N。这一能力对于判断埋藏物体的硬度、调整钻探力度至关重要。

ResNet物体分类网络则赋予了机器人识别能力。针对地下常见的不同类型石块(花岗岩、大理石、砂岩等),团队采集了大量触觉图像样本,训练了基于ResNet-18的分类网络,分类准确率达到98%,纹理分辨率可达0.2 mm

系统集成:感知-驱动闭环架构

SandWorm的系统架构实现了感知与驱动的深度融合,形成完整的闭环控制。

硬件层包含三大互联模块:SWTac传感器(振动区执行器 + 隔离区事件相机与机载计算机)、驱动模块(无刷电机、伺服电机、推杆机构)、控制模块(ESP32微控制器、紧凑型路由器、集中式电池)。模块间通过机械连接(无刷电机将传感器与驱动本体刚性耦合)、电气连接(导电滑环将电力从非旋转部分传递到旋转的SWTac)、通信连接(WiFi将机载计算机与ESP32控制器无线连接)实现协同。

算法层运行于SWTac的机载计算机,处理流程包括:事件流采集与IMU数据同步、IMU引导的时序滤波与图像重建、接触面估计、力估计、物体分类、生成运动指令,最后无线传输至ESP32执行。整个系统形成了感知-决策-执行的完整闭环:触觉感知指导运动决策,运动带来新的触觉反馈,机器人据此实时调整行为。

实战验证:从实验室到真实世界

SandWorm在多种真实场景中经受住了严苛考验。

管道疏通任务中,机器人成功穿越1米长的弯曲PVC管道,实时识别并清理堵塞物。管道内壁提供的支撑力与螺旋推进形成稳定配合,机器人自主完成前进、转弯、高曲率运动等复杂动作,触觉反馈帮助识别堵塞物材质,调整清理策略。

地下探测实验中,团队在海滩细沙、花园土壤、四种工业颗粒等多种介质中进行了系统测试,对不同深度埋藏的石块、化石、人工物体进行探测,成功率达到90%。一个令人印象深刻的细节是:在沙滩实验中,SandWorm成功识别出埋藏的菊石化石纹理——这意味着它不仅能"找到"地下物体,还能"看清"物体表面的精细特征,具备了真正的"触觉视觉"

野外复杂地形测试中,团队带着SandWorm走出实验室,在密集草地、缠绕灌木丛、水泥地面等多种野外环境中验证,机器人在所有测试场景中均表现出色,展现了极强的环境适应性和系统鲁棒性。

未来研究

SandWorm首次在颗粒介质环境下实现了高效运动与高分辨率触觉感知的有机结合。它将振动从传统意义上的"干扰"转化为感知的"工具",开创了一种全新的地下探测范式。

团队透露,下一步研究将聚焦于弹性体材料的耐磨性和自清洁能力优化、从二维接触图像扩展到三维表面重建、系统小型化以适应更狭窄的管道和缝隙环境、以及多机协同完成大范围地下探测。这项研究为城市地下管网维护、灾后搜救、矿产勘探、考古发掘乃至行星探索,提供了一条全新的技术路径。

当人类的双眼无法企及之处,或许正是机器人大展身手的舞台。

题目SandWorm: Event-based Visuotactile Perception with Active Vibration for Screw-Actuated Robot in Granular Media

第一作者:清华大学博士、南洋理工大学博士后李寿杰,清华大学硕士研究生郭常青

通讯作者:清华大学深圳国际研究生院副教授丁文伯

文章链接:https://arxiv.org/abs/2601.14128

文章来源:CAAI认知系统与信息处理专委会