从真机训练场到开源数据集:乐聚LET以41万下载量登顶魔搭具身数据榜首,定义数据新标准
作者:系统管理员 发布日期:2025-12-11 浏览次数:

机器人技术能否从展厅走进千家万户、万间工厂,“最后一公里”的挑战往往不在于算法本身,而在于支撑算法持续迭代与验证的“数据燃料”。近日,这一关键瓶颈出现了破局性进展:乐聚机器人开源的LET数据集在魔搭社区上线仅16天,下载量即突破41万次,强势占领品类榜首。市场的热烈反响,直指当前产业对即用型真机数据的迫切需求。

https://www.modelscope.cn/datasets/lejurobot/let_dataset

图.  LET数据集在魔搭社区下载量突破410,000+次

图.  LET数据集在魔搭社区跻身全平台数据集总榜TOP10

行业共识指出,机器人算法的成熟依赖于仿真、合成与真机数据的混合使用。其中,真机数据因其承载真实世界的全部复杂性,成为技术落地前不可或缺的“校准器”与“试金石”。然而,其采集的高成本、长周期与标准化难题,使得大量企业和研究团队望而却步,形成了制约创新的“数据荒”。

乐聚LET数据集的出现,为这片“荒原”注入了活水。作为国内具有代表性的全尺寸人形机器人真机数据集,它坚持采用真机实采这一“笨功夫”,所有数据源自统一的Kuavo 4 Pro机器人,保证了数据源的纯净与可比性。数据集囊括工业、商业、生活三大板块,深入汽车装配、3C生产、物流分拣等具体场景,并系统解构为31项任务与117种原子技能,为算法训练提供了贴近产业需求的丰富素材。

为彻底打通从数据到应用的链条,乐聚配套开源了全流程开发工具链,覆盖数据清洗、模型训练、仿真调试与真机部署等关键环节,让开发者能够聚焦核心算法创新,而非重复的工程搭建。这一数据集已捐赠至开放原子开源基金会,并通过OpenLoong社区、魔搭、Hugging Face等渠道免费共享,彰显了其推动技术普惠的决心。

图.  LET数据集捐赠荣誉证书

各平台的下载方式如下:

1. 官方邮箱:wangsong@lejurobot.com 发邮件直接申请获取

2. 公开平台扫码获取数据:魔搭社区/ OpenLoong/ HuggingFace /github 

总结

据悉,乐聚的投入是长期且体系化的,公司目前已参与建成规模化真机训练基地。展望未来,乐聚也将持续升级数据采集体系,并计划按节奏开源更多场景数据,致力于打造一个能为行业持续贡献高质量数据的“开放实验室”。