上海新闻11月27日电(郑莹莹)OpenLoong开源社区积极推进高质量数据资源的开放共享,吸引行业伙伴共同建设统一的数据体系。
近日,乐聚智能正式将自主构建的LET数据集捐赠至OpenLoong开源社区,为社区补充了一套覆盖真实作业场景的重要数据资源。

LET数据集由乐聚智能与合作团队联合构建,是面向真实作业场景的全尺寸人形机器人真机数据集,它基于乐聚夸父系列全尺寸人形机器人进行统一采集,覆盖真实作业链路,规模超过60000分钟。
LET数据集在场景覆盖上跨越工业、商业零售和日常生活三大领域,包含汽车工厂、快消场景、酒店服务、3C工厂、生活服务和物流共六类真实生产与服务环境,并在此基础上构建了 31 项任务和 117 种原子技能,形成结构清晰的任务体系,这些任务目标清晰、流程有约束,适用于训练机器人在多场景、多步骤、多目标条件下进行学习与推理。
LET数据集为OpenLoong带来了行业中极具代表性的一套结构化资源,为社区的开源生态补充了关键的真实世界数据资源,它的加入将推动行业在任务建模、技能学习与策略验证等方向展开更深入的研究,同时也为开发者提供了可用于性能验证的样本。
当前,人形机器人正在加速从实验室走向真实应用场景,产业链对高质量数据集的需求不断提升,但行业内存在数据来源分散、数据格式各异、数据结构不统一等共性问题,既降低了数据集质量,限制了模型能力的提升,又降低了跨机构协作效率。因此,构建体系化数据标准规范数据全生命周期管理过程是促进高质量数据集流通、激活人形机器人数据价值的必由之路。
为了确保数据在高度一致性、可复用性和长期可维护性等方面满足要求,国地中心建立了一套覆盖数据采集、数据处理、数据质量审核和版本管理的标准体系,覆盖数据全生命周期,使得不同来源的数据在OpenLoong开源社区上以格式一致、标注清晰的形式呈现。
LET数据集现已正式捐献给OpenLoong开源社区。
作为OpenLoong人形机器人全栈开源项目的重要组成部分,该数据集将在开放原子开源基金会的孵化下持续运营与维护,稳定更新,为行业提供系统化的真实场景数据资源,同时也体现了企业与开源社区在推动数据开放与行业协同方面达成的深层共识。(完)
注:请在转载文章内容时务必注明出处!
编辑:李秋莹