量子位 10月24日 17:45
机器人训练数据短缺,数据标注服务商高价回收家务视频
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

机器人行业正迎来快速发展,但训练数据短缺成为瓶颈。数据标注服务商如Encord、Micro1等高价回收包含家务视频的人类行为素材,用于训练人形机器人。真实数据获取成本高、规模有限,合成数据虽能弥补但真实性不足,目前行业多采用两者结合的方式。尽管各方努力,优质数据依然短缺,制约着机器人技术的进一步发展。

🏠 机器人训练数据短缺成为行业发展的主要瓶颈,真实人类行为数据尤为珍贵。

💰 数据标注服务商为获取高质量数据,愿意支付高额报酬,例如每小时最高可达150美元。

📊 合成数据虽然能以较低成本生成大量数据,但真实性与现实世界的复杂交互存在差距。

🔗 行业普遍采用结合真实数据与合成数据的方式,以平衡数据规模与真实性的需求。

🤔 尽管各方努力,优质数据依然短缺,制约着机器人技术的进一步发展。

关注前沿科技 2025-10-24 11:51 北京

优质数据依然短缺

西风 发自 凹非寺量子位 | 公众号 QbitAI

注意看,眼前这个男人暂且叫他小帅。

你可能想不到,他只是在厨房里优雅地煎牛排做做家务,每小时最高能赚进1000多块(150美元)

怪不得小帅天天上班喜笑颜开。

难道他找到了什么神秘兼职?

画面一转——哦吼,机器人。

没错,这年头,你做家务的视频正被Encord、Micro1、Scale AI这些数据标注服务商当作训练人形机器人的人类高等素材,高价回收

评论区网友只是一味地要招聘链接。

机器人也需“家教”

当前,机器人是AI最热门的领域之一。

硅谷著名投资人Vinod Khosla等押注该领域将很快迎来自己的“ChatGPT时刻”。PitchBook数据显示,迄今机器人领域的险投资已激增至121亿美元

然而,在技术爆发的另一面,是机器人行业共同面临的数据荒。

“与大语言模型不同,机器人没有现成的互联网数据集可用,必须从零开始在现实世界中生成训练数据,难度大得多”AI数据服务公司Encord联合创始人Ulrik Hansen一针见血地指出。

目前,机器人训练数据的来源可以分为两大路径:现实世界真实数据成数据

真实数据可通过精密设备远程操控机器人执行任务,同步记录下包括关节力矩、电机旋转等在内的全套物理数据。这种方式能捕获“手感”力控信息等。

或者可通过直接记录人类在现实环境中的活动来获取,如Apple Vision Pro或专业动作捕捉系统,记录人类执行任务的全过程。

这类数据质量高、保真度强,能准确反映真实世界的复杂物理交互,但问题在于规模有限、成本高,难以满足机器人模型对海量数据的需求。

合成数据则开辟了另一条路线。通过在虚拟环境中自动生成无数种动作变体或构建完整交互场景,合成数据能以较低成本实现数据自由。

例如,NVIDIA Cosmos就是一个“世界基础模型”,可以生成高度逼真、类似视频游戏的环境,用于机器人训练。在这里,“世界”指的并不是地球,而是机器人交互的环境,如机器人操作的房间内可见区域。

另外,为兼顾真实性与规模性,机器人公司往往采用结合真实与合成数据的方式,通过将少量的现实世界数据与大规模合成数据相结合,克服机器人技术中数据稀缺的问题。

面对数据饥渴,目前各家的应对策略五花八门。

Encord透露,他们今年对此类数据的处理量已达到去年的四倍。他们高价回收真实数据,如果是操作设备等高技术性任务的视频,酬劳最高可达每小时150美元

另一家AI数据服务公司Micro1 CEO Ali Ansari则透露,他们开出的报酬每小时在25至50美元之间

另外,Scale AI宣布正快速拓展机器人业务,并在其旧金山总部设立了专用实验室,迄今已生成超过10万小时的训练影像。

而需求则来自Physical Intelligence、波士顿动力公司等。

甚至有某机器人初创公司自己在Craigslist发广告,以10–20美元时薪征集用户用手机拍摄家务的视频

尽管各方努力,优质数据依然短缺。该初创公司创始人对外透露:“市面上没有大型数据集可购买,规模最大的也仅有约5000小时时长,这远远不够。”

参考链接:[1]https://x.com/dom_lucre/status/1981055417451942221[2]https://www.businessinsider.com/ai-startups-robotics-pay-film-chores-encord-micro1-scale-2025-10

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🏆 年度科技风向标「2025人工智能年度榜单」评选报名火热进行中!我们正在寻找AI+时代领航者 点击了解详情

❤️‍🔥 企业、产品、人物3大维度,共设立了5类奖项,欢迎企业报名参与 👇 

一键关注 👇 点亮星标

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

机器人 人工智能 数据标注 训练数据 真实数据 合成数据
相关文章