量子位 10月09日 17:26
Meta AI新发现:自监督模型JEPAs能识别数据“密度”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta AI团队的最新研究揭示,自监督模型JEPAs(联合嵌入预测架构)在训练过程中,能够学会感知数据的“密度”,即数据的常见程度。此前普遍认为JEPAs仅擅长特征提取,但新发现表明,其“反坍缩”机制不仅防止特征失效,更能精准学习数据密度。团队为此提出了JEPA-SCORE工具,可量化评估样本的常见度,且通用性强,不挑数据集或模型架构,在数据筛选和异常检测等任务中表现出色。

💡 **JEPAs模型的新能力:感知数据密度**:Meta AI的最新研究发现,Yann LeCun团队开发的自监督学习框架JEPAs,不仅能提取数据特征,还能在训练过程中学会识别数据的“密度”,即样本的常见或罕见程度。这一发现打破了学界长期以来认为JEPAs仅限于特征提取的认知。

📈 **“反坍缩”机制的深层价值**:研究核心在于揭示了JEPAs训练中的“反坍缩”机制的隐藏作用。过去,反坍缩被视为防止模型输出趋同的保障手段,但新研究证明,它实际上是模型精准学习数据密度的关键。通过理论推导,当JEPAs输出高斯嵌入时,模型必须感知数据密度以满足训练约束。

📊 **JEPA-SCORE:量化数据密度的实用工具**:为了将JEPAs的密度感知能力转化为实际应用,研究团队提出了JEPA-SCORE。这是一个从JEPAs中提取数据密度的量化指标,通过计算雅可比矩阵的特征值对数和来为样本的常见度打分。分数越高代表样本越典型,分数越低则越罕见或异常。

🌐 **JEPA-SCORE的通用性与实验验证**:JEPA-SCORE展现出极强的通用性,能够适配各种数据集(如ImageNet、MNIST、星云图)和JEPAs家族模型(如I-JEPA、DINOv2、MetaCLIP),无需额外训练。实验结果表明,JEPA-SCORE能准确区分典型与罕见样本,识别陌生数据,并在数据筛选和异常检测任务中优于传统方法。

关注前沿科技 2025-10-09 12:49 北京

仍然和三位FAIR同事合作

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

备受Meta审核规定“折磨”,依旧猛发论文!

表示可能要辞职的LeCun带着最新研究来了,仍然和三位FAIR同事合作。

Yann LeCun团队新论文发现了自监督模型JEPAs(联合嵌入预测架构)的隐藏技能——

学会了数据的“密度”

这里的“数据密度”可以理解成数据的常见程度:密度高的样本是更典型、更常见的数据,密度低的是少见的、甚至异常的数据。

JEPAs原本被视为仅擅长特征提取的模型,这次LeCun团队发现该模型在训练过程中悄悄掌握了感知数据常见程度的能力。

这就意味着,只要JEPAs训练成功了,不用额外做什么,就能用它来判断一个样本的常见程度

打破了学界长期以来“JEPAs仅学特征、与数据密度无关”的认知。

核心发现:反坍缩能精准学习数据密度

要理解这一新发现的突破,首先来说一下JEPAs。

源自《A Path Towards Autonomous Machine Intelligence》图12

JEPAs作为LeCun团队近年重点推进的自监督学习框架,核心优势在于无需人工标注,模型就能自主从海量数据中学习特征规律,学完后就可以直接适配图像识别、跨模态匹配等下游任务,是AI领域高效学习的代表性模型。

此前学界普遍认为,JEPAs的训练只有两个核心目标:

而论文的新发现就是从反坍缩中得来。

如果所有数据的特征都一样,模型相当于白学,所以过去大家都将反坍缩单纯视为避免特征失效的保障手段,没有意识到它还有更深层的作用。

LeCun团队就聚焦于反坍缩的的隐藏价值,研究通过变量替换公式高维统计特性推导证明,反坍缩不仅能防止特征坍缩,更能让JEPAs精准学习数据密度

从理论层面看,当JEPAs输出高斯嵌入(高维空间中近似均匀分布于超球面的特征)时,模型必须通过雅可比矩阵(反映模型对样本微小变化的响应程度)感知数据密度,才能满足训练时的约束条件,这意味着学习数据密度并不是偶然,而是JEPAs训练过程中的必然结果

为了让这种隐藏的密度感知能力落地实用,团队还提出了关键工具JEPA-SCORE

这是从JEPAs 中提取数据密度的量化指标,核心作用就是给样本的常见度打分

根据公式来看计算逻辑简洁高效,只需要获取JEPAs处理目标样本时的雅可比矩阵,计算矩阵的特征值后取对数求和,得到的结果就是JEPA-SCORE,分数越高说明样本越典型(数据密度高),分数越低则样本越罕见或异常(数据密度低)。

更重要的是,JEPA-SCORE还具备极强的通用性,无限制适配,既不挑数据集,也不挑JEPAs架构

无论是ImageNet、手写数字MNIST,还是未参与预训练的陌生数据(星云图集),都能精准计算;

不管是I-JEPA、DINOv2(单模态视觉模型),还是MetaCLIP(多模态模型),只要是成功训练的JEPAs家族模型,都能直接使用,且无需额外训练模型。

为了验证这一发现的可靠性,团队还开展了多组实验。

在ImageNet数据集中,不同JEPAs模型对典型样本(如飞行姿态的鸟类)和罕见样本(如栖息姿态的鸟类)的JEPA-SCORE判定高度重合,证明这是JEPAs的共性能力,并不是某个模型的偶然;

面对未参与预训练的星系图像数据集,其JEPA-SCORE显著低于ImageNet数据,说明模型能精准识别陌生数据;

而在数据筛选和异常检测的实用测试中,JEPA-SCORE的效果也优于传统方法。

数据筛选场景

异常检测场景

研究团队

此次研究并非LeCun一人之功。

另外三位核心研究者也都是Meta FAIR的研究员。

Randall Balestriero是布朗大学计算机科学助理教授,长期深耕人工智能与深度学习领域。

2013年起研究可学习信号处理,他参与的技术曾用于NASA火星车火星地震探测。

2021年获莱斯大学博士学位,后进入Meta AI做博士后,师从Yann LeCun。

Nicolas Ballas拥有法国格勒诺布尔大学博士学位。

2010年4月至9月,他担任了LTU Technologies的研发实习生,从事应用于图像检索的大规模聚类相关工作。

自2017年起,他在FAIR担任研究科学家,已任职超过8年。

Michael Rabbat是FAIR的创始成员,拥有伊利诺伊大学厄巴纳-香槟分校的工程学士学位、莱斯大学的工程硕士学位,以及威斯康星大学麦迪逊分校的电气工程博士学位。

他的研究方向聚焦于优化算法、分布式算法及信号处理三大领域。

加入Meta之前,Mike曾担任麦吉尔大学电气与计算机工程系教授。

论文地址:https://arxiv.org/abs/2510.05949

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🏆 年度科技风向标「2025人工智能年度榜单」评选报名开启!我们正在寻找AI+时代领航者 点击了解详情

❤️‍🔥 企业、产品、人物3大维度,共设立了5类奖项,欢迎企业报名参与 👇 

一键关注 👇 点亮星标

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Meta AI JEPAs 自监督学习 数据密度 JEPA-SCORE 人工智能 Meta AI JEPAs Self-Supervised Learning Data Density JEPA-SCORE Artificial Intelligence
相关文章