量子位 10月04日 19:17
AI自主完成学术研究,从选题到成稿仅需17小时
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近日,一个名为Virtuous Machines的AI系统成功自主完成了一篇30页的学术论文,整个过程包括选题、实验设计、数据收集与分析,直至最终成稿,耗时仅17小时。该AI系统通过协作式架构,由多个AI助手模块协同工作,模拟人类认知机制,并具备动态知识交互能力。它能够精准检索文献、抽象提炼理论、进行元认知反思、分解任务并自主迭代。尽管AI在效率上远超人类团队,并能进行严谨的数据分析,但在理论深度和创新思维方面仍有待提升,偶会出现理论误解或细节疏漏。

🤖 **AI自主科研的突破性进展**:Virtuous Machines AI系统展示了从零开始进行学术研究的能力,包括提出研究问题、设计实验、招募被试、收集和分析数据,最终撰写符合学术规范的论文,标志着AI在科研领域的重大进步。

🧠 **多AI协作与类人认知机制**:该AI系统通过Master核心控制模块协调多个专业AI助手,如文献检索、数据分析等。其底层能力模拟人类认知,包括精准的知识检索、抽象提炼、元认知反思、任务分解和自主迭代,并利用d-RAG实时记忆库整合新旧知识。

⏱️ **极高的研究效率与严谨性**:AI系统在17小时内完成一篇30页的论文,效率远高于人类团队。在数据分析方面,它能识别异常值,调整统计模型,并避免统计显著性陷阱,保证了分析的严谨性,甚至能处理真实实验中的数据噪音。

⚠️ **AI科研的局限性与未来展望**:尽管效率惊人,该AI在理论深度和创新性方面仍存在不足,可能出现理论误解或细节疏漏。这表明,虽然AI能极大加速科研进程,但完全取代人类研究员的理论洞察力和原创思维尚需时日。

关注前沿科技 2025-10-04 12:10 北京

还引用了40篇真实文献

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

不是拼凑知识点,AI这次是真搞研究。

一个叫Virtuous Machines的AI系统,花了17小时、114美元,找了288个真人做实验,写了一篇30页的学术论文。

而且还是从选题到成稿全自动化速通!?

来看看这个AI都写了点啥。

AI自动化做科研:从灵光一现到可发表论文

像人类一样搞科研

AI自主完成的这个论文属于认知心理学领域,具体聚焦于人类视觉认知相关的研究方向。

而且它可不是瞎写,而是靠人类的科研套路来。

先是基于认知心理学理论提出研究问题,比如“视觉工作记忆与心理旋转能力有没有关系”、“心理意象清晰度对视觉认知任务表现有什么影响”等。(视觉工作记忆是指人类维持并处理视觉信息的能力,涉及信息存储、操作和提取过程;心理旋转是指通过心理操作实现空间客体旋转以完成知觉匹配的认知过程)

接着设计实验方案,考虑到了样本量计算、控制变量,还用VVIQ2量表测量被试(对象)的心理意象清晰度;

在确定好实验方案后,它还通过在线平台Prolific招募了288名被试对象,等277份有效数据(部分被试未完成实验,被AI筛除了)收上来,它又连续写了8小时Python代码,用重复测量方差处理数据。

在分析数据的过程中,甚至会识别异常值、调整统计模型;

最后整理结果时,还能引用40+篇PubMed、Semantic Scholar上的真实文献,连论文的“方法”“结果”“讨论”部分都符合APA格式规范。

这么高效,如何做到的?

不同功能的AI组队,专人专职

那就来扒一下这个AI系统的架构。

它的自主科研能力源于协作+模拟人类认知机制+动态知识交互的技术设计。

在协同架构中,Master是核心控制模块,总领全局。

其他的AI助手模块聚焦文献检索、数据分析、实验设计等细分任务。

而支撑类人类认知机制发挥作用的底层能力基础则像“洋葱圈”。

最核心的是知识检索能力,能从海量学术数据库精准抓取知识;接着是抽象提炼能力,可从众多具体研究里总结通用逻辑;再往上是元认知反思能力,让AI能自我检查,比如做完数据分析会反问方法是否恰当、结论与假设逻辑是否通顺。

然后是任务分解能力,把科研大工程拆解成可执行的小任务,比如写论文拆分为文献综述、实验设计等环节;还有自主迭代能力,无需人工干预,AI会反复修改论文草稿、调试崩溃的代码,直到满意。

最外层是多智能体协作能力,不同功能的AI小助手组队,让系统做到文献检索、实验设计、数据分析专人专职。

除此之外,还有个d-RAG实时记忆库,能一边查最新文献,一边记自己之前的研究,新老知识能交互整合。

这一套架构下来,17小时写出30页论文也算是手拿把掐。

速度很快,小缺点也有

不过,这AI虽然卷,但也不是完美的。

虽然优点很明显:效率比人类团队快10倍以上,数据分析严谨到会拒绝统计显著性陷阱(就算p<0.05,但如果效应量过小,也会说明“结果实际意义有限”),还能处理真实实验中的噪音数据等。

但它偶尔也会出现理论误解,比如把已有研究结论说成首次发现;漏标图表的Y轴单位、把“跨试次间隔”和“刺激呈现间隔”混用等。

只能说,AI搞研究速度是挺牛,但想完全取代人类研究员的理论深度和创新思维,目前看来还差点意思~

研究地址:https://arxiv.org/abs/2508.13421参考链接:https://x.com/IntuitMachine/status/1972252510585847835

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🏆 年度科技风向标「2025人工智能年度榜单」评选报名开启!我们正在寻找AI+时代领航者 点击了解详情

❤️‍🔥 企业、产品、人物3大维度,共设立了5类奖项,欢迎企业报名参与 👇 

一键关注 👇 点亮星标

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 人工智能 学术研究 论文撰写 科研 Virtuous Machines 自动化 机器学习 AI research academic publishing autonomous research machine learning
相关文章