HuggingFace 每日AI论文速递 10月09日 09:09
近期AI研究进展速递
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期精选了15篇AI领域的前沿研究论文,涵盖了表格推理、长程信息检索、高效大语言模型、代码生成、模型推理增强、策略优化、实体检索、科研方案评估、安全对齐失效、3D世界生成、BLEU分数计算、偏好优化控制、医学多模态生成、动态思考模式以及视频生成加速等多个方向。这些研究展示了AI在理解、生成和应用等方面的最新突破,为相关领域的研究者和开发者提供了宝贵的参考。

📊 **TaTToo: Tool-Grounded Thinking PRM for Test-Time Scaling in Tabular Reasoning** - 该研究提出了TaTToo模型,一个面向表格推理的“工具落地思维”过程奖励模型,旨在提高模型在测试阶段的推理能力和扩展性。

🔍 **Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs** - Fathom-DeepResearch展示了一种解锁小型语言模型(SLMs)长程信息检索和综合能力的方法,使其能够处理更长的上下文和更复杂的任务。

🚀 **Fast-dLLM v2: Efficient Block-Diffusion LLM** - Fast-dLLM v2是新一代的高效块扩散大语言模型,旨在通过优化扩散过程来提高模型的生成效率和性能。

🧑 **CoDA: Coding LM via Diffusion Adaptation** - CoDA提出了一种基于扩散适配的轻量级代码生成模型,通过将扩散模型应用于代码生成任务,实现了高效且高质量的代码生成。

🧩 **Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning** - 该研究探讨了如何通过规模化代码辅助的思维链(Chain-of-Thoughts)和指令来增强模型的推理能力,为提升模型逻辑推理提供了新的途径。

本期的 15 篇论文如下:

00:24 📊 TaTToo: Tool-Grounded Thinking PRM for Test-Time Scaling in Tabular Reasoning(TaTToo:面向表格推理测试时扩展的“工具落地思维”过程奖励模型)

00:57 🔍 Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs(Fathom-DeepResearch:解锁小模型长程信息检索与综合的钥匙)

01:39 🚀 Fast-dLLM v2: Efficient Block-Diffusion LLM(Fast-dLLM v2:高效的块扩散大语言模型)

02:30 🧑 CoDA: Coding LM via Diffusion Adaptation(CoDA:基于扩散适配的轻量级代码生成模型)

03:01 🧩 Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning(规模化代码辅助思维链与指令以增强模型推理)

03:52 ⚖ ASPO: Asymmetric Importance Sampling Policy Optimization(ASPO:非对称重要性采样策略优化)

04:34 🔗 Mixing Mechanisms: How Language Models Retrieve Bound Entities In-Context(混合机制:语言模型如何在上下文中检索绑定实体)

05:15 🧠 AInstein: Assessing the Feasibility of AI-Generated Approaches to Research Problems(AInstein:评估AI生成科研方案可行性的研究框架)

05:51 🪂 Refusal Falls off a Cliff: How Safety Alignment Fails in Reasoning?(拒绝断崖:安全对齐在推理中为何崩塌)

06:35 🌍 HoloScene: Simulation-Ready Interactive 3D Worlds from a Single Video(HoloScene:单视频生成可交互3D仿真世界)

07:22 ⚡ TensorBLEU: Vectorized GPU-based BLEU Score Implementation for Per-Sentence In-Training Evaluation(TensorBLEU:面向逐句训练评估的向量化GPU加速BLEU分数实现)

08:09 🎯 Margin Adaptive DPO: Leveraging Reward Model for Granular Control in Preference Optimization(边缘自适应DPO:利用奖励模型实现偏好优化的粒度控制)

09:00 🩺 Discrete Diffusion Models with MLLMs for Unified Medical Multimodal Generation(基于多模态大语言模型的离散扩散模型实现统一医学多模态生成)

09:46 🧠 MixReasoning: Switching Modes to Think(混合推理:动态切换思考模式)

10:20 ⚡ LightCache: Memory-Efficient, Training-Free Acceleration for Video Generation(LightCache:面向视频生成的内存高效、无需训练的加速方法)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI研究 大语言模型 机器学习 计算机视觉 自然语言处理 AI进展 AI新闻 AI论文 AI论文速递
相关文章