Coding with Intelligence 09月25日
2024年AI年终回顾
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

2024年最后两周AI领域发展迅速,DeepSeek-V3、QwQ、QVQ等模型相继推出,计算集群规模扩大,o3模型在SWE-bench上取得71.7%的成绩。Groq Appgen展示AI快速生成Web应用能力,Epoch AI指出前沿模型规模缩小趋势。DeepMind发布Gemini 2.0 Flash Thinking模型,Meta推出ModernBERT。Nebius Cloud团队使用开源模型在SWE-bench上达到40.6%的解决率。多项技术突破和应用进展预示2025年AI将更加繁荣。

🔍 2024年末AI技术快速迭代,DeepSeek-V3、QwQ、QVQ等开源模型相继推出,显著降低前沿级模型成本。DeepSeek-V3拥有671B MoE参数,输入输出成本仅为GPT-4o的1/9,但SWE-bench评估略逊于Claude Sonnet 3.5。

💻 Groq Appgen利用Groq速度和Llama 3.3模型实现Web应用即时生成,展示AI在软件开发中的实际应用能力。该平台采用能量系统管理创作过程,新用户初始拥有15个能量单位,每小时充电3个。

📈 Epoch AI研究发现前沿AI模型规模趋于缩小,高效率模型更符合商业需求。Meta的ModernBERT作为BERT改进版本,为特定任务微调提供优质基础,已在Hugging Face获得广泛下载。

🚀 o3模型在SWE-bench上取得71.7%的解决率,标志着AI自动化软件开发能力大幅提升。Nebius Cloud团队使用Qwen-2.5-72B Instruct和Llama 3.1 70B Base开源模型组合,在SWE-bench验证版上达到40.6%的成绩。

🎬 DeepMind发布Gemini 2.0 Flash Thinking模型,结合长文本处理与实时推理能力。Meta的Memory Layers技术使语言模型在计算预算翻倍时表现优于密集模型,并在参数相同时胜过专家混合模型。

Dear readers,

Happy New Year and welcome to 2025! This week’s edition is a collection of everything that happened in the final 2-weeks (51/52) of 2024, and BOY did it get busy during that final sprint of the year. If nothing else, I think it signals that 2025 is going to be an incredible year for AI. With democratization of frontier performance (DeepSeek-V3, QwQ, QVQ, Llama 3.3 70B, Qwen 2.5 72B), an incredible installed base of compute clusters (multiple interconnected 100k accelerator clusters, 1M clusters in the works), and new frontier heights (o3) that fully automate most run of the mill software engineering (71.7% on SWE-bench verified), the pace of progress is bound to be electric. Strap in and enjoy the ride!

- Rick Lamers

DeepSeek-V3 Perf/Cost chart: a new position on the Pareto front

📰 News

📦 Repos

📄 Papers

🛠️ Products

📚 Resources


Want more? Follow me on X! @ricklamers

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI技术进展 开源模型 软件开发自动化 DeepMind Meta AI
相关文章