V2EX 10月16日 15:57
大模型架构理解与性能优化
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了在不对大模型进行微调和训练的情况下,如何通过了解其架构进行性能优化。

今天有个面试,面试官问我会不会对大模型的架构去做了解,我说我不会去了解这东西。然后面试官语气就明显不愉快地说:“你确定你刚刚说的是你不会去了解对吗”?我立马反问:“你们相关的工作会涉及到大模型的微调和训练吗”?面试官说:“不,我们不会涉及。但是我们用东西不能只是傻瓜式地调用,你不清楚原理你怎么做性能优化”?

我是真的很好奇想问一下 V 友,在不去微调和训练大模型的前提下,只了解大模型的架构,如何去做性能优化呢?

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大模型架构 性能优化 微调 训练
相关文章