V2EX 10月29日 16:23
低代码大模型微调平台开发与需求探讨
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了作者所在公司开发的一个低代码大模型微调平台,并探讨了该平台的使用场景和市场需求。

本来我只是在一个 GPU 云公司敲代码的。

前一阵老板说我们有 GPU 资源,得用起来啊!

于是大家来了个头脑风暴,聊来聊去,发现没啥比微调训练更需要算力的了。

那咱干脆就做个低代码大模型微调平台吧。

兄弟们叮了咣啷的搞了 2 个月,终于是上线了。

现在已经能支持一百多种开源模型( Qwen 、Llama 、Yi 、InternLM 什么的都有),LoRA 、QLoRA 、全参数训练都能跑,底层用的 H100 。

不过现在我有个疑惑:

我自己觉得这玩意挺方便的,但我发现我不知道到底是谁,在什么场景下,会真正需要这么一个东西? 😂

我不是来打广告的哈,主要是想跟大家取取经:

一是想看看大家都在什么场景下会做微调;

二是我们这样一个产品大家会用的上嘛?

如果有人刚好在搞微调、或者想跑点实验,可以私我哈,可以给大家搞点额度玩玩。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

低代码 大模型微调 平台开发 需求探讨
相关文章