低代码大模型微调平台开发与需求探讨

本来我只是在一个 GPU 云公司敲代码的。

前一阵老板说我们有 GPU 资源，得用起来啊！

于是大家来了个头脑风暴，聊来聊去，发现没啥比微调训练更需要算力的了。

那咱干脆就做个低代码大模型微调平台吧。

兄弟们叮了咣啷的搞了 2 个月，终于是上线了。

现在已经能支持一百多种开源模型（ Qwen 、Llama 、Yi 、InternLM 什么的都有），LoRA 、QLoRA 、全参数训练都能跑，底层用的 H100 。

不过现在我有个疑惑：

我自己觉得这玩意挺方便的，但我发现我不知道到底是谁，在什么场景下，会真正需要这么一个东西？ 😂

我不是来打广告的哈，主要是想跟大家取取经：

一是想看看大家都在什么场景下会做微调；

二是我们这样一个产品大家会用的上嘛？

如果有人刚好在搞微调、或者想跑点实验，可以私我哈，可以给大家搞点额度玩玩。

Fish AI Reader