本来我只是在一个 GPU 云公司敲代码的。
前一阵老板说我们有 GPU 资源,得用起来啊!
于是大家来了个头脑风暴,聊来聊去,发现没啥比微调训练更需要算力的了。
那咱干脆就做个低代码大模型微调平台吧。
兄弟们叮了咣啷的搞了 2 个月,终于是上线了。
现在已经能支持一百多种开源模型( Qwen 、Llama 、Yi 、InternLM 什么的都有),LoRA 、QLoRA 、全参数训练都能跑,底层用的 H100 。
不过现在我有个疑惑:
我自己觉得这玩意挺方便的,但我发现我不知道到底是谁,在什么场景下,会真正需要这么一个东西? 😂
我不是来打广告的哈,主要是想跟大家取取经:
一是想看看大家都在什么场景下会做微调;
二是我们这样一个产品大家会用的上嘛?
如果有人刚好在搞微调、或者想跑点实验,可以私我哈,可以给大家搞点额度玩玩。
