9月13日,全球开源创新大会GOSIM2025上,清华大学与中国软件评测中心联合发布了《2025 大模型服务性能排行榜》。随着模型即服务(MaaS)的普及,用户在选择供应商时面临性能差异带来的困扰。该排行榜旨在解决这一问题,通过AI Ping平台,全面评估20多家厂商的230多项模型服务,涵盖延迟、吞吐量、可靠性、价格等关键指标,为开发者提供客观选型指南。例如,不同平台部署相同模型,在输出吞吐和首字延迟上最高可相差4.9倍和4.3倍,突显了榜单的价值。
📊 **大模型服务性能排行榜发布**:清华大学与中国软件评测中心在GOSIM2025大会上联合发布了《2025 大模型服务性能排行榜》,这是国内首个针对大模型服务性能的权威榜单,旨在为快速普及但选择困难的模型即服务(MaaS)领域提供指导。
🎯 **解决用户选择困境**:榜单的发布源于用户在选择MaaS供应商时面临的难题,由于不同供应商在延迟、吞吐量、可靠性、价格、上下文长度及最大输出长度等关键性能指标上存在显著差异,导致用户难以决策。例如,相同模型在不同平台上的输出吞吐量最高可相差4.9倍,首字延迟最高相差4.3倍。
💡 **AI Ping评测平台赋能**:本次榜单的评测工具和数据展示平台由清华系人工智能企业清程极智打造的AI Ping提供。AI Ping是一个全面、客观、真实的评测与信息汇总平台,目前已接入20多家厂商的230多项模型服务,覆盖主流厂商与模型,为开发者提供多维度数据参考。
🚀 **MaaS模式的普及与挑战**:模型即服务(MaaS)以其低成本、低门槛、易上手的优势正迅速普及,但供应商的涌现也带来了市场选择的复杂性。排行榜的出现,为开发者在众多MaaS选项中找到最适合自身需求的模型服务提供了有力支持。
9月13日,全球开源创新大会GOSIM2025召开,清华大学携手中国软件评测中心联合发布了《2025 大模型服务性能排行榜》。
模型即服务(MaaS,Model as a Service)凭借低成本、低门槛、易上手等优势,正快速普及。
但随着供应商的大量涌现,用户在选择时却面临诸多难题,比如不同供应商在延迟、吞吐量、可靠性、价格、上下文长度以及最大可输出长度等关键性能指标上存在显著差异,这无疑给用户的选择带来了极大困扰。例如,同样是部署 DeepSeek,不同平台之间在价格和性能上就会有明显差别,以最为知名的数家互联网厂商云服务、电信运营商为例,相同模型的各供应商之间输出吞吐最高相差4.9倍,首字延迟最高相差4.3倍。
《2025 大模型服务性能排行榜》的发布,为开发者提供了一份选型指南。
本次榜单的评测工具和数据展示平台是清华系人工智能企业清程极智打造的— AI Ping。AI Ping 是一个面向大模型使用者的全面、客观、真实的大模型服务评测与信息汇总平台,旨在为开发者提供大模型服务商的多维度数据参考,目前,该平台已接入20多家厂商的 230 多项模型服务,覆盖主流厂商与模型。