掘金 人工智能 09月03日
MiniMax携手阿里云优化数据处理与AI融合
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AI公司MiniMax在业务快速增长后面临数据平台建设的挑战,包括异构架构效率瓶颈、技术栈碎片化、开发与运维效率低下以及资源成本与利用率失衡等问题。通过与阿里云合作,MiniMax构建了一体化云原生数仓技术架构,利用DataWorks、Flink、Hologres、MaxCompute和Elasticsearch等服务,实现了数据源的聚合、实时与离线计算的融合以及数据生命周期的全链路管理。这一方案显著提升了数据入仓速度、决策效率,统一了技术栈,降低了运维成本,优化了资源利用率,并成功支撑了PB级别的数据处理。此外,MiniMax还基于阿里云MaxFrame构建了Data+AI数据处理平台,解决了资源弹性瓶颈、预处理算子性能不足和任务管理可视化等问题,进一步加速了AI工作流。

🧰 **架构统一与效率提升**:MiniMax通过引入阿里云原生数仓解决方案,整合了全球异构数据源,解决了技术栈碎片化和开发效率低下的问题。利用DataWorks作为一站式开发治理中枢,结合Flink、Hologres、MaxCompute等,实现了流批计算融合及数据生命周期全链路管理,大幅降低了运维复杂度,提升了团队交付效率,并成功支撑了PB级别的数据处理。

⚡ **资源优化与成本控制**:面对资源成本高昂和利用率低的问题,MiniMax通过阿里云的云原生数仓解决方案,特别是存算分离和算子优化技术,将计算资源用量降低了50%(目标75%),存储成本降低了40%。基于MaxFrame,通过MaxCompute的“包月固定资源+按需弹性资源”组合模式,在高峰时段实现了数十万核计算资源的快速弹性扩展,提高了30%的资源利用率。

🚀 **AI工作流加速与性能突破**:为应对大模型训练对数据处理提出的更高要求,MiniMax基于阿里云MaxFrame构建了全托管、一站式Data+AI数据处理平台。该平台支持统一管理多类数据(结构化、非结构化、多模态),通过兼容开源的分布式算子(如Minhash)显著提高了数据预处理任务的效率,解决了文件大小限制、内存溢出等问题,并简化了任务管理和开发流程,使团队能更专注于AI核心业务创新。

MiniMax简介

MiniMax是全球领先的通用人工智能科技公司。自2022年初成立以来,MiniMax以“与所有人共创智能”为使命,致力于推动人工智能科技前沿发展,实现通用人工智能(AGI)。MiniMax自主研发了一系列多模态通用大模型,包括MiniMax M1、Hailuo 02、Speech 2.5 和Music 01等,具备超长上下文处理能力,能够理解、生成并整合包括文本、音频、图像、视频和音乐在内的多种模态。自研模型的飞速进展,有力支撑了MiniMax的全球业务拓展。迄今,MiniMax的自研多模态模型及AI原生应用已累计为来自超过200个国家及地区的逾1.57亿名个人用户,以及来自超过90个国家及地区的50,000余名企业客户以及开发者提供服务。


业务大数据实践:数据驱动MiniMax业务高效迭代

业务痛点

自2024年起,MiniMax的海螺AI、MiniMax Audio和星野等业务在国内外迎来快速增长,用户数据量呈现爆发式增长,快速攀升至数十PB级别,给数据平台的建设带来了诸多技术挑战:

    异构架构的效率瓶颈
    资源成本与利用率失衡

阿里云原生数仓解决方案

阿里云协助MiniMax构建了全球一体化云原生数仓技术架构,该架构以阿里云数据开发治理平台Dataworks作为一站式开发治理中枢,实现了异构数据源接入、流批计算融合、实时离线数据协同及数据生命周期全链路管理

    数据源层

聚合多模异构存储,覆盖OLTP、非结构化数据及实时流数据

    计算层
    存储层

对象存储OSS作为冷数据存储层,无缝对接MaxCompute,实现数据智能冷热分层,优化成本与性能平衡

业务价值

基于阿里云云原生数仓解决方案,MiniMax构建了覆盖全球业务的一体化数仓技术栈,依托高性能、低延时与 Serverless 快速弹性能力,为经营分析、用户增长等关键业务场景提供了高效稳定的技术支撑。

    数据入仓加速,决策效率提升

通过DataWorks可视化ETL实现数据源到Hologres的实时全量与增量同步,利用MaxCompute和Hologres的跨引擎数据联邦能力,构建实时存储与离线计算解耦架构,关键数据入仓时间提前约1小时,显著提升业务决策时效性。

    架构统一,运维效率提升

全球统一技术栈基于阿里云云原生数仓的Serverless存算分离架构,大幅降低运维复杂度,提升团队交付效率。

    稳定支撑大规模数据处理

基于DataWorks、 MaxCompute、Hologres等构建的一站式大数据平台,实现开发、调度、运维与治理全链路统一管理,当前数据总量超数十PB,日均处理量达数百TB。

    资源利用率优化,成本显著降低

通过存算分离、算子优化等技术手段,计算资源用量降低50%,后续通过进一步优化计算资源利用率,计算资源用量整体降低75%;通过数据生命周期管理策略,存储成本降低40%,实现性能与成本的最优平衡。

基于阿里云 MaxFrame 构建云原生数据流水线:赋能AI工作流加速

在大模型技术迅猛发展的背景下,数据与人工智能的深度融合已成为企业构建核心竞争力的关键要素。大模型训练持续驱动大规模数据处理技术升级迭代,对计算弹性、预处理算子性能及统一数据治理体系提出了更高要求。基于 MiniMax 在阿里云云原生数仓解决方案上的深度业务实践,双方正持续探索更先进的大规模数据处理与AI融合解决方案,致力于通过阿里云MaxFrame等新一代计算框架,进一步提升数据处理效能,加速AI创新落地。

业务痛点

    资源弹性瓶颈

模型训练节奏快,常需临时调用大规模弹性资源,对PB级数据进行短时高效预处理,并在任务完成后快速释放资源。传统架构难以兼顾资源弹性、处理时效与成本控制。

    预处理算子性能不足

数据预处理过程中常出现文件大小限制、内存溢出(OOM)、全量MinHash去重任务无法完成等问题,导致作业成功率低、稳定性差,严重影响整体流程效率。

    缺乏统一任务管理与可视化支持

原有流程依赖Python程序完成开发、调试与生产任务,缺少可视化任务开发、管理、调度和运维能力,多参数迭代效果评估困难,开发效率低下。

    开发与运维人力投入受限

自研数据预处理(如Common Crawl数据集处理等)需投入大量人力进行开发与维护,团队难以专注于核心AI业务创新。

解决方案

MiniMax基于阿里云MaxCompute构建了全托管、一站式 Data + AI 数据处理平台,并通过MaxFrame分布式计算框架实现了对多类数据(结构化与非结构化、多模态等)的统一管理与弹性伸缩的大规模预处理能力:

    阿里云自研分布式计算框架,统一 Python 开发生态,同时无缝对接MaxCompute 计算资源、数据;

    提供兼容开源的分布式算子,如 Pandas、Minhash 等,大大提高数据处理效率;

    支持分布式数据处理、离线推理等场景,构建 Data + AI 开发整体 Pipeline;

    提供开箱即用的 Python 环境,支持用户自定义镜像,提供更便捷的开发体验。

业务价值

通过引入MaxFrame分布式计算框架,MiniMax在资源利用率、处理效率与平台架构方面实现显著提升:

    资源利用率显著提高
    分布式计算框架带来性能突破
    数据平台完成架构升级,运维效率提升

总结与展望

MiniMax与阿里云开展深度技术协同,在大模型时代成功构建了以云原生数据仓库为核心的高效、低成本Data+AI一体化数据处理平台,有效应对业务高速迭代与弹性扩展挑战。该方案不仅实现了数据处理效能的显著提升和运营成本的大幅优化,也为大模型驱动下的AI应用研发提供了可广泛复用的工程范式。未来,双方将持续深化在大模型数据预处理、多模态数据处理等前沿场景的联合创新,共同推动Data+AI技术在全球范围内的规模化产业应用。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniMax 阿里云 云原生数仓 大数据 AI Data+AI MaxFrame 数据处理 成本优化 性能提升
相关文章