Zilliz 05月22日
官宣| Zilliz Cloud 推出在线迁移功能,无感迁移不停机
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Zilliz Cloud 推出Zero-Downtime Migration(在线迁移)功能,旨在解决集群升级和架构迁移带来的停机问题。该功能允许用户在不中断服务的情况下,安全、高效地迁移数据。通过结合备份工具和CDC(变更数据捕捉)机制,确保历史数据和实时写入的数据同步迁移。用户只需点击“迁移”按钮,即可完成快照捕获、写入监听和增量同步等流程,简化了迁移过程,降低了迁移成本,并提供了更灵活的架构演进选择。

🚀 **在线迁移的必要性:** 随着业务发展,集群升级、变更部署方式成为常态,传统迁移方式常导致停机维护,影响服务可用性。Zilliz Cloud 的在线迁移功能应运而生,满足了用户对高可用、无中断迁移的需求。

⚙️ **在线迁移的工作原理:** 该功能基于“双引擎”架构,结合备份工具捕获完整快照数据,并利用CDC工具实时同步新增写入数据。这种设计保证了目标集群与源集群的数据一致性,且迁移过程对业务影响极小。

✅ **简化迁移流程:** 用户无需手动配置CDC或快照计划,只需点击“迁移”按钮,Zilliz Cloud 将自动完成数据同步。同时,该功能屏蔽了迁移过程中的复杂性,降低了数据一致性问题、写入冲突等风险,确保迁移安全可靠。

原创 与你一起成长的 2025-05-22 18:07 上海

迁移不再个负担,而只是一件可以顺利完成的小事

我们在做 Zilliz Cloud 的过程中,其实遇到过很多用户问我们一个问题:

“如果我想从 Serverless 集群切到 Dedicated,要怎么迁?”

看上去,这是一个再正常不过的 SaaS 使用场景。从小团队到独角兽,没有哪家公司的系统架构是一夜长成的——规模小的时候,业务在 serverless 上跑,大点了换成 Dedicated 集群,再长出多地容灾、多副本隔离、CU 动态伸缩……业务演化的结果,一定是架构的迁移、集群的升级。

但是从技术角度来说,它又从来不只是一个按钮那么简单。它可能意味着大停机,可能意味着团队必须协调好时间窗口,备份数据,通知用户,甚至准备好应急预案。

我们见过太多因为升级迁移导致的灾难现场:

迁移中断,但表没同步完,直接导致结算系统金额偏差;跨区迁移,CDC失败未告警,用户行为数据延迟;数据是完整的,但迁移过程中字段类型做了强制转换,导致召回率直线下跌……

为什么大家都默认迁移就会出bug,而且这是一件要靠人扛的事?明明是合理的系统演进,为什么要让所有人如临大敌?

我们觉得不应该是这样。 所以我们开始尝试,能不能把“迁移”这件事做得更自然一点,甚至不被察觉。

基于这一背景,我们推出了Zero-Downtime Migration,在线迁移(内测版)。

通过这个功能,无论是升级集群,还是变更部署方式(例如从 Capacity CU 迁移至其他类型),现在都可以在不中断服务的情况下完成数据迁移。

01 

为什么需要在线迁移?

最常见的迁移动因,其实只有三个字:“不够了。”

Serverless 跑不动了、响应太卡了;CU 被打满了、后台写入延迟飙升;索引改不了,配置调不动;再或者业务扩张需要海外多地部署……

以往,在不同集群之间迁移数据通常需要计划性的停机维护——对于有严格可用性要求的企业而言,这会对日常的生产带来极大的影响。

而通过“在线迁移”,迁移操作和发起一条查询一样简单,借助这个功能,你可以

无论你是从 Serverless 集群升级至 Dedicated 集群,还是需要更换集群 CU 类型的组织,本功能非常适合你在不中断服务的前提下完成迁移。

02 

它是如何工作的

传统上,实现真正无缝的数据迁移(即同时涵盖历史数据与实时写入)需要构建复杂的数据管道,包括快照备份和 CDC(变更数据捕捉)机制。

这类工程不仅需要精密的编排,还要处理故障转移、事件顺序保证等问题。

而 Zilliz Cloud 的“在线迁移”则为你封装好了所有底层复杂流程。

在底层,我们结合了两大核心系统:

    备份工具:捕获源集群完整、一致的快照数据

    CDC 工具:持续监听并实时将新增写入同步至目标集群

这种“双引擎”架构确保了目标集群始终与源集群的状态仅相差数秒,而你的业务系统可以在迁移过程中正常运行

这样,无需手动配置 CDC 或快照计划,用户只需点击“迁移”按钮,Zilliz Cloud 就会自动完成快照捕获、写入监听、增量同步等流程。

此外,我们见过很多用户自己写迁移脚本,调试好几天。常见问题包括:

这些问题 Zilliz Cloud 都已经帮你考虑过了。我们把它变成了一套产品内建的能力,从数据同步到最终切换,全部托管,安全可靠。

整个过程长这样:

    选择目标集群,点击“开始迁移”

    后台启动全量备份,同时自动接入 CDC,同步实时数据

    迁移完成后,按提示即可将业务切换到新集群

整个流程中的各个环节(备份、CDC、故障切换)都被彻底屏蔽复杂度。无需额外基础设施、无需写脚本、无意外风险。另外,你会在每个关键节点收到邮件提醒,整个过程只有秒级延迟,对现有服务的影响非常小,几乎可以忽略。

对于开发者来说,它意味着:你可以随时升级你的集群,不用等业务空窗期;你可以更大胆地做架构演进,不会被“迁移成本”绑住手脚;你可以把迁移当成一个普通的运维任务,不再是一场战役。

03 

如何体验它

我们在设计“在线迁移”这个功能时,我们讨论最多的问题是:

“如果我是一个正在用 Zilliz Cloud 的人,我为什么不敢迁?”

后来我们意识到,真正让人恐惧的不是操作本身的复杂,而是不确定点了迁移之后,服务会不会卡;不知道同步过程出问题了,能不能回头,而这种不确定,正是因为绝大多数基础设施演进还在“未完成阶段”。

我们花这么大力气做“在线迁移”,其实是想传达一个态度:你可以从小集群开始试错,也可以随着业务增长去切更强的配置,如果有一天你需要迁移数据,希望你不会再觉得这是个负担,而只是一件可以顺利完成的小事。

现在,“在线迁移(Zero-Downtime Migration)”已上线 Zilliz Cloud 控制台进入内测,并且当前阶段完全免费(未来或按传输量计费)。

如需体验此功能,欢迎在后台联系我们。如需操作指南与注意事项,请参阅我们的文档在线迁移内测说明(https://docs.zilliz.com.cn/docs/zero-downtime-migration),或随时联系技术支持团队。

——Zilliz Cloud 产品团队

推荐阅读

从部署到迁移,怎么用好Milvus,这是我们的经验总结

从BGE到 CLIP,从文本到多模态,Embedding 模型选型终极指南

Milvus Week|开源,Milvus 2.6功能预览:内存减少 72%,速度比ES快4倍

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Zilliz Cloud 在线迁移 数据迁移 Serverless Dedicated
相关文章