掘金 人工智能 09月17日
数禾科技引入StarRocks,实现实时数仓升级与降本增效
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

金融科技公司数禾科技为应对业务增长带来的实时决策挑战,成功引入阿里云EMR Serverless StarRocks构建实时数仓。新架构解决了原离线数据处理架构响应滞后、资源利用率低的问题。通过标准化数据链路、存算分离、生态兼容性强的技术选型,数禾科技实现了数据处理的实时化、标准化和智能化。落地应用包括实时数据监控和离线数据分析,关键业务报表时效性从小时级提升至分钟级,架构健壮性增强,并显著降低了存储和运维成本,为业务增长提供了强劲动能。

💡 **实时决策能力提升**:数禾科技通过引入StarRocks,将关键业务报表的时效性从T+1(小时级)提升至分钟级,使得金融业务的瞬息万变能够得到更快速的响应,显著增强了风险预警和决策的敏捷性。

🚀 **技术架构标准化与优化**:数禾科技构建了标准化的三层数据架构(ODS、CDM、ADS),提高了数据复用率,并采用存算分离的混合架构,将存储成本降低了50%,同时借助其强大的生态兼容性,实现了湖仓一体,避免了数据搬迁,有效解决了原有架构复杂、数据冗余的问题。

💰 **显著的降本增效成效**:通过合并原有的ClickHouse、Doris等多套OLAP引擎,数禾科技降低了资源成本,并将集群资源利用率从不足40%提升至75%。同时,智能调度系统和高可用保障机制,以及缓存磁盘策略,进一步降低了运维成本,实现了每年超百万元的存储成本节约。

🤝 **湖仓一体的统一数据源**:数禾科技利用StarRocks的External Catalog功能,能够实时访问湖上的数据,并将其加工后落入StarRocks内表,为BI、AI、Adhoc查询和报表提供了统一、单一的真实数据源,简化了数据管理和访问流程。

一、客户背景与业务挑战

1.1 客户介绍

数禾科技是一家金融科技领域的知名企业,致力于通过大数据和人工智能技术为金融机构提供高效的智能零售金融解决方案,服务银行、信托、消费金融公司、保险、小贷公司等持牌金融机构,业务涵盖消费信贷、小微企业信贷、场景分期等多个领域,提供智能营销、智能客服、智能运营等服务。

1.2 业务挑战

随着业务规模的快速增长,其原有的离线数据处理架构已无法满足实时决策需求,数据冗余、资源利用率低等问题日益凸显。

在数字化转型加速的今天,数禾科技面临以下核心痛点:

"我们需要一个能统一技术栈、支持实时分析且具备高扩展性的解决方案。"——数禾科技数据团队负责人

通过引入StarRocks实时数仓解决方案,数禾科技成功实现了数据链路的标准化与智能化升级,为业务增长注入新动能。

二、技术选型决策

考虑到兼容性与性能的平衡,数禾选择阿里云EMR  Serverless StarRocks作为实时数仓的解决方案。

三、技术方案落地

3.1 架构设计

标准化数据链路建设

数禾科技借助StarRocks构建三层数据架构:

全生命周期管理

3.2 业务场景落地

实时数据监控场景

    采用 Flink 消费 Kafka 或者 Flink CDC 直接消费业务库的 Binlog,以确保数据的新鲜度。这样,StarRocks 上 ODS 层的数据时效性也会得到保障。基于微批调度设置较小的间隔,能够为业务提供准实时的报表数据。

    另一部分实时埋点数据量巨大,采用湖仓一体的架构来减轻 StarRocks 的压力,并在一定程度上保证数据时效性。

StarRocks 主要作为计算引擎,数据实时落在湖上,为 BI/AI/Adhoc/报表等业务提供了统一的单一真实数据源。StarRocks 通过 External Catalog 实时访问湖上数据,加工后将其落入 StarRocks 内表中,从而提高查询效率。

离线数据分析场景

对于一些实时性要求不高的离线报表,基本上采用 T+1 的时效。离线报表通过数据仓库的链路加工,利用 StarRocks 的能力对相应的数据集进行查询加速。离线报表加速采用与实时埋点数据相同的数据链路,通过湖仓一体的方式访问数据,从而减少数据搬迁。

四、实战成效

通过StarRocks实时数仓建设,数禾科技实现: 实时决策:关键业务报表时效性从小时级提升至分钟级,风险预警响应速度大幅提升。

架构健壮:采用分布式架构,支持自动容错和故障转移,确保 FE/CN 节点的高可用性。

降本增效:合并3套旧有系统,降低资源成本,同时借助阿里云EMR Serverless StarRocks对节点、任务、元数据全方位的监控数据,降低运维成本。

五、未来展望

未来,数禾计划结合 Paimon 进一步完善实时湖仓一体架构,并利用 StarRocks 在数据湖中的卓越性能,进行联合分析查询, 统一查询服务。此外,数禾计划引入 StarRocks 的 Multi-warehouse 和动态扩缩容节点功能,以实现资源隔离和读写分离,从而增强集群的稳定性。

欢迎体验最新版本的StarRocks:help.aliyun.com/zh/emr/star…

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

数禾科技 StarRocks 实时数仓 阿里云EMR Serverless 金融科技 大数据 数据架构 降本增效 湖仓一体
相关文章