掘金 人工智能 11月11日 06:57
EMR Serverless StarRocks发布企业级内核Stella,性能大幅提升
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

2025年云栖大会上,EMR Serverless StarRocks发布了全新企业级内核Stella,完全兼容开源StarRocks。Stella(StarRocks Efficient and Lightening-fast Lakehouse)在TPC-H基准测试中取得全球冠军,QphH超754万分,性能较上一版本提升超120%。新内核在实时数仓、湖仓分析、全文检索三大场景全面升级,提供多Warehouse、Paimon查询性能提升、全新倒排索引等功能,并优化了Multi-Warehouse、缓存调度及元数据管理,旨在为用户提供卓越性能、稳定性和成本效益。

🚀 **企业级内核Stella重磅发布**:EMR Serverless StarRocks在2025年云栖大会上推出了全新企业级内核Stella,该内核完全兼容开源StarRocks,并提供了企业级的产品功能、卓越的性能及稳定性保障。Stella在权威TPC-H基准测试中创造了754万QphH的全球最佳成绩,性能较上一版本提升超过120%,展现了其在云原生数据分析领域的领先地位。

📊 **核心场景全面升级,性能与成本显著优化**:Stella在实时数仓、湖仓分析和全文检索三大核心场景上实现了重大突破。实时数仓方面,多Warehouse正式发布,支持读写分离,内核性能提升100%,使用成本降低50%-80%,并支持数据治理和血缘功能。湖仓分析方面,Paimon查询性能提升100%,DV表分析性能提升300%+,StarRocks+Paimon组合性能较Trino+Paimon提升12倍以上,并与阿里云DLF 2.x系列深度集成。全文检索方面,全新倒排索引架构发布,导入性能提升3倍+,日志分析性能提升5倍+,存储成本降低80%+。

💡 **关键技术优化与企业级能力增强**:Stella内核在存算分离架构下进行了多项关键优化,包括支持Index & Meta Cache优先级、缓存自适应IO框架、高频导入场景调度算法优化、海量Tablet调度优化以及轻量ETL场景下的缓存空间管理。Multi-Warehouse作为企业级资源隔离方案正式发布,实现了数据共享与计算隔离、全面资源隔离以及弹性伸缩协同,已成为企业用户广泛组合使用的核心功能之一,有效解决了大规模集群的资源争抢问题。

🔍 **全新全文检索引擎提供高效文本搜索**:新发布的全文检索功能基于倒排索引,适用于日志分析、商品标题匹配等场景。相比旧版本,查询性能提升3-5倍,导入速度更快,存储成本显著降低。用户可以通过建表时或建表后创建GIN索引,并使用match、match_all等语法实现多样化的文本检索需求,为非结构化数据的分析提供了强大支持。

2025 年云栖大会,EMR Serverless StarRocks重磅发布全新企业级版本内核Stella (StarRocks Efficient and Lightening-fast Lakehouse),完全兼容开源StarRocks,为用户提供企业级的产品功能、卓越的性能及稳定性保障。

EMR Serverless StarRocks在权威TPC基准测试中创造佳绩:在“数据分析”性能测试TPC-H榜单中,阿里云EMR Serverless StarRocks (Stella 1.2.0内核)以QphH超754万分的性能结果斩获全球冠军领先第二名111%

全新企业级内核Stella在TPC-H 10TB标准测试场景下,相比上一版本性能提升超过120%,登顶TPC榜单全球第一;与此同时,在Lakehouse典型场景中,StarRocks + Paimon组合的TPC-H 1T的性能测试,相比上一个版本性能提升100%,相比Trino + Paimon实测性能提升高达12倍,Paimon DV表的模式下提升300%。充分验证了其在复杂分析查询中的极致性能与云原生架构的领先优势。同时发布了全新的全文检索引擎,较之前版本过滤性能提升100%

三大核心场景全面升级

Stella 聚焦云原生Lakehouse能力提升,在实时数仓、湖仓分析、全文检索三大核心场景上取得重大突破:

    实时数仓
    湖仓分析
    全文检索

核心能力优化

Multi-Warehouse:企业级资源隔离方案

Multi-Warehouse针对大型StarRocks集群的资源隔离难题提供了有效解决方案。随着集群规模扩大和业务场景增多,资源争抢问题逐渐凸显——导入任务过大影响查询性能、大型SQL操作阻塞其他业务查询。

Multi-Warehouse基于存算分离架构,实现了:

目前,在使用存算分离架构的客户中,约半数已启用Multi-Warehouse,该功能与弹性伸缩已成为企业用户广泛组合使用的两大核心功能。

Stella 内核性能提升

在TPC-H 10T基准测试中,存算分离版本的Stella相比上一版本性能提升超过120%,充分展现了云原生架构的技术优势。

重点优化:

湖仓分析场景优化

Stella在Lakehouse场景下查询Paimon下性能的提升也非常明显:

重点优化

通过与Data Lake Formation的深度集成,用户只需简单创建catalog即可访问DLF中的数据表,权限配置在DLF中即可自动同步至StarRocks,实现真正的即开即用。

全文检索发布

全新全文检索功能现已在存算一体与分离架构中全面支持,基于 全文倒排索引实现高效文本搜索。适用于日志分析、商品标题匹配等场景。相比旧版,查询性能提升 3-5 倍,导入更快,存储成本显著降低。全文检索功能支持主键表和明细表,用户可在建表时或建表后创建索引,使用match、match_all等语法实现多样化的文本检索需求。

全文倒排索引使用方法

建表时创建索引:

CREATE TABLE `t` (  `k` BIGINT NOT NULL COMMENT "",  `v` STRING COMMENT "",  INDEX idx (v) USING GIN("parser" = "english")) ENGINE=OLAPDUPLICATE KEY(`k`)DISTRIBUTED BY HASH(`k`) BUCKETS 1PROPERTIES (  "replicated_storage" = "false");

建表后创建索引:

-- Create Index After Create TableALTER TABLE t ADD INDEX idx (v) USING GIN( 'parser' = 'english');

全文检索查询:

-- MATCH/MATCH_ANYselect * from testdb.http_logs where request match "images hm_bg";-- MATCH_ALLselect * from testdb.http_logs where request match_all "images hm_bg";-- MATCH_PHRASEselect * from testdb.http_logs where request match_phrase "GET /images";-- MATCH_PHRASE_PREFIXselect * from testdb.http_logs where request match_phrase_prefix "GET /im";-- MATCH_PHRASE_EDGEselect * from testdb.http_logs where request match_phrase_edge 'et images hm';

Stella 的发布标志着 EMR Serverless StarRocks 在企业级数据分析领域迈入新的里程碑。从实时数仓到湖仓分析,从全文检索到多业务隔离,Stella 为每一个场景都带来了实实在在的性能提升和成本优化。

依托于在 TPC-H 10T 基准测试中超过 120% 的性能飞跃,以及在开放湖仓场景下提升高达 12 倍的实测查询优势,Stella 不仅验证了其技术架构的先进性,更彰显了阿里云在云原生数据处理领域的深厚积累与持续创新能力。这些成绩背后,是存算分离架构、分布式元数据管理、智能缓存调度、Delete Vector 优化等核心技术的全面突破,使得 Stella 能够从容应对超大规模数据下的复杂分析挑战。

面向未来,Stella 将继续深化在 Lakehouse 架构、实时化、智能化方向的探索,为企业构建统一、高效、低成本的数据分析底座提供更强有力的支撑。无论是金融、电商、互联网还是制造业客户,都将借助Stella 实现更快速的决策响应、更灵活的资源调度与更可观的总体拥有成本(TCO)优化。EMR Serverless StarRocks 正以开源兼容为基石,以企业级能力为核心,引领云原生数据分析的新时代。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

EMR Serverless StarRocks Stella 云栖大会 数据分析 Lakehouse 实时数仓 全文检索 TPC-H 性能提升 成本优化
相关文章