AI & Big Data 10月17日 09:11
Red Hat AI 3發布,提升企業級AI平台效能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Red Hat發布Red Hat AI 3,新一代企業級AI平台,目標是將推論工作負載推進至可預測、可治理的生產環境。以OpenShift AI 3.0為核心,內含正式版llm-d與Red Hat AI Inference Server 3.2,支援企業級vLLM與異質加速器。llm-d為Kubernetes原生推論框架,智慧調度模型減少延遲,提升吞吐量。OpenShift AI 3.0引入模型即服務(MaaS)開發者預覽,提供一致模型取用體驗。代理式人工智慧是另一重點,提供統一API層與MCP支援。Red Hat AI 3推出模組化客製化工具鏈,強化非結構化文件處理,並擴充第三方經驗證模型組合。

🔍 Red Hat AI 3以OpenShift AI 3.0為核心,內含正式版llm-d與Red Hat AI Inference Server 3.2,支援企業級vLLM與異質加速器,如Nvidia CUDA、AMD ROCm、Google TPU與IBM Spyre,提升推論效能與成本效率。

📈 llm-d為Kubernetes原生推論框架,能智慧調度模型,依據工作負載特性減少延遲,提升吞吐量,更貼近企業在生成式人工智慧應用中對SLA與成本控管的實際需求。

🔐 OpenShift AI 3.0引入模型即服務(MaaS)開發者預覽,提供內外部使用者一致的模型取用體驗,兼顧資料主權與隱私需求,形成平臺工程與應用團隊的共同作業介面。

🔗 代理式人工智慧是更新重點,OpenShift AI 3.0提供以Llama Stack為基礎的統一API層與MCP支援,簡化模型與外部工具及資料來源的連結,為後續大規模代理系統奠定介面與治理的一致性。

🛠️ Red Hat AI 3推出更模組化的客製化工具鏈,從資料導入、合成資料產生、微調到評測皆可拆分使用,並以Docling等開源專案強化非結構化文件處理,讓組織能用熟悉的Python工作流程逐步提升領域效果。

Red Hat(紅帽)發表Red Hat AI 3,作為該公司企業級人工智慧平臺的新一代版本,目標是將推論工作負載推進至可預測、可治理的生產環境。此波更新以OpenShift AI 3.0為核心平臺,內含已達正式版的llm-d,推論層則由可獨立部署的Red Hat AI Inference Server 3.2提供企業級vLLM與異質加速器支援。

llm-d為Kubernetes原生推論框架,將vLLM從單機的高效推論擴展成分散式運作、可預測的服務架構,能依據工作負載特性智慧調度模型,減少延遲並提升吞吐量,更貼近企業在生成式人工智慧應用中對SLA與成本控管的實際需求。

在推論效能方面,Red Hat AI Inference Server 3.2分支擴大異質硬體支援,支援Nvidia CUDA、AMD ROCm、Google TPU與IBM Spyre等加速器。企業可在不同加速器間維持部署彈性,同時結合vLLM與模型最佳化能力,提升吞吐與成本效率。

OpenShift AI 3.0引入模型即服務(Models as a Service,MaaS)開發者預覽,提供內外部使用者一致的模型取用體驗。企業IT可集中服務常用模型,讓人工智慧工程師與應用按需存取,同時兼顧無法上公有雲的資料主權與隱私需求,形成平臺工程與應用團隊的共同作業介面。

代理式人工智慧是另一個更新重點,OpenShift AI 3.0提供以Llama Stack為基礎的統一API層與MCP支援,兩者目前皆為預覽階段,簡化模型與外部工具及資料來源的連結,並為後續大規模代理系統奠定介面與治理的一致性。OpenShift AI 3.0同時提供AI hub與gen AI studio兩種工具,分別面向平臺工程師與人工智慧工程師,前者用於資產治理,後者用於實驗與原型製作,讓模型與工具能在同一平臺完成登錄、部署與測試。

Red Hat AI 3推出更模組化的客製化工具鏈,從資料導入、合成資料產生、微調到評測皆可拆分使用,並以Docling等開源專案強化非結構化文件處理,讓組織能用熟悉的Python工作流程,逐步提升領域效果而不被單一工具綁定。

Red Hat擴充第三方經驗證與最佳化的模型組合,並透過Hugging Face的Red Hat AI儲存庫與自家生態系目錄提供掃描可追溯的容器化成品,有助於在一致的供給與治理流程中導入與更新模型,降低相容性與安全風險。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Red Hat AI 3 OpenShift AI llm-d AI Inference Server vLLM Heterogeneous Accelerators Models as a Service (MaaS) Proxy AI Modular Toolchain Unstructured Document Processing
相关文章