AI & Big Data 10月09日 12:10
AI浪潮推动平行文件系统发展与创新
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近年来,平行文件系统因AI应用的兴起而迎来爆发式增长,从传统HPC领域拓展至企业级应用。新一代平行文件系统在部署管理、可靠性及数据服务方面实现了根本性提升。近期,该领域涌现出GPU服务器端部署、大型语言模型推理快取优化、AI基础架构改造以及新厂商的加入等关键新发展。平行文件系统凭借其强大的扩展能力和高传输性能,成为满足AI应用对海量数据存储和高速数据传输需求的理想选择,正引领存储市场的新一轮变革。

🌟 **AI驱动下的平行文件系统新机遇**:过去几年,平行文件系统因AI应用的激增而获得了前所未有的发展机遇。其强大的可扩展性(可达EB级别)和高传输性能(可达TB/s级别),完美契合AI训练数据存储和GPU高速数据传输的需求,使其从传统的HPC领域扩展到更广泛的企业应用环境中,成为AI时代不可或缺的存储解决方案。

🚀 **新一代平行文件系统的核心优势**:相较于老一代产品,新一代平行文件系统在部署管理便利性、可靠性、安全性以及数据服务功能方面实现了质的飞跃。它们能够通过多节点集群架构提供海量存储扩展能力,并通过多条访问路径实现客户端对多个存储节点的并行访问,汇聚出极高的传输带宽,有效解决AI应用在存储容量和传输速度上的双重挑战。

💡 **面向AI应用的功能与架构创新**:近期,平行文件系统领域涌现出多项关键新发展,包括:将存储功能整合到GPU服务器端以提升效率(如Hammerspace、WEKA);推出支持大型语言模型推理的KV快取卸载功能,以优化推论性能(如华为、WEKA、VAST Data);以及对系统架构进行改造,以提供更灵活的部署和应用(如WEKA的NeuralMesh、VAST Data的AI OS)。

📈 **市场生态的拓展与未来展望**:平行文件系统领域吸引了更多厂商的加入,如Pure Storage、普安以及Dell等,为用户提供了更丰富的选择。这一系列发展预示着平行文件系统生态系统的持续扩大,预计将吸引更多厂商跟进,进一步推动该领域的创新和成熟,以更好地服务于快速发展的AI应用需求。

過去幾年來,原本局限於高效能運算(HPC)領域應用的平行檔案系統,在AI熱潮帶動下,不僅應用範圍大為擴展,延伸到一般企業應用環境,也帶來產品迅速進化,發展出一系列針對AI應用的新功能,還吸引更多廠商投入平行檔案系統這個領域。

我們今年5月初的封面故事《新世代分散式儲存平臺興起》,初步介紹這幾年炙手可熱的新世代平行檔案系統平臺。相較於問世已有二十多年的老一代平行檔案系統,過去5、6年出現的新一代平行檔案系統,在部署管理便利性、可靠性/安全性,以及資料服務功能方面,都有根本性的提升。

接下來的短短幾個月內,平行檔案系統這個領域又出現多項關鍵新發展,包括突破既有外部儲存框架,整合於GPU伺服器端的部署架構,支援大型語言模型推理的快取應用,還有因應AI環境的檔案系統基礎架構改造,另外還出現數家新投入平行檔案系統領域的廠商。

邁向興盛的平行檔案系統

AI應用需要搭配擁有強大擴展能力的儲存設備,以便存放規模不斷擴大的訓練資料;AI應用也需要搭配擁有高傳輸效能的儲存設備,以便及時回應AI應用的需求,以盡可能高的傳輸速度,將資料傳送給GPU運算,或是寫入檢查點、保存運算狀態。

而擴展能力與傳輸頻寬,正是平行檔案系統的長處所在。平行檔案系統的底層,可透過多節點的叢集架構,提供數百PB到EB等級的擴展能力;平行檔案系統對於個別用戶端的存取,則能透過多條存取路徑、由多個節點同時執行資料的讀取與寫入,藉此匯聚出高達數百GB/s甚至TB/s等級的龐大傳輸頻寬。

相較之下,其他類型的儲存平臺,只要底層不是基於叢集架構而成,擴展能力都無法與平行檔案系統相比。至於橫向擴展(Scale-Out)類型NAS與物件儲存系統,雖然底層也是基於多節點叢集架構,擁有與平行檔案系統相當的擴展能力,但是,缺乏用戶端對多儲存節點同時平行存取能力,傳輸頻寬無法與平行檔案系統相比。

換言之,平行檔案系統是當前唯一兼具高擴展能力,以及高傳輸效能的儲存平臺,能同時滿足AI應用在儲存空間擴展,以及傳輸頻寬等2方面的需求。

所以,這幾年來AI應用的風行,也間接帶動平行檔案系統的興盛發展,不僅讓長期以來只能困守傳統HPC應用的老牌平行檔案系統,如Lustre、GPFS/Spectrum Scale等,獲得新的發展機會,也讓新一代平行檔案系統供應商,如WEKA、VAST Data等,一躍成為AI時代的儲存市場寵兒。

平行檔案系統的新發展

為了因應AI應用的需求,過去幾個月的平行檔案系統領域,在功能、架構與市場生態等3個方面,都出現重要新發展,多家廠商先後推出搭配AI應用的新功能,與新的部署架構,也有新廠商推出新的平行檔案系統產品。

在功能的擴展方面,Hammerspace、WEKA等廠商先後發表新的GPU伺服器端部署與應用架構,利用GPU伺服器本身的SSD資源,建構出高效能、高可用性的儲存環境。而華為、WEKA、VAST Data,以及焱融科技(YanRong)等廠商,則是基於自身發展的平行檔案系統,推出用於輔助大型語言模型推論作業的KV快取卸載功能,將GPU HBM記憶體的KV快取工作負載,卸載到平行檔案系統儲存空間,顯著改善推論效能。

在系統架構演進方面,WEKA與VAST Data都針對AI應用環境需求,各自改造了自身產品架構,如前者的NeuralMesh微服務網格,可改善平行檔案系統在AI應用環境的部署與應用靈活性,以及後者的AI OS,以平行檔案系統做為核心,進一步構成涵蓋AI環境各方面應用的通用作業平臺。

在產品生態系方面,這幾個月也出現新參與者,如Pure Storage的FlashBlade//EXA,普安EonStor GSx,以及Dell基於PowerScale儲存平臺的Project Lightning平行存取軟體等,讓用戶有更多選擇。

而這一系列發展,可望在今年底到明年初開始發酵,帶動其他平行檔案系統供應商跟進發展類似的功能與架構,進而還有望吸引更多廠商投入這個領域,進一步擴大平行檔案系統生態系。

接下來,我們便逐一檢視這幾項新發展,其中在平行檔案系統的KV快取卸載功能方面,我們在6月的封面故事《大語言模型推理加速新思路:KV快取的擴展》,已有相關介紹,這裡將重點放在其他幾個面向,包括新推出的GPU端部署型態,新的架構,以及新產品。


平行檔案系統的兩大AI應用優勢

圖片來源/SNIA

AI應用對於儲存基礎設施的主要需求,在於:(1)足以應對訓練資料增長的擴展能力(2)能以盡可能快的速度,將資料饋送給GPU運算的高傳輸率。而這兩項要求正好都是平行檔案系統的優勢,從而促成平行檔案系統產品在當前的興盛發展趨勢。

一般而言,平行檔案系統的底層,是由多個儲存節點組成的叢集架構,可提供成千甚至上萬臺儲存節點的擴展能力,並透過stripe方式,將資料分割、分散存放到不同節點上,藉此分散存取負荷,避免形成高負荷的熱點,並改善可用性。

平行檔案系統的用戶端,則能藉由專門的用戶端軟體,提供同時存取多個儲存節點的能力,可從資料所在的多臺儲存節點上,透過多條I/O路徑同時直接存取這些資料。而透過跨多個節點的平行存取,能匯聚多條I/O的傳輸效能,從而得到極高的資料傳輸頻寬。

 更多相關報導 

【AI儲存架構新思路,GPU伺服器內接SSD組成儲存叢集】平行檔案系統與GPU伺服器的結合

【從核心架構到應用服務的革新】平行檔案系統架構最新演進

【角逐炙手可熱的AI應用儲存市場】平行檔案系統領域的新參與者

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

平行文件系统 AI存储 高性能计算 存储技术 数据传输 GPU 大型语言模型 Parallel File System AI Storage HPC Storage Technology Data Transfer LLM
相关文章