人工智能(AI)興起,除了對於Nvidia等晶片需求急增,記憶體的需求急促上升,加上LLM的上下文窗口(Context Window)及KV緩存,代理式人工智能(Agentic AI)對記憶體需求大幅上升,,現時南韓的兩大廠商Samsung和海力士佔去全球 DRAM 記憶體產量的七成,由南方東英發行的「XL二南方海力士」(港股代號:07709)資產管理規模(AUM)已躍升至超過541億港元。不過 DRAM 是否 AI 的終極記憶體硬件?

Sandisk執行副總裁兼首席技術總監(Chief Technology Officer, CTO)Alper Ilkbahar提出, AI 將會對新一代記憶體產生需求,利用快閃記憶取代傳統 DRAM 記憶體,大幅降低 AI 的推理(包含 LLM 上下文場景)成本,針對 AI 存儲硬件特性、解決 AI 與記憶體存取模式矛盾展開,傳統記憶的密度 / 容量瓶頸 → 直接制約 LLM 上下文窗口。LLM 運行時,上下文(對話歷史、輸入 Prompt、中間激活值、KV 緩存) 是佔用存儲容量的核心數據,而當上下文窗口擴大、並發推理數量增加時,需要海量空間存放 KV Cache(LLM 上下文緩存)。

簡單來說,AI 推理的存取模式本就不適合 DRAM/HBM,LLM 推理:讀多寫少、順序 / 可預測存取、超大權重 / KV Cache、又對延遲容忍度高,故此 DRAM 低延遲、隨機存取強基本上不適合 LLM,但DRAM 容量擴展停滯, AI 容量需求持續上漲,正是長上下文 LLM 部署的一大痛點:單顆 / 單堆 DRAM/HBM 無法承載超大規模 KV 緩存,只有壓縮上下文長度、犧牲 Agentic AI 的並發能力,直接影響上下文管理的上限,本質是 LLM 上下文推理的訪問特徵與 DRAM 設計不配合,所以必須新一代記憶體。

預計到2030年,全球近七成數據中心承載AI工作負載¹。傳統儲存DRAM和高頻寬記憶體(High Bandwidth Memory, HBM)的面臨容量、成本與能耗的多重挑戰,[Western Digital (Sandisk) (NASDAQ: WDC, Exchange: NASDAQ)](全球領先的數據儲存解決方案供應商,近年來積極拓展亞太市場,包括香港地區)推出針對 AI 的創新技術——高頻寬快閃記憶體(High Bandwidth Flash, HBF™)。

高頻寬快閃記憶體技術示意圖
Sandisk 執行副總裁兼首席技術總監Alper Ilkbahar提出高頻寬快閃記憶體(HBF)專為AI推理設計,提供更高容量與效能。

AI推理需求驅動技術革新

DRAM 原生優勢:低時延、隨機存取,面向傳統通用計算場景,LLM 推理、KV Cache 讀寫具備高度確定性、順序性、可預測性,屬於規律性批量訪問,而非零散隨機讀寫。

隨著AI從超大規模資料中心逐步遷移至企業級數據中心及網絡邊緣,市場對高效能且低成本儲存解決方案需求日益增加。根據Grand View Research報告²,邊緣AI應用市場規模預計將於2030年底達近665億美元。然而,傳統DRAM與HBM技術在密度、擴展性及能耗方面的局限,無法滿足AI推理和 Agentic AI 日益增長的需求。

Alper Ilkbahar指出,現有的儲存架構正陷入瓶頸。例如,DRAM容量擴展已停滯³,而AI推理所需的記憶體規模卻持續攀升。此外,HBM雖然擁有高性能,但其高昂的成本與複雜的設計限制了其在邊緣設備中的應用。

HBF技術的核心優勢

高頻寬快閃記憶體(HBF)是一款專為AI推理優化的新型記憶體架構,HBF = High Bandwidth Flash,基於 3D NAND + CBA(CMOS 直接鍵合陣列)堆疊。相比傳統技術,HBF具備以下特點:

  • 更大容量與密度:由於採用CMOS鍵合陣列(CBA),提升GB/mm²的記憶體密度。
  • 高頻寬與低延遲:透過並行架構與先進邏輯縮放工藝,實現接近DRAM的速度。
  • 持久性與熱穩定性:即使在斷電情況下也能保留資料,適合高溫運行環境⁶。

這些特性使HBF不僅適用於數據中心,亦可在智能手機等邊緣設備發揮作用,支援即時決策與複雜任務處理。為實現這些優勢,HBF透過優化高頻寬特性與推理記憶體屬性,高效重構NAND快閃記憶體,並採用CMOS鍵合陣列(CBA)晶圓技術,進一步提升能效與頻寬。

HBF 有機重塑面向 AI 的NAND快閃記憶體,相較於傳統NAND快閃記憶體,HBF 也可透過並行架構、先進邏輯縮放工藝與客製化堆疊技術,實現更低時延與超高讀取頻寬,讓大語言模型以接近DRAM的速度串流讀取數據。HBF亦支援大型KV緩存,高效處理冗長複雜的用值指令,以及客值專屬與領域專屬數據,提升 AI 推理準確率。

從數據中心到邊緣運算的全面應用

HBF技術如果可以成為定位是「推理專用近 GPU 記憶體」,標誌著AI儲存解決方案處於改變。對於數據中心而言,搭載HBF加速方案能夠降低大型GPU叢集成本,HBF減少昂貴DRAM的需求,簡化了系統架構。邊緣運算場景中,HBF憑藉其高容量與低功耗特性,為智能設備提供了更廣泛的應用空間。

隨著AI技術不斷推進,數據中心與邊緣設備正逐步取代傳統運算模式,成為支撐「從日常智能助理查詢到複雜的機器學習模型訓練」各類智能任務的核心。HBF作為一款可擴展的系統級儲存技術,將有效減少效能瓶頸,加速AI應用的洞察生成速度。

高頻寬快閃記憶體技術示意圖
HBF技術如果可以成為定位是「推理專用近 GPU 記憶體」,標誌著AI儲存解決方案處於改變。

SanDisk 提出「HBF 在 AI 推理場景取代 HBM(高頻寬 DRAM)」,有扎實技術、模擬數據與產業聯盟支持,核心是解決 HBM 容量不足、成本過高與推理存取模式錯配的痛點,HBF可解決現有儲存技術的短板,有機會令 DRAM 需求下滑。隨著這項技術的普及,數據中心與邊緣運算的效能提升,成本卻可大降,同成本下HBM 比 HBF 成本高 8 到 16 倍 ,HBF 讀取頻寬可接近 HBM(≈1.6 TB/s),進一步推動AI技術的廣泛應用與創新發展。與Intel OptaneSamsung Z-NAND等競爭技術相比,HBF憑藉其更高的性價比和廣泛的適用性,在市場上佔據獨特地位。

HBF 是否明日之星?首是是業內標凖,因為HBF 必須全新介面,並不支援類似 DDR/HBM/PCIe 的傳輸介面。第二是必須業內 AI 支持,包括GPU(NVIDIA/AMD/Intel)、AI 框架(PyTorch/TensorFlow)、驅動程式、OS 和記憶體排程,NVIDIA 主導當前 AI 記憶體生態,迄今未表態支持 HBF,現時最大推手是SanDisk 和 SK 海力士,另一大廠 Samsung 仍在觀望,短期內消費級 AI 電腦仍要靠 DRAM , 不過另一個 AI 後起之秀 RISC-V,可能是原生支援HBF 的希望,RISC-V 之父 David Patterson 加入了 HBF 技術顧問委員會,中國又有 RISC-V 大國,邊緣 AI 推理發展可能柳暗花明。

https://www.sandisk.com/company/about-us

https://www.linkedin.com/pulse/memory-centric-ai-sandisks-high-bandwidth-flash-alper-ilkbahar-b4aqc/