WD、Micron
具備容量密度高、成本低,但效能與耐用性有限的特性,QLC SSD幾年前曾被認為難堪重任,只能憑藉低成本在特定領域使用,現在卻正在包括AI在內的各式各樣應用,大舉擴張版圖。
當我們從2016年開始追蹤QLC快閃記憶體的發展時,一開始也是認為QLC SSD並不適合多數儲存應用情境使用,而僅適合用於長期保存大量資料的冷儲存應用。
但隨著QLC快閃記憶體製程與控制器技術的進步,QLC SSD無論在效能、壽命或可靠性等方面,過去幾年已有顯著的改善,與早期的產品不可同日而語,進而也大幅擴展應用範圍,逐步滲透到企業儲存應用的各個層面。我們在2023年7月的封面故事《QLC大舉進入企業儲存應用》,便曾介紹QLC快閃記憶體在企業儲存開始獲得廣泛應用的趨勢。
時隔1年半之後的現在,QLC快閃記憶體的應用又有進一步的發展。
首先,最新一代QLC SSD產品的各方面規格,幾乎已經與TLC SSD產品不分軒輊,不僅適合多數通用儲存服務情境,還挾著成本優勢,在入門級儲存應用領域開始有了取代TLC快閃記憶體的趨勢。
其次,憑藉QLC的高儲存密度優勢,再結合3D堆疊技術,促使SSD容量規格在日前一舉突破100TB大關,遠遠拋開了硬碟與磁帶,穩居當前最大容量儲存媒體地位。
第3,QLC快閃記憶體的高儲存密度、低單位容量成本,以及擅長循序讀取等特性,也能在近年來最熱門的生成式AI應用中,發揮關鍵的作用,進而讓QLC SSD成為AI訓練基礎設施建置的重要環節。
最後,QLC SSD在企業級儲存設備中的滲透也進一步加深。最初只有少數廠商嘗試推出基於QLC SSD的儲存陣列產品,後來跟進的廠商逐漸增加,到了2024年底,所有一線大廠終於在支援QLC SSD的行列全部到齊,包括一些原本不看好QLC SSD的儲存廠商,也在這段期間改變了態度,將QLC SSD引進產品線。
而這一系列新發展,也促使我們再次回到QLC快閃記憶體應用這個議題,檢視QLC SSD應用的的最新情況。
後發居上的新世代QLC SSD產品
QLC快閃記憶體的每個儲存單元(Cell)可記錄4個位元的資料,儲存單元的容量密度較TLC高出1/3,但是,連帶也需要區分與控制16種閾值電壓狀態,為QLC帶來更複雜、困難的存取程序,最終導致抹寫耐用性更差,更困難的讀取作業與資料保存,以及更不可靠的寫入程序等問題。
然而,如同我們在先前封面故事提過的,QLC快閃記憶體晶片先天的效能、壽命與可靠性問題,可以透過SSD裝置層級,以及儲存陣列系統層級的種種措施,獲得緩解與改善。
例如SSD裝置層級的超額配置(over-provisioning)、SLC快取,改進的損耗均衡與錯誤修正演算法,以及平行存取處理,還有儲存陣列層級的快取與緩衝,以及跨SSD裝置的損耗均衡等。
所以,在快閃記憶體與SSD產品技術發展歷程中,呈現相當特別的「背反」趨勢,從快閃記憶體層次來看,隨著快閃記憶體儲存單元的多級化發展,新一代記憶體的效能與耐用性,可說每況愈下,MLC不如SLC,TLC不如MLC,QLC又不如TLC。但從SSD產品與快閃儲存陣列產品層次來說,效能與耐用性仍持續提升。
憑藉技術進步的「後發優勢」,在最新一代的QLC SSD產品中,效能與壽命規格,已能與1、2年前的上代TLC SSD比擬,除了特別寫入負載特別高、或追求極致隨機存取效能的應用情境,TLC SSD仍佔有優勢之外,對於大多數的應用環境,QLC SSD已足以承擔工作需求,而這也改變了QLC SSD產品的定位。
世代交替的起步
在QLC SSD問世早期,由於效能與耐用性的限制,因而被定位為訴求大容量、低單位成本的產品線,被視為硬碟的替代者,所針對的應用情境,也與一般TLC SSD之間,彼此涇渭分明。
而到了現在,隨著QLC SSD的進步,QLC SSD不僅已經侵入TLC SSD的應用領域,我們這幾個月來還注意到,WD、美光(Micron)等廠商,甚至在部分個人端消費級SSD產品線,都開始以新推出的QLC SSD,接替既有的TLC SSD產品。
舉例來說,WD在今年3月新推出的M.2規格QLC SSD產品SN5000S(基於BiCS6 162層3D製程),便是用於取代2022年5月發表的TLC SSD產品SN740(基於BiCS5 112層3D製程)。
在效能方面,基於QLC的SN5000S,隨機讀取與寫入IOPS效能,分別比基於TLC的SN740提高1.4%與12.5%,循序讀取與寫入速率則分別快了16.5%與15.5%。
而在耐用性方面,以總寫入資料量(TBW)為基準,SN5000S的512 GB與1 TB容量版本,TBW比SN740同容量版本的TBW低了50%與25%,但2TB版本的TBW則反超出20%,整體來說,兩者的耐用性屬於同一級距。
類似的例子,還有美光今年4月推出的新款M.2 QLC SSD產品2500系列(232層3D製程),將用於取代2021年底到2022年底推出的上一代M.2 SSD產品,包括基於QLC的2550(176層3D製程)與2400(232層3D製程),還有基於TLC的2450(176層3D製程)。
比起上一代的M.2 QLC SSD產品2550與2400,2500的最大隨機讀取與寫入效能比前者高出80%與66%,比後者高出53%與42%,至於循序讀取與寫入速度則比前者提高42%與50%,較後者提高57%與50%。
而比起基於TLC的2450,2500的讀取與寫入效能也分別高出24%與31%,整體效能已接近美光M.2 SSD產品線最高階的3400與3450(分別基於176層3D TLC與232層3D TLC)。而在耐用性方面,2500則略遜於2450,同容量規格下的TBW為後者的2/3到一半。
雖然這個QLC SSD接替TLC SSD的現象,目前只發生在部份廠商的M.2 SSD產品,卻是重要信號,意味中低階SSD領域,QLC取代TLC的腳步已開始。
儘管許多用戶仍對QLC存在負面印象,但對供應商來說,當QLC SSD進步到能提供與TLC同級的效能與耐用性,考慮到QLC能以更低的成本達到相同的容量,也代表著更大的利潤空間,自然會更傾向於推出基於QLC的SSD產品。從這樣的情況來看,或許在幾年內,除了最高階的SSD產品外,QLC恐怕將會席捲中、低階SSD產品領域。
QLC推動SSD容量邁向極限
今年是SSD容量發展歷程中的又一新里程碑,繼2015年達到15.36 TB,2018年提高到30.72 TB,2023年達到61.44 TB後,緊接著便在今年一舉突破100 TB大關,WD、三星、Solidigm,群聯(Phison)等廠商,先後在下半年發表容量122.88 TB的新一代商用SSD產品。
也就是說,SSD的容量規格在10年內提升了足足8倍,而且增長的速度越來越快,從15.36 TB提高到30.72 TB花了3年多,從30.72 TB到61.44 TB花了5年多,但接下來不到2年,就達到122.88 TB。
近年來快閃記憶體迅速的容量增長,是QLC快閃記憶體與3D堆疊技術共同合力的結果,我們可以注意到,在61.44 TB以上超高容量層次產品的場合,QLC扮演了更為關鍵的角色——隨著SSD容量等級的提高,採用QLC的產品比重也越來越高。
在61.44 TB SSD產品領域,還是TLC與QLC參半局面,目前已有的4款61.44 TB SSD產品——Solidigm的D5-P5336、三星的BM1743、WD的SN655,以及美光的6550 ION,正好各占一半,兩款採用TLC(WD與美光),兩款採用QLC(Solidigm與三星)。
不過往上到了122.88TB產品領域,便是清一色採用QLC的局面。目前已發表的5款122.88TB SSD產品——三星BM1743的122 TB版,Solidigm D5-P5336的122 TB版、WD的High-Capacity QLC Enterprise SSD,群聯的Pascari D200V與D205V,全部都是基於QLC快閃記憶體。
若把檢視範圍擴大到非標準規格的大容量型SSD產品,同樣還是QLC的天下。例如,IBM用於搭配FlashSystem儲存陣列的FCM模組(FlashCore Modules),自2020年的第2代FCM模組起,到2024年最新的第4代FCM模組,都一直採用QLC,最大容量達到38.4TB。另外,Pure Storage用於搭配FlashArray儲存陣列的DFM模組(DirectFlash Module),去年推出的48TB、75TB版本模組,還有即將推出的150TB容量模組,也都採用QLC。
唯一例外是Nimbus Data,該公司在2018年發表、2020年正式上市的ExaDrive DC SSD,是世界上最早的100TB等級SSD,但採用的是TLC快閃記憶體。然而Nimbus Data其實是以空間來換取高容量,這系列產品採用標準2.5吋規格的款式,最大容量只達到16 TB與32 TB,並沒有超過其他廠商的同級產品;至於容量較大的64 TB與100 TB款式,都是採用外形較大的3.5吋規格,容量密度其實沒有進步,與新一代的100TB等級SSD產品,有著本質上的區別。
由這樣的發展情勢看來,100 TB等級以上的高容量SSD產品,目前已經是以QLC為主的情況,日後QLC也將成為持續推升SSD容量的關鍵角色。
QLC SSD的AI應用
QLC SSD的效能特性是循序與隨機讀取效能佳,循序寫入效能稍低,傳輸率大約是循序讀取的30%到40%,至於隨機寫入效能則頗為低落,IOPS效能只有隨機讀取的幾十分之一,所以QLC SSD經常被定位為讀取負載取向型應用,而較不適合寫入I/O負載應用。
相較下,TLC SSD一般也是讀取效能較寫入效能更佳,但兩者落差較小,循序讀取與循序寫入傳輸率之間,可達到十分接近的程度,而隨機寫入與隨機讀取之間的落差,則為4、5倍。與同等儲存容量與傳輸介面的QLC SSD相比,TLC SSD的循序讀取與隨機讀取效能並沒有甚麼優勢,循序寫入效能略佳,因此,TLC SSD真正的優勢是在隨機寫入方面。
不過,QLC SSD這樣的效能特性,卻恰好對應了AI應用的儲存存取特性,因而將能在AI應用中大展所長。
儲存裝置在AI應用中的主要任務,是負責向運算單元饋入訓練資料集、寫入、保存運算內容,最後輸出推論結果。典型的生成式AI運作過程,一開始是將訓練資料集從儲存裝置,分批讀取、載入GPU伺服器的記憶體,由GPU進行訓練運算工作,期間還會向儲存裝置執行寫入檢查點(checkpointing)等工作,訓練完成後,在推論應用過程,也會從模型中讀取資料,產生與輸出推論結果。
前述AI應用涉及的I/O存取負載,基本上是以循序讀取、隨機讀取,以及循序寫入為主,很少涉及隨機寫入。例如AI訓練(Training)與推論(Inference)是循序讀取為主,資料攝入(Data ingest)、預處理(Pre-processing),寫入檢查點等作業,是以循序寫入為主,圖像化神經網路(Graph neural networks)則屬於隨機讀取。
這也意味著,QLC SSD在生成式AI應用中,將能迴避隨機寫入這個最大弱點,在滿足絕大多數存取需求的同時,還能憑藉單位容量成本低、容量密度高的優勢,提供更低的建置成本,以及更少的空間與功耗需求,可說是理想的AI應用儲存媒體。
事實上,不久前有一篇極受矚目的AI應用儲存環境建置新聞,便是圍繞QLC SSD展開。10月底韓國經濟日報(Korea Economic Daily)傳出消息,表示特斯拉公司(Tesla)與韓國快閃記憶體供應商SK-hynix,正在洽談潛在總值高達1兆韓圓(約合7.25億美元)的高容量SSD採購合約,準備用於其AI訓練環境的資料儲存需求。
掌握相關消息的人士指出,雙方洽談的採購標的,正是SK-hynix旗下Solidigm公司的QLC SSD產品,也就是我們前面提到的61.44 TB容量D5-P5336。以前述合約金額計算,這份合約可能涵蓋多達9.9萬臺或20萬臺SSD(標準售價或50%折扣),總容量將高達12.3 EB。
儘管特斯拉與SK-hynix都未證實前述合約洽談,但從這則新聞當中仍能看出:大容量QLC SSD在當前AI基礎設施建置與應用中,已佔有重要地位,未來還可望持續提高。
QLC在企業儲存產品的持續滲透
最早將QLC快閃記憶體應用於企業級儲存陣列的廠商,是VAST Data與Pure Storage,分別在2019年初與2019年中推出基於QLC的儲存陣列產品。
稍後到了2020年,又有Nexsan、StorOne,以及IBM、NetApp等兩大廠,陸續加入QLC應用行列,推出採用QLC的儲存陣列產品。
QLC在企業級儲存陣列的應用風潮,在2021年停滯一年後,在2022年有新的進展,儲存業界龍頭Dell正式為旗下產品線引進QLC SSD,Weka與Scality等2家分散式儲存平臺軟體商,也開始支援QLC SSD。
隨後在2023年,長年耕耘高效能運算(HPC)領域的儲存供應商DDN,也推出基於QLC SSD的儲存陣列產品。
我們上次在2023年7月封面故事探討QLC快閃記憶體應用時,主要的QLC儲存陣列供應商大致就是以上這些。
在這個時間點之後, QLC在企業級儲存陣列產品的應用,又有重要的進展,又有4家一線大廠先後推出支援QLC SSD的產品。
首先是華為,2023年下半年將QLC SSD引進儲存陣列產品線;進入2024年後,HPE,以及日系的2大廠Hitachi Vantara、富士通(Fujitsu),也陸續發表支援QLC SSD的儲存陣列產品,其中,HPE與Hitachi Vantara都是在最近一個月內發表QLC相關產品應用。至此,所有一線儲存陣列大廠在QLC SSD的應用行列終於全部到齊,也是QLC應用邁向全面普及的一個重要信號。
QLC普遍應用的時代終將到來
QLC與TLC快閃記憶體技術其實問世時間差不多,都是在2009年前後開始獲得實際應用,不過在完整的SSD產品方面,TLC SSD則比QLC SSD早了3、4年進入市場。
第1批TLC SSD是在2014到2015年間上市,儘管TLC面臨效能、可靠性與壽命方面不如MLC快閃記憶體的質疑,但憑藉成本與容量密度的優勢,仍然很快取代MLC SSD的地位,到了2018、2019年間,基本上就完成TLC SSD取代MLC SSD的世代交替。
現在歷史又將重演,第一批QLC SSD於2018年上市後,同樣也是飽受效能、可靠性與壽命等方面的抨擊,但經過6年後,也終於走到普及應用的階段。
事實上,每一世代多級化快閃記憶體問世之初,都同樣受到效能、耐用性不如上一代的批評,從MLC開始、到TLC,以至QLC莫不如此,以致於早期有些廠商還發明了eMLC、eTLC一詞,表明他們使用的MLC、TLC記憶體是足夠可靠的「企業級」顆粒,因而可以用來取代上一代的SLC與MLC。但隨著技術的進步,MLC與TLC曾為人詬病的問題逐一克服,現在已沒人再提eMLC、eTLC這種多餘的講法。
我們相信QLC未來也將如此,當前固然仍有許多用戶不能接受QLC(特別是效能取向的消費端高階用戶),但QLC的進步有目共睹,而其成本、功耗與密度方面的優勢也顯而易見,更重要的是對廠商更有利可圖。事實上,從IBM FlashSystem這種二十多年歷史的老牌全快閃儲存陣列,都全面支援QLC,就能看出市場走向。
就我們來看,除了極端傾向隨機寫入I/O,或是寫入負載非常大的應用情境外,其餘大多數的應用情境,已經沒有「非TLC SSD不可」的必要,最新一代的QLC SSD已能滿足需求。
取代TLC SSD的新世代QLC SSD
在中低階M.2規格SSD產品領域,已開始出現QLC SSD取代TLC SSD的情況,左圖為WD與美光今年上半發表的新款M.2 SSD產品:WD的SN5000與美光的2500系列,都是採用QLC快閃記憶體,將分別取代基於TLC的上一代M.2 SSD產品。
憑藉記憶體製程與控制器技術的持續進步,這些最新一代推出的QLC SSD產品,無論效能、可靠性,或是耐用性等方面,比起同等級的上一代TLC SSD產品都不遜色,而且還有所超越。圖片來源/WD、Micron
回顧10年以來的SSD儲存容量成長趨勢
憑藉半導體技術的進步,SSD的容量在過去10年內提高了8倍,而且增長速度在近2年來有了明顯加速。在30.72 TB這個容量規格停滯5年後,於2023年下半年一舉提高到61.44 TB,隨後緊接著在2024年底又翻倍達到122.88 TB(各廠商的122.88 TB SSD產品,實際出貨時間是2025年初)。
而SSD容量規格之所以能有如此迅速的增長,則是QLC快閃記憶體與3D堆疊技術共同促進的結果,特別是QLC的應用,目前60 TB以上的超大容量SSD產品,是由QLC主導的領域。(資料來源:iThome整理,2024年11月)
60 TB以上超大容量SSD產品的記憶體型式
在30TB容量以下的SSD產品領域,目前仍是基於TLC快閃記憶體居多,QLC主要用在訴求成本效益的特定產品線。到了60TB等級以上的超大容量SSD領域,則由QLC快閃記憶體主導,特別是最新發表的122TB等級容量SSD產品,清一色都是採用QLC。(資料來源:iThome整理,2024年11月)
QLC SSD新戰場:AI訓練的儲存應用
AI應用涉及的儲存存取需求,是特別適合QLC SSD發揮的場合。AI訓練、推論、預處理等作業執行中的I/O存取負載,多屬於連續的循序讀取與寫入,很少有隨機寫入負載。而這樣的應用型態,恰好對應QLC SSD擅長循序存取的特點,而避開了QLC SSD不擅長隨機寫入的弱點,並能讓QLC SSD發揮單位成本低、容量密度高、單位功耗需求低的優勢。
上圖為MLPerf Storage Benchmark模擬的AI訓練存取架構,可以看出資料的載入與預處理,都是以連續的批次方式進行,I/O負載以循序方式為主。(圖片來源/MLCommons)
SSD記憶體技術的世代交替
SLC SSD大約在2001年左右上市,但2010年以前就為MLC SSD取代。第一批MLC SSD是在2007年前後問世,2010年代成為主流,在2018、2019年左右開始為TLC SSD取代。最早的TLC SSD產品是在2015年前後推出,短短3、4年就成為主流的快閃記憶體型式,並一直延續至今。QLC SSD是在2018年推出市場,2021、2022年間逐步擴大應用面向,2023、2024年開始進入各種不同層面的企業儲存應用領域。(資料來源:iThome整理,2024年11月)
熱門新聞
2024-12-03
2024-11-29
2024-12-02
2024-12-02
2024-12-03