榮格工業(yè)資源APP
了解工業(yè)圈,從榮格工業(yè)資源APP開始。
Rambus研究員與杰出發(fā)明家Steven Woo
根據(jù)IDC預(yù)測,中國在人工智能領(lǐng)域的投資預(yù)計到2027年將達到381億美元,占全球總投資的近9%。作為全球人工智能的重要參與者,中國正加速在汽車、通信、醫(yī)療、金融等多個行業(yè)應(yīng)用和發(fā)展生成式AI技術(shù),全面邁入“AI 2.0”時代。
人工智能這一概念是由約翰·麥卡錫(John McCarthy)在1956年提出。此后數(shù)十年間,科學(xué)家們投入了巨大努力,讓AI不斷變得更智能,但其能力仍主要局限于在特定輸入輸出范圍內(nèi)進行分析與預(yù)測(例如:從文本生成網(wǎng)頁結(jié)果)。而新一代人工智能則帶來了重大范式轉(zhuǎn)變——它能夠基于數(shù)據(jù)生成全新的內(nèi)容。
和上一代不同,AI 2.0 依托多模態(tài)輸入與輸出,在文本、語音、代碼、圖像、視頻,甚至三維模型等多種媒介之間實現(xiàn)無縫交互。大型語言模型(LLMs)的出現(xiàn),也是這一時代的重要標志。LLMs能夠處理和生成海量數(shù)據(jù),正在不斷突破以往的技術(shù)邊界,讓更復(fù)雜、更先進的AI應(yīng)用在各行各業(yè)成為可能。
訓(xùn)練大型語言模型(LLMs)是一個復(fù)雜的多步驟過程,首先需要收集用于訓(xùn)練的數(shù)據(jù)。數(shù)據(jù)收集完成后,還需經(jīng)過分析、處理和清理,才能進入訓(xùn)練階段。如何實現(xiàn)海量數(shù)據(jù)的高速傳輸與存儲,已經(jīng)成為整個行業(yè)面臨的重大挑戰(zhàn),更不用說訓(xùn)練所需的數(shù)據(jù)規(guī)模還在持續(xù)增長。以ChatGPT為例,GPT-3的參數(shù)量為1750億,而GPT-4則高達1.76萬億,幾乎所有AI公司都在不斷擴大模型的訓(xùn)練參數(shù)。
在完成訓(xùn)練過程后,AI模型便會生成,并可用于執(zhí)行推理。相比訓(xùn)練,推理對內(nèi)存的要求相對較低。然而,隨著AI逐漸普及,越來越多的應(yīng)用正從數(shù)據(jù)中心向邊緣和終端延伸,這對現(xiàn)有的內(nèi)存系統(tǒng)在帶寬、延遲和容量等方面提出了更高的要求。
為應(yīng)對這些重大挑戰(zhàn)并解決 AI 2.0 的內(nèi)存瓶頸,業(yè)界已提出了許多創(chuàng)新性技術(shù)方案,包括多路復(fù)用內(nèi)存、串行連接內(nèi)存、新型編碼方案以及全新的模塊形態(tài)。這些創(chuàng)新有望應(yīng)用于現(xiàn)有內(nèi)存解決方案,為先進的 AI 工作負載帶來更高的性能表現(xiàn)。
其中一個前景廣闊的解決方案是多路復(fù)用內(nèi)存。正在進入市場的 DDR5 MRDIMMs 采用復(fù)用技術(shù),在沿用現(xiàn)有 DRAM 的同時,有效地將數(shù)據(jù)傳輸速率提升一倍,從而突破了傳統(tǒng) DRAM 在擴展上的限制。另一種提升路徑是串行連接內(nèi)存。在 CXL 技術(shù)的支持下,這一方式能夠?qū)崿F(xiàn)緩存一致性的內(nèi)存共享,并通過采用串行而非并行的數(shù)據(jù)傳輸,大幅提升容量與帶寬。
此外,新型編碼方案也可應(yīng)用于部分內(nèi)存模塊。例如,GDDR7 采用三階脈沖幅度調(diào)制(PAM3)編碼,數(shù)據(jù)傳輸速率最高可達 48Gbps,能夠支持高性能的邊緣與終端 AI 應(yīng)用。模塊形態(tài)的創(chuàng)新同樣在內(nèi)存容量擴展中發(fā)揮關(guān)鍵作用。低功耗壓縮附加內(nèi)存模塊(LPCAMM)便是其中的典型代表,其專為在空間受限的設(shè)備(如筆記本電腦)中擴展 LPDDR 內(nèi)存的性能與應(yīng)用而設(shè)計。
除了性能和容量的提升之外,RAS(可靠性、可用性和可維護性)在內(nèi)存領(lǐng)域也變得愈發(fā)重要。隨著內(nèi)存芯片的數(shù)據(jù)傳輸速率不斷提高,單元尺寸持續(xù)縮小,以便在一顆芯片中容納更多比特。但單元縮小也帶來了新的挑戰(zhàn),例如芯片內(nèi)錯誤(on-die errors),這就需要更強大的糾錯機制。此外,像 RowHammer 和 RowPress 這樣的現(xiàn)象——即訪問特定單元時可能干擾相鄰區(qū)域的單元——也亟需進一步的緩解策略。
還需要關(guān)注一些相關(guān)的發(fā)展。量子計算時代即將到來,現(xiàn)有的非對稱加密將面臨被破解的風(fēng)險,因此無論是 AI 數(shù)據(jù)還是硬件,都需要通過新一代的抗量子加密技術(shù)(Quantum Safe Cryptography)來保護。
同時,訓(xùn)練和推理AI所需的能耗問題也正日益受到關(guān)注。對此,業(yè)內(nèi)各方正積極采取行動來應(yīng)對這一挑戰(zhàn)。從內(nèi)存角度來看,行業(yè)正持續(xù)通過降低工作電壓和優(yōu)化設(shè)計架構(gòu)來提升能效。電源管理IC(PMIC)將成為在既定功耗范圍內(nèi)實現(xiàn)更高性能的關(guān)鍵一環(huán)。
隨著 AI 模型日益復(fù)雜,對內(nèi)存的需求也將更加嚴苛。AI 2.0將重塑各行各業(yè),從個性化體驗到行業(yè)專屬解決方案,在整個計算領(lǐng)域(云端、邊緣、終端)全面掀起浪潮,進而推動對更高性能內(nèi)存解決方案的強勁需求。
作為業(yè)內(nèi)領(lǐng)先的芯片與半導(dǎo)體IP供應(yīng)商,Rambus 致力于推動數(shù)據(jù)中心互聯(lián),解決內(nèi)存與處理器之間的瓶頸問題,從而支持大型語言模型(LLMs)及先進AI應(yīng)用的發(fā)展。Rambus 的全方位產(chǎn)品組合——包括 DDR5 DIMM 芯片組、HBM3/3E 控制器 IP、GDDR7、PCIe 6.1、CXL 3.1,以及 LPDDR5T/5X/5 等——為這些高負載的 AI 工作提供所需的速度、容量與連接能力。
在 AI 2.0 的演進過程中,Rambus 在內(nèi)存接口芯片、內(nèi)存接口 IP 以及安全 IP 解決方案方面的專長,將成為不斷突破技術(shù)邊界的重要推動力。展望未來,Rambus 將持續(xù)攜手產(chǎn)業(yè)伙伴,共同開發(fā)前沿的內(nèi)存解決方案,釋放 AI 技術(shù)的全部潛能。