榮格工業(yè)資源APP
了解工業(yè)圈,從榮格工業(yè)資源APP開始。
歡迎來到榮格工業(yè)資源網(wǎng)!
近日,北京大學(xué)人工智能研究院孫仲研究員團(tuán)隊(duì)聯(lián)合集成電路學(xué)院研究團(tuán)隊(duì),成功研制出基于阻變存儲(chǔ)器的高精度、可擴(kuò)展模擬矩陣計(jì)算芯片,首次實(shí)現(xiàn)了在精度上可與數(shù)字計(jì)算媲美的模擬計(jì)算系統(tǒng)。
該芯片在求解大規(guī)模MIMO信號(hào)檢測(cè)等關(guān)鍵科學(xué)問題時(shí),計(jì)算吞吐量與能效較當(dāng)前頂級(jí)數(shù)字處理器(GPU)提升百倍至千倍。相關(guān)論文于10月13日刊發(fā)于《自然·電子學(xué)》期刊。

對(duì)于大多數(shù)習(xí)慣了數(shù)字計(jì)算機(jī)(0和1)的公眾而言,“模擬計(jì)算”是一個(gè)既古老又新奇的概念,什么是模擬計(jì)算呢?
孫仲首先用生動(dòng)的比喻對(duì)其進(jìn)行解釋:“現(xiàn)在的所有芯片都是數(shù)字計(jì)算,數(shù)據(jù)都需要先轉(zhuǎn)換成0和1的符號(hào)串。比如數(shù)字‘十’,需要轉(zhuǎn)譯成‘1’和‘0’,計(jì)為‘1010’。”如果用二進(jìn)制來表示“1+1=2”,則應(yīng)該記作“1+1=10”。
孫仲說,“而模擬計(jì)算則無需這層‘轉(zhuǎn)譯’,它是一種‘類比計(jì)算’(analogue computing),可以直接用連續(xù)的物理量(如電壓、電流)來類比數(shù)學(xué)上的數(shù)字。比如,數(shù)學(xué)上的‘十’,可以直接用十伏或十毫伏的電壓來表示。”
模擬計(jì)算機(jī)在計(jì)算機(jī)發(fā)展早期(上世紀(jì)30-60年代)曾被廣泛應(yīng)用,但隨著計(jì)算任務(wù)日益復(fù)雜,其精度瓶頸凸顯,逐漸被數(shù)字計(jì)算取代。孫仲指出,此次研究的核心正是要解決模擬計(jì)算“算不準(zhǔn)”這一痛點(diǎn)。

課題組合影
當(dāng)前的市面上的主流CPU和GPU都是數(shù)字芯片,并都采用馮諾依曼結(jié)構(gòu),將計(jì)算和存儲(chǔ)功能分開,通過01數(shù)字流的編譯+計(jì)算+解碼實(shí)現(xiàn)信息計(jì)算和傳輸。
基于阻變存儲(chǔ)器的模擬計(jì)算的優(yōu)勢(shì)之一在于取消了“將數(shù)據(jù)轉(zhuǎn)化為二進(jìn)制數(shù)字流”這一過程,同時(shí)不必進(jìn)行“過程性數(shù)據(jù)存儲(chǔ)”,進(jìn)而將數(shù)據(jù)計(jì)算過程與數(shù)據(jù)存儲(chǔ)合而為一,實(shí)現(xiàn)算力解放。
孫仲指出,與其他“存算一體”方案對(duì)比,國內(nèi)外許多團(tuán)隊(duì)集中于研究矩陣乘法(AI推理的核心),而他的團(tuán)隊(duì)特色在于專注于更具挑戰(zhàn)性的矩陣方程求解(AI二階訓(xùn)練的核心)。矩陣求逆操作要求的計(jì)算精度極高,時(shí)間復(fù)雜度達(dá)到了立方級(jí)。而模擬計(jì)算憑借物理規(guī)律直接運(yùn)算的方式,具有低功耗、低延遲、高能效、高并行的天然優(yōu)勢(shì),只要能夠不斷降低計(jì)算誤差,不斷提升計(jì)算精度,將為傳統(tǒng)GPU的算力解放帶來爆炸性突破。

高精度全模擬矩陣計(jì)算求解矩陣方程
在計(jì)算精度方面,團(tuán)隊(duì)在實(shí)驗(yàn)上成功實(shí)現(xiàn)16×16矩陣的24比特定點(diǎn)數(shù)精度求逆,矩陣方程求解經(jīng)過10次迭代后,相對(duì)誤差可低至10??量級(jí)。在計(jì)算性能方面,在求解32×32矩陣求逆問題時(shí),其算力已超越高端GPU的單核性能;當(dāng)問題規(guī)模擴(kuò)大至128×128時(shí),計(jì)算吞吐量更達(dá)到頂級(jí)數(shù)字處理器的1000倍以上,傳統(tǒng)GPU干一天的活,這款芯片一分鐘就能搞定。

孫仲
關(guān)于應(yīng)用前景,孫仲認(rèn)為,模擬計(jì)算在未來AI領(lǐng)域的定位是強(qiáng)大的補(bǔ)充,最有可能快速落地的場(chǎng)景是計(jì)算智能領(lǐng)域,如機(jī)器人和人工智能模型的訓(xùn)練。
談及與現(xiàn)有計(jì)算架構(gòu)的關(guān)系,孫仲強(qiáng)調(diào)未來將是互補(bǔ)共存:“CPU作為通用‘總指揮’因其成熟與經(jīng)濟(jì)性而難以被淘汰。GPU則專注于加速矩陣乘法計(jì)算。我們的模擬計(jì)算芯片,旨在更高效地處理AI等領(lǐng)域最耗能的矩陣逆運(yùn)算,是對(duì)現(xiàn)有算力體系的有力補(bǔ)充。”

