5月29日,中國移動聯(lián)合清華大學(xué)完成業(yè)界首次憶阻器存算一體芯片的端到端技術(shù)驗(yàn)證,成功打通芯片、軟件、算法、應(yīng)用全流程,標(biāo)志著基于新型存儲器的存算一體技術(shù)向產(chǎn)業(yè)化邁出了關(guān)鍵一步,為拓展存算一體芯片在端邊側(cè)應(yīng)用、構(gòu)建存算一體產(chǎn)業(yè)生態(tài)奠定了重要基礎(chǔ)。
存算一體作為先進(jìn)計(jì)算技術(shù),從架構(gòu)上突破馮·諾依曼架構(gòu)存儲和計(jì)算分離導(dǎo)致的存儲墻和功耗墻問題,可大幅提升算力和能效水平,在AI時代的重要性日益凸顯。
中國移動自2021年起開展存算一體技術(shù)研究,并與高校和產(chǎn)業(yè)伙伴聯(lián)合推動存算一體多技術(shù)路線探索和研發(fā)。2022年提出“如何實(shí)現(xiàn)存算一體芯片工程化和產(chǎn)業(yè)化”提案,并獲評為中國科協(xié)“10個對產(chǎn)業(yè)發(fā)展具有引領(lǐng)作用的產(chǎn)業(yè)技術(shù)問題”之一;同年,聯(lián)合清華大學(xué)研發(fā)業(yè)界首款基于憶阻器的110nm制程存算一體SoC芯片,單芯片憶阻器集成規(guī)模突破300萬,算力能效較相同工藝下的主流GPU提升2個數(shù)量級,達(dá)業(yè)內(nèi)領(lǐng)先水平。但從產(chǎn)業(yè)維度來看存算一體目前仍處于初級發(fā)展階段,主要廠商多聚焦在芯片研發(fā)層面,而在產(chǎn)業(yè)鏈其他環(huán)節(jié)難以集中力量開展布局,導(dǎo)致缺乏成熟的軟件工具鏈和模型適配算法,缺少典型性的應(yīng)用引領(lǐng)及相關(guān)的測試驗(yàn)證標(biāo)準(zhǔn)平臺,產(chǎn)業(yè)生態(tài)構(gòu)建存在諸多困難。
面對存算一體產(chǎn)業(yè)發(fā)展的挑戰(zhàn),中國移動聯(lián)合清華大學(xué)等高校和智存科技等頭部企業(yè),圍繞軟件、算法、應(yīng)用環(huán)節(jié)的短板精準(zhǔn)發(fā)力:在軟件方面,研發(fā)了適配存算一體芯片的半自動化軟件計(jì)算引擎,支持面向存算一體計(jì)算架構(gòu)的AI模型編譯、算子編排、模型部署和推理以及芯片性能模擬等功能,有效降低用戶開發(fā)和部署門檻,開發(fā)調(diào)試效率提升3倍以上。在算法方面,針對存算一體器件規(guī)模受限和模擬計(jì)算誤差的問題,提出面向存算一體的模型壓縮、誤差補(bǔ)償和加噪訓(xùn)練等適配算法,在保證計(jì)算準(zhǔn)確性的同時將模型規(guī)?s減至1/16,實(shí)現(xiàn)AI模型在存算一體芯片的高效、準(zhǔn)確和魯棒運(yùn)行。在應(yīng)用驗(yàn)證方面,實(shí)現(xiàn)存算一體芯片與自研的5G工業(yè)網(wǎng)關(guān)的硬件系統(tǒng)集成,并通過自研的軟件計(jì)算引擎輔助實(shí)現(xiàn)了多種人工智能模型的自動部署和推理,在衛(wèi)星圖像分類、PCB板質(zhì)檢等場景完成應(yīng)用驗(yàn)證:其中衛(wèi)星圖像識別準(zhǔn)確率達(dá)96%以上,PCB板質(zhì)檢實(shí)現(xiàn)5種常見元件的精準(zhǔn)識別和定位,并支持3種以上微小瑕疵的自動檢測。
本次端對端技術(shù)驗(yàn)證是存算一體由技術(shù)研究邁向產(chǎn)業(yè)應(yīng)用的關(guān)鍵環(huán)節(jié),中國移動作為移動信息產(chǎn)業(yè)鏈鏈長,將持續(xù)發(fā)揮產(chǎn)業(yè)引領(lǐng)作用,推進(jìn)產(chǎn)學(xué)研用合作,積極構(gòu)建自主可控的存算一體新型算力生態(tài)。
圖1 憶阻器存算一體芯片A111及存算一體計(jì)算板卡
圖2 基于存算一體芯片的5G工業(yè)網(wǎng)關(guān)
圖3 基于存算一體芯片的邊緣智能示范演示平臺