日前,開放計算標準工作委員會(OCTC)和OCP中國社區(qū)聯(lián)合主辦了“面向應(yīng)用的服務(wù)器算效標準與評估”開放計算技術(shù)沙龍。活動匯聚了中國電子技術(shù)標準化研究院、中石油、中移動、快手、浪潮信息、AMD、Intel、海光信息等研究機構(gòu)、知名企業(yè)的產(chǎn)學研專家和行業(yè)領(lǐng)袖,對不同應(yīng)用下算力需求范式變化、面向應(yīng)用的算力算效評估指標體系構(gòu)建、提升服務(wù)器性能及能效的前沿技術(shù)等話題進行了精彩分享和激烈討論。
智能時代計算范式改變,亟需構(gòu)建面向?qū)嶋H應(yīng)用的算力算效評價基準
智能時代,從智慧醫(yī)療、智能客服、自動駕駛到智能制造,不同行業(yè)、不同場景的人工智能應(yīng)用,不僅帶來了算力需求的指數(shù)級增長,也推動了算力發(fā)展范式的變革。以往,以CPU為主的時代,大家追求的是彈性、高效、性價比,然而智能時代,新興場景帶來了差異化的算力需求,傳統(tǒng)以CPU基礎(chǔ)性能為主的評測基準已不再適用,亟需構(gòu)建面向?qū)嶋H應(yīng)用的算力算效評價基準。
OCTC秘書長陳海
以應(yīng)用為中心,推動算力產(chǎn)業(yè)構(gòu)建AI時代下服務(wù)器算力算效評估標準。
在AI和大模型的驅(qū)動下,算力產(chǎn)業(yè)從技術(shù)、產(chǎn)品到應(yīng)用場景的變化趨快,同時,國家政策、行業(yè)及用戶對能效和算效的要求亦日益攀升。這就亟需建立適用多場景的服務(wù)器算效、能效評價的標準化方案,以確保測評結(jié)果精準對接用戶實際需求,為用戶、行業(yè)和廠商提供客觀、準確、完整的評價體系。
中國石油集團東方地球物理公司處理中心原總工程師,教授級高級工程師賴能和
油氣行業(yè)智能化轉(zhuǎn)型推動算力需求多樣化發(fā)展,算力性能評估需要關(guān)注服務(wù)器在不同應(yīng)用中計算精度、網(wǎng)絡(luò)架構(gòu)、存儲和IO系統(tǒng)的平衡以及能效等。
石油產(chǎn)業(yè)鏈長,從勘探開發(fā)的地震數(shù)據(jù)初至波拾取、煉油化工的生產(chǎn)線控制系統(tǒng)到智慧加油站的銷售系統(tǒng),擁有豐富的智能化場景。隨著油氣行業(yè)智能化轉(zhuǎn)型的推進,應(yīng)用也在從“高精尖”傳統(tǒng)應(yīng)用向新興多應(yīng)用場景拓展,算力需求從高性能計算,向高性能數(shù)據(jù)分析和ML /DL實時計算的AI算力演化,需要面向不同應(yīng)用場景,針對計算精度、網(wǎng)絡(luò)架構(gòu)、存儲和IO系統(tǒng)的平衡設(shè)計等進行服務(wù)器系統(tǒng)設(shè)計和應(yīng)用評估,對算力供給的多元化,高能效與綠色低碳提出了更高的要求。
中移動信息技術(shù)有限公司項目經(jīng)理李圣義
以科學、系統(tǒng)的評估方法來選擇適合業(yè)務(wù)需求的服務(wù)器
運營商行業(yè)具有應(yīng)用場景多樣、多算力并行的業(yè)務(wù)特征,需要科學、系統(tǒng)的評估方法來選擇更適合業(yè)務(wù)需求的服務(wù)器,確保投資的有效性。中國移動一直對算力算效評測標準進行積極探索,通過業(yè)務(wù)場景分類、芯片性能評估、系統(tǒng)性能評估、系統(tǒng)功耗評估等一系列技術(shù)手段,對服務(wù)器算力輸出能力進行綜合分析,為服務(wù)器選型、設(shè)備利舊等提供衡量參考。
以系統(tǒng)視角全面優(yōu)化,加速服務(wù)器算力算效的升級
隨著技術(shù)的飛速發(fā)展和應(yīng)用場景的持續(xù)拓展,對服務(wù)器的算力和算效需求正日益攀升,這不僅意味著硬件層面的升級,比如采用性能更強的處理器和更先進的存儲解決方案,也涉及到軟件層面的深度優(yōu)化和系統(tǒng)設(shè)計的創(chuàng)新,在OCP中國社區(qū)負責人葉毓睿主持的“服務(wù)器算效提升及行業(yè)應(yīng)用”圓桌討論環(huán)節(jié),嘉賓從技術(shù)、應(yīng)用和系統(tǒng)等不同層面,分享了關(guān)于服務(wù)器的算效、能效提升的前沿技術(shù)思考與展望。
AMD服務(wù)器資深系統(tǒng)架構(gòu)師周景瑜認為,面向應(yīng)用,芯片計算架構(gòu)的創(chuàng)新需關(guān)注內(nèi)存、IO等諸多要素。過去20年里,標準服務(wù)器的性能基本上每2.4年會翻一倍。而GPU服務(wù)器則每2.1年性能提升一倍。服務(wù)器計算效率的持續(xù)提升主要源于三大因素:一是整機制程,從28納米演進至當前的3納米,芯片廠商可以在制程迭代,微架構(gòu)優(yōu)化、及封測方面展開合作,進一步提高每瓦特的性能;二是CXL技術(shù),通過支持CXL 3.1打破內(nèi)存墻,提高了核存比;三是IO,未來趨勢是減少外部數(shù)據(jù)溝通成本,使用光纖方式傳輸數(shù)據(jù)來提升能效比。
賴能和表示,油氣行業(yè)用戶在評估服務(wù)器的性能、能效和計算效率時,需要綜合考量多種因素,不應(yīng)僅僅關(guān)注單臺服務(wù)器或工作站的性能,而應(yīng)更加重視整個系統(tǒng)的性能表現(xiàn)。同時,網(wǎng)絡(luò)連接技術(shù)對于提升計算性能具有重要作用。隨著處理器核心數(shù)量的不斷增加,算力大幅提升,但未必對所有應(yīng)用都能達到線性增加,有些并行計算,當核心數(shù)量達到一定數(shù)量后,對并行計算性能效率會有所影響,因此需要從系統(tǒng)架構(gòu)和應(yīng)用優(yōu)化兩個層面進行調(diào)整優(yōu)化。
快手IDC系統(tǒng)架構(gòu)師楊琪表示,針對數(shù)據(jù)中心的算力算效與能效的平衡,PUE不一定是唯一的參考標準。對用戶而言,算力提升意味著能加快成果的產(chǎn)出,但有可能會帶來更高的能耗。高算力與低能耗之間的博弈,可能影響數(shù)據(jù)中心的整體收益,需要業(yè)界更深入的探討,比如數(shù)據(jù)中心的液冷供水溫度設(shè)定,從35℃降低至25℃,低水溫雖然可能帶來PUE的升高,但是算效也可能提高了,這就需要進一步的綜合評估對比收益是否增加。因此,將算力、算效與PUE結(jié)合納入考量指標是未來數(shù)據(jù)中心算效評測發(fā)展的方向。
浪潮信息產(chǎn)品方案開發(fā)部標準認證處經(jīng)理康真健也指出,僅從算力或能效的角度來看,目前的評估標準是割裂的,應(yīng)該更多地考慮能效和算力產(chǎn)出是否經(jīng)濟。例如,從每消耗一度電或一定的二氧化碳排放量,社會能獲得多少算力價值,來衡量高性能與低能耗之間的關(guān)系。比如SPEC組織在制定SART標準時,強調(diào)了用戶實際獲得的算力與消耗電力的比值,這是一個需要精確計算的重要指標。
英特爾亞太研發(fā)數(shù)據(jù)中心工程部經(jīng)理沈勇表示,不同行業(yè)應(yīng)用的算力需求各異,處理器也在面向應(yīng)用進行不同的優(yōu)化,比如英特爾的新平臺一款是針對性能優(yōu)化的叫性能核,另一款是考慮到客戶對能效的需求,計算性能到一定程度之后更關(guān)注能效,提供面向能效優(yōu)化的叫能效核。未來隨著核心數(shù)的增長,如何發(fā)揮最大性能,同時平衡性能與能效會面臨很大挑戰(zhàn),對軟件、生態(tài)提出更高的要求,全產(chǎn)業(yè)鏈合作將成為關(guān)鍵。
智能時代的到來推動了算力范式的深刻變革,不同行業(yè)對服務(wù)器算效的需求愈發(fā)多樣化和復雜化。在此次沙龍中,產(chǎn)業(yè)界對算效評估標準化高度關(guān)注,OCTC也正式公布了面向多樣化應(yīng)用場景的《服務(wù)器算力算效評價規(guī)范》。該規(guī)范面向大數(shù)據(jù)、人工智能等應(yīng)用場景,由中國電子工業(yè)標準化技術(shù)協(xié)會牽頭,業(yè)界芯片廠商、系統(tǒng)廠商及數(shù)據(jù)中心用戶等聯(lián)合參與編制,評測方案、評測工具和標準細則正在制定中。
OCTC熱忱歡迎更多機構(gòu)及產(chǎn)業(yè)鏈上下游從業(yè)者積極參與,以確保規(guī)范的完善性和適用性,構(gòu)建開放、公平的服務(wù)器算力評估基準,推動算力產(chǎn)業(yè)的快速發(fā)展。