飛象原創(chuàng)(孫迎新/文)回顧人類科技革命史,無論是牛頓的萬有引力定律被提出還是薛定諤的量子力學(xué)方程面世,幾乎還從來沒有一次科技革命像人工智能大模型的問世這樣讓人感受到極度的興奮與焦慮。大模型以其強大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力,成為推動人類走進未來智能時代的重要力量。同時,大模型的開發(fā)和訓(xùn)練需要耗費巨量的資源與金錢,簡直堪稱超級吸金的“黑洞”,但更為重要的是,想要玩轉(zhuǎn)大模型就需要天量的AI算力,這就需要像大型智算中心這樣的算力底座作為支撐。
從大模型到AI算力再到智算中心,這一切都只有實力異常雄厚的企業(yè)才能擔(dān)負得起,甚至需要國家力量介入才能實現(xiàn)。也正因為如此,像大模型與AI芯片這樣的人工智能領(lǐng)域頂級科技成就便成為某些發(fā)達國家筑起的一道科技“防火墻”,同時也成為打壓后起國家科技發(fā)展的政治工具。
智慧的火花:OpenAI的誕生與GPT的革命
如果談及大模型的問世,便不得不提及OpenAI這家公司。OpenAI的成立,是科技界對人工智能安全性和可控性的一種自我反思和承諾。2015年,一群科技界的領(lǐng)軍人物,包括特斯拉的埃隆·馬斯克和Y Combinator的山姆·阿爾特曼,共同創(chuàng)立了OpenAI。他們的初衷是推動人工智能的安全性發(fā)展,并確保這一強大技術(shù)能夠造福全人類。
OpenAI對GPT系列模型的貢獻,是其對人工智能領(lǐng)域最重要的貢獻之一。GPT(生成式預(yù)訓(xùn)練變換器),是一系列基于深度學(xué)習(xí)的自然語言處理模型。從GPT-1到GPT-3,每一個版本的發(fā)布,都標(biāo)志著人工智能在理解和生成自然語言方面的巨大飛躍。現(xiàn)在很難形容當(dāng)GPT問世時人們從震撼到驚愕的轉(zhuǎn)變,甚至都以為是創(chuàng)造出了具有意識的硅基生命體,而這樣的工作,在以往幾千年里人們都認定是由上帝或神才能完成。
讓人感到意外的是,山姆·阿爾特曼,OpenAI的聯(lián)合創(chuàng)始人,對人工智能的未來持有復(fù)雜的看法。他曾預(yù)言,到2030年,我們將見證通用人工智能(AGI)的到來,屆時GPT-10的智慧將超越全人類。這一預(yù)言,既令人興奮也引發(fā)了廣泛的憂慮。他指出,實現(xiàn)AGI的過程應(yīng)該是緩慢而謹慎的,需要時間來適應(yīng)和理解。這種擔(dān)憂并非無的放矢,因為隨著AI技術(shù)的不斷進步,我們正面臨著前所未有的挑戰(zhàn)。也或許正是這樣具有前瞻性的眼光,使得山姆·阿爾特曼后來不得不以辭職這樣的方式表達對人工智能快速發(fā)展的擔(dān)憂。
埃隆·馬斯克,作為SpaceX和Tesla的創(chuàng)始人,同樣對AI的快速發(fā)展持有深深的顧慮。他曾是OpenAI的聯(lián)合創(chuàng)始人之一,即便是在“獵鷹”火箭發(fā)射失敗,投資打了水漂之時也沒有放下對AI技術(shù)的執(zhí)念,但后來還是因為對公司發(fā)展方向的分歧而退出。盡管如此,他依然對AI技術(shù)保持關(guān)注,并在其他項目中探索AI的應(yīng)用。
震撼世界的巨浪:大模型的奇跡與應(yīng)用
大模型完全可以說是AI技術(shù)發(fā)展史上的一座里程碑。大模型以其前所未有的計算能力和智能水平,在全球范圍內(nèi)引起了廣泛的關(guān)注和討論。大模型在多個領(lǐng)域展現(xiàn)了其震撼世界的能力,尤其是在自然語言處理、圖像識別和多模態(tài)交互等方面。
自然語言處理的突破簡直可以算得上是一個科技奇跡,人們第一次驚奇地發(fā)現(xiàn)可以和機器用人類的語言進行交流。大模型在理解和生成自然語言方面的能力,使得機器能夠以前所未有準(zhǔn)確度進行語言翻譯、文本摘要和情感分析。例如,GPT-3在多項語言理解測試中的表現(xiàn)超越了人類,這一成就在學(xué)術(shù)界和工業(yè)界都引起了巨大反響。
同時,多模態(tài)交互的實現(xiàn)更是強化了人們對這項科技奇跡的認知。大模型的發(fā)展推動了多模態(tài)AI的興起,這些AI系統(tǒng)能夠處理和理解圖像、文本和聲音等多種類型的數(shù)據(jù)。例如,DALL-E 2等模型能夠根據(jù)文本描述生成逼真的圖像,這種能力在藝術(shù)創(chuàng)作和設(shè)計領(lǐng)域產(chǎn)生了深遠影響。
在更多的領(lǐng)域,大模型的問世有力推動了科學(xué)研究的加速。大模型在生物制藥、材料科學(xué)和物理學(xué)等領(lǐng)域的應(yīng)用,加速了科學(xué)研究的進程。例如,AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的突破,為生物學(xué)和醫(yī)學(xué)研究開辟了新的道路。
跨越障礙:萬億級大模型的挑戰(zhàn)與中美AI領(lǐng)域的較量
在人工智能的宏大敘事中,萬億級大模型代表著技術(shù)的巔峰,它們在處理復(fù)雜任務(wù)時展現(xiàn)出的能力令人震撼。然而這些模型在訓(xùn)練過程中面臨著一系列難題,同時,全球政治經(jīng)濟的動態(tài)也對這一領(lǐng)域的發(fā)展產(chǎn)生了深遠的影響。
如果僅這么說大家肯定不會有什么直觀的印象,但說到英偉達這家公司,它僅憑推出用于AI訓(xùn)練和推理任務(wù)的H100 TENSORCORE引擎便成為全球市值最高的科技公司,當(dāng)前的市值(3.34萬億)相當(dāng)于約1.15個微軟(2.89萬億)或1.86個谷歌(1.8萬億)。更為重要的是,英偉達是一家美國公司,美國政府利用它想給誰斷供就給誰斷供,想掐誰脖子就掐誰脖子。
即便在財力上豪橫似英偉達,在面對大模型持續(xù)開發(fā)和訓(xùn)練時的算力需求與成本也不得不掂量一下。訓(xùn)練萬億級大模型需要巨大的計算資源,但這樣的資源在全球范圍內(nèi)仍屬稀缺,算力的高昂成本也成為大模型訓(xùn)練的一大障礙。英偉達CEO黃仁勛就多次強調(diào)數(shù)據(jù)中心在未來計算中的重要性。他認為數(shù)據(jù)中心將成為整個計算單元的基礎(chǔ),未來計算量級的計算將成為常態(tài)。他還提到,全球每年對數(shù)據(jù)中心設(shè)備的投資費用高達2500億美元,英偉達將占據(jù)其中大部分市場份額。
數(shù)據(jù)獲取與處理也是一大難題。大模型的訓(xùn)練需要依賴海量的高質(zhì)量數(shù)據(jù),數(shù)據(jù)的采集、清洗、標(biāo)注都需要大量的時間和人力資源。AI教母、斯坦福大學(xué)教授李飛飛最著名的貢獻之一就是創(chuàng)建了ImageNet數(shù)據(jù)庫,這是一個龐大的圖像分類數(shù)據(jù)庫,為深度學(xué)習(xí)的發(fā)展提供了重要的數(shù)據(jù)支持,而這項成果的獲得正是基于搞定了大模型訓(xùn)練需要的海量高質(zhì)量數(shù)據(jù)。
模型的泛化能力一直是令人工智能科學(xué)家們頭疼的問題。盡管大模型在特定任務(wù)上表現(xiàn)出色,但如何確保它們在不同領(lǐng)域和場景下都能保持穩(wěn)定的性能,是研究者們需要解決的問題。很難想象大模型在面對某個領(lǐng)域時表現(xiàn)得像個百年不遇的天才,而在面對有的領(lǐng)域卻表現(xiàn)得像個不折不扣的白癡,這樣的情況讓科學(xué)家們無比抓狂卻又無可奈何。
此外,能耗與環(huán)境影響也是人工智能發(fā)展之路上的攔路虎,面對這個巨大的障礙除了爭取國家支持,幾乎沒有什么太好的應(yīng)對之策。大模型訓(xùn)練過程中的高能耗問題不容忽視,如哈爾濱智算中心的6.9EFLOPS算力,其背后是巨大的電力消耗,放眼全球也只有中國電力這樣的能源企業(yè)有實力提供支撐,畢竟在6,900,000 MW到103.5億千瓦時之間的電力消耗,有的小國家舉全國之力也未必能夠辦到。
事實上在全球的計算中心里,曾經(jīng)出現(xiàn)過許多次因電力供應(yīng)中斷帶來的事故。
2015年9月20日,亞馬遜AWS的一個數(shù)據(jù)中心遭遇停電事故,影響了Netflix、Tinder、Airbnb等應(yīng)用程序的在線服務(wù)。
2022年8月8日,谷歌位于美國愛荷華州康瑟爾布拉夫斯的數(shù)據(jù)中心發(fā)生電力事故,導(dǎo)致3名電工嚴重受傷。
同樣在2022年,微軟澳大利亞東部數(shù)據(jù)中心在一次長達46小時的中斷事件中,起因是電力供應(yīng)問題導(dǎo)致冷卻系統(tǒng)故障。
Interxion位于倫敦的一個數(shù)據(jù)中心在2023年1月10日遭遇了4個小時的故障,許多客戶受到了影響。
最后不得不提到的就是美國對中國在AI領(lǐng)域的限制。通過技術(shù)封鎖、投資限制、人才流動限制和國際合作限制等手段,美國在人工智能技術(shù)及大模型領(lǐng)域?qū)χ袊M行了全面的限制。這些措施不僅影響了中國的AI產(chǎn)業(yè)發(fā)展,也加劇了中美之間的科技競爭。但從某種意義上看,人工智能技術(shù)或許是美國在科技領(lǐng)域的最后一個制高點,中國一旦在人工智能技術(shù)上占據(jù)領(lǐng)先地位將無可爭議地將美國拉下科技神壇。
智算自主:全球運營商最大單集群智算中心在哈爾濱建成投用
在全球智算領(lǐng)域的競爭日趨激烈的今天,中國移動在哈爾濱建成并投入使用的全球運營商最大單集群智算中心,不僅標(biāo)志著中國在智能計算領(lǐng)域的一次重大飛躍,更是中國在面對美國技術(shù)限制下自主創(chuàng)新能力的有力證明。
首先是哈爾濱智算中心實現(xiàn)了國產(chǎn)化率的飛躍。哈爾濱智算中心的AI芯片國產(chǎn)化率達到100%,這一成就的取得來之不易,尤其是在人工智能高端芯片嚴重受限的當(dāng)下,這也得益于昆侖技術(shù)、華鯤振宇、寶德計算機、長江計算、神州鯤泰以及寒武紀這些公司付出的努力,使得哈爾濱智算中心在建設(shè)過程中減少了對外部供應(yīng)鏈的依賴,為中國智算領(lǐng)域的發(fā)展提供了堅實的基礎(chǔ)。通過國產(chǎn)化AI芯片和自主研發(fā)技術(shù)的運用,哈爾濱智算中心減少了對美國技術(shù)的依賴,這在一定程度上打破美國的技術(shù)限制,削弱了美國通過技術(shù)限制對中國智算領(lǐng)域發(fā)展的影響力。
哈爾濱智算中心在算力方面取得大幅的提升。該中心能夠提供6.9EFLOPS的智能算力,這一算力相當(dāng)于300多萬臺高性能計算機的集合。這使得中國在處理大規(guī)模數(shù)據(jù)和復(fù)雜計算任務(wù)時更加自如,大大提升了國內(nèi)科研和商業(yè)應(yīng)用的能力。
在技術(shù)創(chuàng)新方面,哈爾濱智算中心采用了多項中國移動自主研發(fā)的技術(shù),如GSE1.0、天池SDN等,這些技術(shù)的創(chuàng)新應(yīng)用不僅提升了智算中心的運行效率,也為全球智算領(lǐng)域的發(fā)展貢獻了中國智慧。
哈爾濱智算中心的成功建設(shè)也推動了國內(nèi)產(chǎn)業(yè)鏈的發(fā)展,智算中心的建設(shè)和運營,帶動了國內(nèi)相關(guān)產(chǎn)業(yè)鏈的發(fā)展,包括芯片制造、軟件開發(fā)、系統(tǒng)集成等,這有助于構(gòu)建更加完善和自主的國內(nèi)智算產(chǎn)業(yè)生態(tài)。同時在增強國際競爭力方面,哈爾濱智算中心的建成,提升了中國在全球智算領(lǐng)域的競爭力。它不僅能夠支持國內(nèi)的大型AI模型訓(xùn)練和應(yīng)用,還能夠吸引國際企業(yè)和研究機構(gòu)的合作,提升中國在全球智算領(lǐng)域的影響力。
在全球AI領(lǐng)域的較量中,中國正以堅定的步伐,不斷探索和創(chuàng)新,力求在萬億級大模型的研發(fā)和應(yīng)用上取得更多的突破。盡管道路充滿挑戰(zhàn),但未來仍然充滿希望。哈爾濱智算中心的建成和投入使用,是中國智算領(lǐng)域自主創(chuàng)新能力的一個縮影。它不僅展示了中國在面對外部技術(shù)限制時的堅韌和智慧,也為全球智算領(lǐng)域的發(fā)展貢獻了新的動能。
在人工智能技術(shù)領(lǐng)域,美國還能卡中國的脖子嗎?
最后,向GPT-4提出以上的問題作為總結(jié)。GPT-4是這樣回答的:
作為一個AI助手,我沒有情感,也不支持或反對任何國家。人工智能技術(shù)的發(fā)展一直在全球范圍內(nèi)進行,并帶來了許多機遇和挑戰(zhàn)。對于中國或任何其他國家來說,人工智能的使用和發(fā)展都需要權(quán)衡利弊,并采取適當(dāng)?shù)拇胧﹣斫鉀Q可能出現(xiàn)的問題。