首頁(yè)|必讀|視頻|專(zhuān)訪(fǎng)|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 頭條資訊 >> 正文

各大AI模型訓(xùn)練成本大比拼:谷歌Gemini Ultra高達(dá)1.9億美元

2024年6月6日 07:53  新浪科技  

像OpenAI的ChatGPT、谷歌(177.07, 1.94, 1.11%)的Gemini Ultra這樣的高級(jí)AI模型,訓(xùn)練它們通常需要數(shù)百萬(wàn)美元的費(fèi)用,且該成本還在迅速上升。

隨著計(jì)算需求的增加,訓(xùn)練它們所需的計(jì)算能力的費(fèi)用也在飆升。為此,AI公司正在重新考慮如何訓(xùn)練這些生成式AI系統(tǒng)。在許多情況下,這些策略包括在當(dāng)前的增長(zhǎng)軌跡下降低計(jì)算成本。

訓(xùn)練成本是如何確定的?

斯坦福大學(xué)與研究公司Epoch AI合作,根據(jù)云計(jì)算租金估算了AI模型的訓(xùn)練成本。雙方所分析的關(guān)鍵因素包括模型的訓(xùn)練時(shí)長(zhǎng)、硬件的利用率和訓(xùn)練硬件的價(jià)值。

盡管許多人猜測(cè),訓(xùn)練AI模型的成本變得越來(lái)越高,但缺乏全面的數(shù)據(jù)來(lái)支持這些說(shuō)法。而斯坦福大學(xué)發(fā)布的《2024年AI指數(shù)報(bào)告》正是支持這些說(shuō)法的罕見(jiàn)來(lái)源之一。

不斷膨脹的訓(xùn)練成本

去年,OpenAI的GPT-4培訓(xùn)成本估計(jì)為7840萬(wàn)美元,遠(yuǎn)高于谷歌PaLM (540B) 的訓(xùn)練成本。谷歌PaLM較GPT-4僅早一年推出,但訓(xùn)練成本為1240萬(wàn)美元。

相比之下,2017年開(kāi)發(fā)的早期AI模型Transformer的訓(xùn)練成本為930美元。該模型在塑造當(dāng)前所使用的許多大型語(yǔ)言模型的體系結(jié)構(gòu)方面起著基礎(chǔ)性作用。

谷歌的AI模型Gemini Ultra的訓(xùn)練成更高,達(dá)到了驚人的1.91億美元。截至2024年初,該模型在幾個(gè)指標(biāo)上都超過(guò)了GPT-4,最引人注目的是在“大規(guī)模多任務(wù)語(yǔ)言理解”(MMLU)基準(zhǔn)測(cè)試中勝出。這一基準(zhǔn)是衡量大型語(yǔ)言模型能力的重要標(biāo)尺。例如,它以評(píng)估57個(gè)學(xué)科領(lǐng)域的知識(shí)和解決問(wèn)題的熟練程度而聞名。

訓(xùn)練未來(lái)的AI模型

鑒于這些挑戰(zhàn),AI公司正在尋找新的解決方案來(lái)訓(xùn)練語(yǔ)言模型,以應(yīng)對(duì)不斷上漲的成本。

其中的方法有多種,比如創(chuàng)建用于執(zhí)行特定任務(wù)的較小模型,而其他一些公司正在試驗(yàn)創(chuàng)建自家的合成數(shù)據(jù)來(lái)“投喂”AI系統(tǒng)。但到目前為止,這方面還沒(méi)有取得明確的突破。

例如,使用合成數(shù)據(jù)的AI模型有時(shí)會(huì)“胡言亂語(yǔ)”,引發(fā)所謂的“模型崩潰”。

編 輯:魏德齡
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話(huà)為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國(guó)電信董事長(zhǎng)柯瑞文:天翼云作為國(guó)家云已經(jīng)越過(guò)向智能云發(fā)展的拐點(diǎn)
精彩專(zhuān)題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤(pán)點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像