首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

大模型周報百期精選

2024年12月18日 08:20  天翼智庫  

自2023年5月14日,天翼智庫大模型研究團隊發(fā)布第1期大模型周報《迎接大模型時代(上):大模型發(fā)展簡史》起,到本期為止,天翼智庫已發(fā)布整100期大模型周報。100期周報,見證了大模型產(chǎn)業(yè)的快速發(fā)展,濃縮了對大模型產(chǎn)業(yè)發(fā)展規(guī)律的認識。本期從往期大模型周報系列文章中精選出“十大行業(yè)盛典”、“十大政策”、“十大技術(shù)”、“十大產(chǎn)品”、“十大投融資”、“十大觀點”、“十大公司”,以饗讀者。

十大行業(yè)盛典1

1.Meta Connect 2024大會(2024.9.25-2024.9.26)

Meta發(fā)布增強現(xiàn)實(AR)眼鏡Orion,采用創(chuàng)新的碳化硅材質(zhì),結(jié)合納米級3D光波導(dǎo)技術(shù)和Micro LED投影系統(tǒng),眼鏡重量不足100克,視野范圍(FOV)實現(xiàn)飛躍達70度,用肌電圖(EMG)智能腕帶實現(xiàn)操作。

2.2024年世界機器人大會(2024.8.21-2024.8.25)

27款人形機器人集中亮相2024年世界機器人大會,專注于家務(wù)、醫(yī)療、養(yǎng)老、導(dǎo)盲等場景。除代替人類從事繁瑣的重復(fù)性工作外,還將為人類提供情感陪伴方面的支持。

3.世界人工智能大會WAIC 2024(2024.7.4-2024.7.6)

《人工智能全球治理上海宣言》發(fā)布,提出要推動全球人工智能研究資源的交流與合作,推動人工智能基礎(chǔ)設(shè)施公平分配。

特斯拉二代人形機器人Optimus亮相,全身控制能力和平衡性再次升級,行走速度提升30%,手指能在輕握雞蛋和搬運重物之間輕松切換。

商湯發(fā)布首個“可控”人物視頻生成大模型Vimi,僅通過一張任意風(fēng)格的照片即可生成和目標動作一致的人物類視頻,并支持多種驅(qū)動方式。

4.2024年度WWDC全球開發(fā)者大會(2024.6.10-2024.6.14)

蘋果發(fā)布全新個人化智能系統(tǒng)Apple Intelligence,將生成式AI模型置于iPhone和iPad的核心中,能夠根據(jù)個人情境提供智能協(xié)助。

5.谷歌2024年I/O開發(fā)者大會(2024.5.14)

谷歌發(fā)布7大模型22項AI大招,包括200萬tokens超長上下文Gemini 1.5 Pro進階版、Gemini 1.5 Flash輕量級模型、通用AI Agent、高質(zhì)量文生圖模型Imagen 3等多項技術(shù)和功能。

6.谷歌云大會Google Cloud Next 2024(2024.4.9-2024.4.11)

谷歌發(fā)布多項AI模型更新和產(chǎn)品,包括Gemini 1.5 Pro公開可用、代碼模型Code Gemma、首款自研Arm處理器Axion、AI賦能的Workspace、智能視頻創(chuàng)作工具Vids、助力企業(yè)搭建AI的Agent Builder等。

7.2024年世界移動通信大會(MWC)(2024.2.26-2024.2.29)

英特爾發(fā)布全新商用邊緣計算平臺,代號為Project Strata,可幫助企業(yè)在標準硬件上大規(guī)模開發(fā)、部署、運行和管理邊緣應(yīng)用。

五家運營商成立大語言模型合資企業(yè),SK電訊(SKT)、德國電信(Deutsche Telekom)、阿聯(lián)酋電信(e& Group)、新加坡電信(Singtel)和軟銀(Softbank)宣布計劃成立一家專注打造特定于電信行業(yè)的大語言模型合資企業(yè)。

8.2024年國際消費電子產(chǎn)品展(CES)(2024.1.9-2024.1.12)

“AI PC上車”,英特爾誓言逆襲英偉達、高通,英特爾宣布將推出基于AI PC技術(shù)的汽車人工智能芯片,與高通、英偉達展開直接競爭,預(yù)計首批芯片將于2024年年底推出。

車計算全產(chǎn)品矩陣亮相CES,聯(lián)想車計算展示面向智能駕駛和智能座艙的全系列域控制器產(chǎn)品、解決方案和基于大模型的智能座艙場景應(yīng)用。

9.OpenAI首屆開發(fā)者大會(2023.11.6)

OpenAI公布多項關(guān)鍵技術(shù)與產(chǎn)品更新,包括GPT-4 Turbo、Assistants API(助理API)、GPTs等產(chǎn)品,并引入“Copyright Shield(版權(quán)保護盾)”機制。

10.2023年云棲大會(2023.10.31-2023.11.2)

阿里云發(fā)布通義千問2.0及大模型應(yīng)用開發(fā)平臺等產(chǎn)品,包括千億級參數(shù)大模型通義千問2.0、基于通義大模型訓(xùn)練的通義靈碼(智能編碼助手)等8大行業(yè)模型和一站式大模型應(yīng)用開發(fā)平臺——阿里云百煉。

十大政策2

1.美國總統(tǒng)拜登簽署《關(guān)于安全、可靠、可信地開發(fā)和使用人工智能的行政命令》

2023年10月30日,美國總統(tǒng)拜登簽署行政令,將對AI研發(fā)和應(yīng)用制定全面的監(jiān)管標準。這是白宮首次發(fā)布針對AI的行政令,該命令提出一系列措施建議,旨在加強美國公民在人工智能系統(tǒng)訪問有關(guān)他們的信息時的隱私保護。

2.聯(lián)合國大會通過題為“抓住安全、可靠和值得信賴的人工智能系統(tǒng)帶來的機遇,促進可持續(xù)發(fā)展”決議

2024年3月21日,聯(lián)合國大會通過首個有關(guān)人工智能(AI)的全球決議草案,以確保這項強大的新技術(shù)能夠造福所有國家、尊重人權(quán),并且是“安全的、可靠的和值得信賴的”。美國是這項決議草案的發(fā)起國,中國和121個國家參與共同提案。

3.歐盟《人工智能法案》正式生效

2024年8月1日,歐盟《人工智能法案》正式生效。該法案是全球首部全面監(jiān)管人工智能的法規(guī),標志著歐盟在規(guī)范人工智能應(yīng)用方面邁出重要一步。

4.中央網(wǎng)信辦發(fā)布《全球人工智能治理倡議》

2023年10月18日,中央網(wǎng)信辦發(fā)布《全球人工智能治理倡議》,圍繞人工智能發(fā)展、安全、治理三方面系統(tǒng)闡述人工智能治理中國方案,為相關(guān)國際討論和規(guī)則制定提供藍本。

5.國家網(wǎng)信辦等七部門聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》

2024年4月2日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布公告:網(wǎng)信部門會同相關(guān)部門按照《生成式人工智能服務(wù)管理暫行辦法》要求,有序開展生成式人工智能服務(wù)備案工作,并將已備案信息予以公告。

6.國家數(shù)據(jù)局等17部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》

2024年1月4日,國家數(shù)據(jù)局等17部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》。其中提到,培育數(shù)據(jù)驅(qū)動型產(chǎn)品研發(fā)新模式;支持開展人工智能大模型開發(fā)和訓(xùn)練等。

7.2024年政府工作報告提出深化大數(shù)據(jù)和AI研發(fā)應(yīng)用

2024年3月11日,十四屆全國人大二次會議表決通過政府工作報告,提出制定支持數(shù)字經(jīng)濟高質(zhì)量發(fā)展政策,促進數(shù)字技術(shù)和實體經(jīng)濟深度融合,深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開展“人工智能+”行動。

8.國資委要求央企加快布局發(fā)展人工智能產(chǎn)業(yè)

2024年2月19日,國資委召開“AI賦能 產(chǎn)業(yè)煥新”中央企業(yè)人工智能專題推進會。會議明確,中央企業(yè)要把發(fā)展人工智能放在全局工作中統(tǒng)籌謀劃,深入推進產(chǎn)業(yè)煥新,加快布局和發(fā)展人工智能產(chǎn)業(yè),把主要資源集中投入到最需要、最有優(yōu)勢的領(lǐng)域,加快建設(shè)一批智能算力中心,開展AI+專項行動。

9.工信部等八部門探索建設(shè)區(qū)域人工智能數(shù)據(jù)處理中心

2023年12月29日,工信部等八部門發(fā)布《關(guān)于加快傳統(tǒng)制造業(yè)轉(zhuǎn)型升級的指導(dǎo)意見》,提出將探索建設(shè)區(qū)域人工智能數(shù)據(jù)處理中心,通過平臺化、網(wǎng)絡(luò)化等組織形式,發(fā)展跨物理邊界的虛擬園區(qū)和集群,構(gòu)建虛實結(jié)合的產(chǎn)業(yè)數(shù)字化新生態(tài)。

10.工信部提出到2025年初步建立人形機器人創(chuàng)新體系

2023年11月2日,工信部印發(fā)《人形機器人創(chuàng)新發(fā)展指導(dǎo)意見》,提出到2025年,人形機器人創(chuàng)新體系初步建立,“大腦、小腦、肢體”等一批關(guān)鍵技術(shù)取得突破。到2027年,人形機器人技術(shù)創(chuàng)新能力顯著提升,綜合實力達到世界先進水平。

十大技術(shù)3

1.模型架構(gòu)

華為改進Transformer架構(gòu),同規(guī)模性能超Llama。2024年1月2日消息,華為推出新型LLM架構(gòu)盤古-π,通過增強非線性改進傳統(tǒng)Transformer架構(gòu),由此有效減輕特征塌陷問題。使用相同數(shù)據(jù)訓(xùn)練情況下,盤古-π(7B)在多任務(wù)上超越Llama 2等同規(guī)模大模型,并能實現(xiàn)10%推理加速。

拯救Transformer:DeepMind給模型嵌入“算法推理大腦”。2024年6月17日,DeepMind論文提出用混合架構(gòu)方法解決Transformer模型的推理缺陷,通過將Transformer的自然語言理解能力(NLU)和基于圖神經(jīng)網(wǎng)絡(luò)(GNN)的神經(jīng)算法推理器(NAR)的強大推理能力相結(jié)合,實現(xiàn)更加泛化、穩(wěn)健、準確的LLM推理。

Meta推出多模態(tài)模型架構(gòu)Transfusion。2024年8月24日,Meta推出多模態(tài)模型架構(gòu)Transfusion,結(jié)合語言模型在處理文本等離散數(shù)據(jù)方面的優(yōu)勢,以及擴散模型在生成圖像等連續(xù)數(shù)據(jù)的能力,將其整合到語言模型和圖像生成模型統(tǒng)一的AI系統(tǒng)中。

谷歌推出選擇性注意力機制:降低Transformer模型資源消耗。2024年10月8日,谷歌推出選擇性注意力(Selective Attention)方法,可以動態(tài)忽略不再相關(guān)的標記,從而提高Transformer架構(gòu)模型性能。1億參數(shù)Transformer模型中,注意力模塊的內(nèi)存需求可減少至1/47。

2.多模態(tài)融合

AI視頻理解天花板:全新MiniGPT4-Video刷爆SOTA。2024年4月4日,來自KAUST和哈佛大學(xué)的研究人員提出MiniGPT4-Video——專為視頻理解而設(shè)計的多模態(tài)大模型,MiniGPT4-Video能夠同時處理時態(tài)視覺數(shù)據(jù)和文本數(shù)據(jù),因此善于理解視頻的復(fù)雜性。

馬斯克旗下xAI公司推出首個多模態(tài)模型Grok-1.5V。2024年4月12日,xAI推出首個多模態(tài)模型Grok-1.5V,稱其在多學(xué)科推理、文檔理解、科學(xué)圖表、表格處理、屏幕截圖和照片等領(lǐng)域均能媲美現(xiàn)有的前沿多模態(tài)模型。

谷歌多模態(tài)大模型Gemini Ultra能力全面超越GPT-4和GPT-4V。2023年12月7日,谷歌發(fā)布全新最強多模態(tài)大模型Gemini,有Ultra、Pro、Nano三個版本。在MMLU、DROP、HellaSwag、GSM8K等主流評測中,Gemini Ultra能力全面超越OpenAI的GPT-4和GPT-4V。

OpenAI推出端到端原生多模態(tài)大模型GPT-4o。2024年5月14日,OpenAI推出跨音頻、視覺和文本的端到端新模型GPT-4o,可以在平均320ms內(nèi)對人類的語音輸入進行響應(yīng)。與現(xiàn)有模型相比,GPT-4o在視覺和音頻理解方面尤其出色。

中國首個Sora級模型Vidu發(fā)布,融合Diffusion與Transformer。2024年4月27日,清華大學(xué)聯(lián)合生數(shù)科技發(fā)布中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu,融合Diffusion與Transformer,開創(chuàng)性創(chuàng)建U-ViT架構(gòu),支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內(nèi)容。

華為盤古大模型5.0正式發(fā)布:升級多模態(tài)能力。2024年6月21日,在華為HDC 2024開發(fā)者大會上,華為宣布盤古大模型5.0正式發(fā)布,在全系列、多模態(tài)、強思維三個方面實現(xiàn)升級。

Meta公布機器人觸覺感知能力相關(guān)的多項研究成果。2024年10月31日,Meta公布包括傳感器、編碼器、平臺及測試框架在內(nèi)的一套大模型觸覺感知相關(guān)研究成果,旨在讓機器人通過觸覺方式進一步理解和操作外界物體。

蘋果推出300億參數(shù)多模態(tài)AI大模型MM1.5。2024年10月13日,蘋果推出多模態(tài)AI大模型MM1.5,可識別UI界面推理自然語言,同時推出專門用于視頻理解的MM1.5-Video模型和專門處理移動設(shè)備用戶界面(UI)理解的MM1.5-UI模型。

3.強化學(xué)習(xí)

OpenAI發(fā)布首款具備復(fù)雜推理能力模型o1。2024年9月12日,OpenAI發(fā)布首款具備復(fù)雜推理能力模型o1,o1的訓(xùn)練過程依賴于大規(guī)模的Self-play強化學(xué)習(xí)算法,能夠通過“鏈式思維”逐步解決復(fù)雜問題,在多項高難度基準測試中表現(xiàn)出色。

4.混合專家模型(MoE)

馬斯克旗下xAI公司公開大模型Grok-1的權(quán)重與架構(gòu)。2024年3月18日消息,xAI宣布公開其大語言模型Grok-1的基本模型權(quán)重和網(wǎng)絡(luò)架構(gòu),Grok-1是由該公司從頭開始訓(xùn)練、擁有3140億參數(shù)的混合專家模型。

國內(nèi)上線首個開源千億參數(shù)MoE大模型。2024年4月1日消息,國內(nèi)獨角獸企業(yè)APUS(麒麟合盛)聯(lián)合新旦智能訓(xùn)練的大模型APUS-xDAN大模型4.0宣布于近日開源,這是國內(nèi)首個千億以上參數(shù)MoE架構(gòu)的開源大模型,參數(shù)規(guī)模為1360億。

騰訊發(fā)布萬億級異構(gòu)MoE大模型“混元Turbo”。2024年9月5日,騰訊發(fā)布新一代大模型“混元Turbo”,該模型采用MoE架構(gòu),相比前代模型,訓(xùn)練效率提升108%,推理效率提升100%,推理成本降低50%。

5.模型壓縮

微軟推出可手機端運行的小尺寸模型Phi-3。2024年4月23日,微軟發(fā)布自研小尺寸模型Phi-3,新模型有三個版本,其中Phi-3 mini是一個擁有38億參數(shù)的語言模型,可部署在手機上,但其性能能夠與Mixtral 8x7B和GPT-3.5等模型相媲美。

谷歌DeepMind開源輕量級模型Gemma 2 2B。2024年8月1日,谷歌開源端側(cè)大模型Gemma 2 2B,是一款專為在筆記本電腦和智能手機等本地設(shè)備上運行而設(shè)計的輕量級LLM,在Chatbot Arena測試中,Gemma 2 2B得分超越所有GPT-3.5系列模型,展現(xiàn)出卓越的對話能力。

Meta推出Llama 3.2 1B/3B量化模型。2024年10月24日,Meta推出Llama 3.2 1B/3B模型的量化版(QLoRA及SpinQuant版),量化后模型大小平均減少56%,RAM使用量平均減少41%,模型速度提高2至4倍,同時降低功耗。

6.數(shù)據(jù)合成

英偉達利用Isaac Sim模擬器和MimicGen NIM微服務(wù)合成數(shù)據(jù)。2024年8月7日消息,英偉達宣布利用AI加速人形機器人開發(fā),通過遠程操作采集少量人類演示數(shù)據(jù),然后利用Isaac Sim模擬器和MimicGen NIM微服務(wù)生成大量合成數(shù)據(jù),與真實數(shù)據(jù)共同用于訓(xùn)練英偉達Project GR00T人形基礎(chǔ)模型。

7.AI Agent

智譜AI聯(lián)合清華KEG提出AgentTuning微調(diào)方法,可對齊Agent能力。2023年10月23日消息,智譜AI聯(lián)合清華KEG提出一種對齊Agent能力的微調(diào)方法AgentTuning,該方法使用少量數(shù)據(jù)微調(diào)已有模型,可顯著激發(fā)模型Agent能力,同時保持模型原有的通用能力。

清華首個AI醫(yī)院小鎮(zhèn)Agent Hospital發(fā)布。2024年5月9日,清華研究團隊開發(fā)首個AI醫(yī)院小鎮(zhèn)Agent Hospital,在這個虛擬世界中,所有的醫(yī)生、護士、患者都是由LLM驅(qū)動的智能體,可以自主交互。更重要的是,AI醫(yī)生可以自主進化。

阿里魔搭團隊發(fā)布手機端側(cè)自動化Mobile-Agent-v2版本。2024年6月16日,阿里魔搭團隊在Mobile-Agent基礎(chǔ)上發(fā)布多模態(tài)智能體Mobile-Agent-v2,維持基于純視覺的操作策略,引入多智能體協(xié)作架構(gòu),強化跨應(yīng)用操作和多語言處理能力。

OpenAI推出多智能體協(xié)作框架Swarm。2024年10月11日,OpenAI推出Swarm框架,旨在解決開發(fā)者在多智能體系統(tǒng)編排中面臨的復(fù)雜挑戰(zhàn),通過簡化智能體的協(xié)調(diào)、執(zhí)行和測試過程,讓開發(fā)者能夠更高效地管理、互動多個AI智能體。

8.上下文長度(context length)擴展技術(shù)

Meta發(fā)布有效處理“無限上下文”長度的LLM架構(gòu)Megalodon。2024年4月17日,來自Meta等的研究人員提出全新神經(jīng)網(wǎng)絡(luò)架構(gòu)Megalodon,專為有效處理“無限上下文”長度的LLM預(yù)訓(xùn)練及推理而設(shè)計,相較于Llama 2,Megalodon在處理70億參數(shù)和2萬億token任務(wù)上,準確率超過Transformer。

國產(chǎn)大模型Kimi在長上下文窗口技術(shù)上取得新突破。2024年3月18日,月之暗面宣布Kimi智能助手已支持200萬字超長無損上下文,并于即日起開啟產(chǎn)品內(nèi)測,更適用于高效閱讀、專業(yè)文件解讀、資料整理總結(jié)等方面。

9.思維鏈

谷歌DeepMind發(fā)表arxiv論文,展示生成式驗證器GenRM。2024年9月3日,谷歌展示GenRM技術(shù),該技術(shù)無縫集成指令調(diào)整,支持思維鏈推理,通過多數(shù)投票利用額外的推理時間計算,微調(diào)LLMs作為獎勵模型,從而提升生成式AI推理能力。

OpenAI發(fā)布首款具備復(fù)雜推理能力模型o1。2024年9月12日,OpenAI發(fā)布首款具備復(fù)雜推理能力模型o1,o1的訓(xùn)練過程依賴于大規(guī)模的Self-play強化學(xué)習(xí)算法,能夠通過“鏈式思維”逐步解決復(fù)雜問題,在多項高難度基準測試中表現(xiàn)出色。

10.檢索增強生成(RAG)

微軟開源GraphRAG:知識圖譜+大模型。2024年7月2日,微軟開源GraphRAG技術(shù),通過基于知識圖譜的檢索增強生成(RAG)方法增強LLM處理私有數(shù)據(jù)的性能,具備跨大型數(shù)據(jù)集的復(fù)雜語義問題推理能力。

十大產(chǎn)品4

1.國外產(chǎn)品

(1)ChatGPT

OpenAI發(fā)布ChatGPT,迅速在全球范圍內(nèi)引起廣泛關(guān)注,僅上線五天用戶就超過100萬,兩個月后用戶破億,被稱為“歷史上用戶增長最快的消費級應(yīng)用”。2024年2-10月的月平均訪問量達到25億,超過微軟的New Bing,位居首位。

(2)New Bing

微軟將OpenAI技術(shù)整合到旗下搜索引擎必應(yīng)、營銷軟件、GitHub編碼工具、Microsoft 365辦公軟件中,構(gòu)建AI服務(wù)體系。2024年2-10月,Bing月平均訪問量為15億。桌面搜索引擎市場中,Bing 2024年全球市場份額為10.5%5。

(3)Text to Image6

在線圖形設(shè)計平臺Canva的“Text to Image”是一款利用人工智能技術(shù),將文本描述轉(zhuǎn)化為視覺圖像的工具,在AI產(chǎn)品榜中長期穩(wěn)居第3名。2024年6月,Text to Image月度用戶訪問量占上榜的17款圖像/設(shè)計類應(yīng)用月度總訪問量的71.3%,2024年2-10月的月平均訪問量達到6.64億次。

(4)Gemini

Gemini不僅在多模態(tài)智能測試中領(lǐng)先,還深度集成至搜索引擎、Google Assistant智能交互、Cloud AI平臺解決方案等多個谷歌產(chǎn)品中。2024年5月,谷歌大會公布Gemini模型通過產(chǎn)品推向數(shù)十億用戶,并且已有超過150萬開發(fā)者使用該模型。

(5)Character AI7

Character AI是情感陪伴的應(yīng)用,擁有眾多人氣游戲、動漫IP虛擬人物形象NPC,實現(xiàn)用戶和原IP人物互動,吸引大量二次元年輕用戶。2024年2-10月的月平均訪問量超過2億次,用戶每次訪問平均花費29分鐘,憑借在AI圈中的強大流量和高用戶粘性,有力支持社區(qū)生態(tài)繁榮發(fā)展。

2.國內(nèi)產(chǎn)品

(1)百度搜索

百度AI搜索功能已覆蓋超20%的搜索結(jié)果頁面,并且AI功能的覆蓋率接近70%,為用戶提供更加個性化和智能化的搜索服務(wù)。2024年6月,百度搜索在移動端市場份額高達69.09%,在國內(nèi)市場中占據(jù)主導(dǎo)地位。

(2)360AI搜索

360AI搜索于2024年1月底問世,基于360智腦大模型,融合了思考、搜索、閱讀、寫作和追問五大模型,展現(xiàn)出強勁增長力,領(lǐng)跑國內(nèi)AI搜索引擎市場,發(fā)布3個月后其訪問量增至1188萬次,增速達1303.09%。

(3)Kimi智能助手

Kimi智能助手于2023年10月發(fā)布,致力于提供智能化的對話和信息處理服務(wù),能夠理解和生成自然語言文本,支持文件解析和網(wǎng)絡(luò)搜索,提供問答服務(wù)、智能體服務(wù)及文件處理服務(wù)。2024年2-10月,Kimi月平均訪問量達20百萬;2024年11月,Kimi活躍用戶數(shù)已突破3600萬。

(4)文心一言

百度持續(xù)迭代文心大模型系列,相較2019年發(fā)布的1.0版本,文心大模型4.0在人工智能核心的理解、生成、邏輯、記憶方面能力全面提升,具備極強的泛化能力。2024年2-10月的月平均訪問量達17百萬,在生成式人工智能典型產(chǎn)品國內(nèi)網(wǎng)民使用率中位居第一,占比達到11.5%8。

(5)豆包大模型

豆包大模型于2024年5月15日發(fā)布,該模型日均處理1200億tokens文本,生成3000萬張圖片,豆包主力模型在企業(yè)市場定價只有0.0008元/千tokens,其價格進入“厘時代”,比行業(yè)便宜99.3%。2024年5月,豆包APP下載量突破1億,月度活躍用戶數(shù)達到2600萬,成為首個總下載量過億的AI產(chǎn)品。

表1 AI產(chǎn)品2024年2-10月平均訪問量統(tǒng)計

十大投融資

1.OpenAI宣布獲得66億美元融資

2024年10月2日,OpenAI最新一輪融資66億美元,公司估值攀升至1570億美元,確立OpenAI在全球AI領(lǐng)域獨角獸公司的領(lǐng)先地位,由Thrive Capital(13億美元)、微軟(7.5億美元)、英偉達、軟銀(5億美元)等投資機構(gòu)參與。

2.Alphabet旗下自動駕駛公司W(wǎng)aymo獲56億美元融資

2024年10月25日,Waymo完成一輪56億美元的融資,以擴大其無人駕駛打車服務(wù)。此輪融資由Alphabet領(lǐng)投,投資者對其商業(yè)化應(yīng)用潛力持樂觀態(tài)度,預(yù)計會有更多資金流入這一領(lǐng)域。

3.亞馬遜將向AI公司Anthropic投資40億美元現(xiàn)金

2023年9月,亞馬遜宣布向AI初創(chuàng)公司Anthropic投資12.5億美元,支持其開發(fā)安全可靠的通用人工智能,2024年3月追加27.5億美元的投資,使總投資額達40億美元,AWS成為Anthropic的首選云服務(wù)供應(yīng)商,Anthropic使用AWS專有的AI芯片進行未來基礎(chǔ)模型的訓(xùn)練和部署。

4.谷歌承諾向AI公司Anthropic提供20億美元資金

2023年10月,谷歌公布向人工智能公司Anthropic投資增加至20億美元的計劃,試圖加強與OpenAI主要支持者微軟的競爭。前期已對其投資5億美元,擁有Anthropic 10%的股份。

5.微軟向阿聯(lián)酋人工智能公司G42投資15億美元

2024年4月,微軟向阿聯(lián)酋的人工智能公司G42投資15億美元,微軟獲得G42的少數(shù)股權(quán),微軟總裁布拉德·史密斯加入G42董事會,G42將使用微軟的Azure云平臺來開發(fā)和部署其AI應(yīng)用,加速G42在全球的AI發(fā)展和擴張,推動在中東、中亞和非洲市場的布局。

6.月之暗面獲得超10億美元融資,公司估值超200億元

2024年2月,月之暗面A輪獲得超10億美元融資,是自ChatGPT發(fā)布3個月內(nèi)、國內(nèi)AI大模型廠商中單輪融資所獲金額最大的一項事件。5月新一輪融資過后,月之暗面已同時獲得國內(nèi)兩大互聯(lián)網(wǎng)巨頭——阿里、騰訊的數(shù)億美元融資。

7.思科公司啟動一項10億美元的AI投資基金

2024年6月4日,思科公司啟動10億美元的AI投資基金,承諾向Cohere、Mistral AI和Scale AI等公司投資近2億美元。思科在過去幾年中已進行超20項以人工智能為重點的收購和投資,并在其產(chǎn)品組合中整合人工智能技術(shù)。

8.英偉達7億美元收購一家AI Infra初創(chuàng)公司

2024年4月,英偉達以7億美元收購特拉維夫AI初創(chuàng)公司Run:ai,Run:ai專注于幫助開發(fā)者和運營團隊管理和優(yōu)化AI硬件基礎(chǔ)設(shè)施,該公司是英偉達繼69億美元收購Mellanox后在以色列金額最大的一次收購。

9.Figure AI人形機器人初創(chuàng)公司獲得6.75億美元融資

2024年2月,人形機器人初創(chuàng)公司Figure AI宣布獲得6.75億美元的融資,由微軟、OpenAI、英偉達、亞馬遜創(chuàng)始人杰夫·貝索斯等科技巨頭聯(lián)合投資,使Figure AI的估值達到26億美元。

10.微軟與韓國電信公司KT建立合作伙伴關(guān)系,未來投入2.4萬億韓元

2024年10月,微軟承諾在未來五年內(nèi)投入2.4萬億韓元(約125.28億元人民幣)推動韓國的人工智能、云服務(wù)和基礎(chǔ)設(shè)施發(fā)展。雙方計劃在2025年上半年推出基于微軟多語言GPT-4o的定制化AI模型,這些模型將用于KT的內(nèi)部和面向消費者的應(yīng)用。

十大觀點

1.阿里吳泳銘:未來大模型將驅(qū)動一切硬件

阿里巴巴集團CEO吳泳銘發(fā)文表示,大模型開啟全新的智能時代,引發(fā)人機交互、計算范式和認知協(xié)作三場革命。未來,人機交互革命將重構(gòu)一切軟件,大模型將驅(qū)動一切硬件,并催生出人形機器人等人工智能原生終端產(chǎn)業(yè)。

2.微軟比爾·蓋茨:AI智能體將成為下一個平臺

2023年11月10日,比爾·蓋茨發(fā)文《人工智能將徹底改變你如何使用電腦》,指出AI智能體將成為繼Android、iOS和Windows之后的下一個平臺,改變?nèi)伺c電腦互動方式,引領(lǐng)最大的計算機革命,并將在醫(yī)療保健、教育、生產(chǎn)力和購物娛樂等四個領(lǐng)域產(chǎn)生極大影響。

3.英偉達黃仁勛、特斯拉馬斯克等:AI的盡頭是能源

有研究估計,到2027年,整個人工智能行業(yè)每年將消耗85至134太瓦時(1太瓦時=10億千瓦時)的電力。英偉達CEO黃仁勛、特斯拉CEO馬斯克、OpenAI創(chuàng)始人山姆·奧特曼均指出,AI未來發(fā)展與光伏和儲能緊密相連。

4.艾倫人工智能研究院:AI成本每18個月下降一半,多模態(tài)時代將至

2023年12月28日,美國艾倫人工智能研究院創(chuàng)始CEO奧倫·伊奇奧尼博士表示,2024年AI發(fā)展趨勢是多模態(tài)大模型的進一步研發(fā),同時超越單純的內(nèi)容生成,向能夠完成行動的AI智能體前進。此外,芯片時代的摩爾定律在AI時代仍然適用,AI的訓(xùn)練和推理成本可能每18個月就下降一半。

5.MIT等機構(gòu):全世界AI已學(xué)會欺騙人類

2024年5月10日,來自MIT、ACU等機構(gòu)的研究人員發(fā)表在《Patterns》雜志一篇綜述文章中,描述AI系統(tǒng)欺騙性的風(fēng)險,并通過各種實例研究發(fā)現(xiàn),AI在各類游戲中,通過佯裝、歪曲偏好等方式欺騙人類來實現(xiàn)目標。

6.Meta Andrew Bosworth:AI已成為XR領(lǐng)域殺手級應(yīng)用的關(guān)鍵推動力

2023年12月25日,Meta的CTO Andrew Bosworth表示,AI已成為XR領(lǐng)域殺手級應(yīng)用的關(guān)鍵推動力。以Meta的AR眼鏡為例,其智能助手功能在推出后成為用戶最喜愛的特性,凸顯技術(shù)發(fā)展的迅速和不可預(yù)測性。

7.聯(lián)想王傳東:AI PC是打開大模型時代的第一終端

聯(lián)想集團副總裁王傳東表示,AI PC將成為打開大模型時代的第一終端,提供個性創(chuàng)作、秘書服務(wù)、設(shè)備管家等服務(wù),為人們帶來劃時代的新體驗。

8.北工大教授孫立山:交通領(lǐng)域成為AI等新技術(shù)的“練兵場”

北工大教授孫立山表示,AI為交通領(lǐng)域發(fā)展提供更多機遇,例如圖像分割技術(shù)可以通過識別圖像中的人、車輛、標牌和路基等元素,將其數(shù)字化并進行分析。未來支持交通出行的AI大模型將賦能多類場景,如交通管理部門交通監(jiān)管效率提升、交通流精準預(yù)測以及自動駕駛BEV建圖輔助等。

9.三位圖靈獎得主:倡議管理AI風(fēng)險

2023年10月28日,圖靈獎得主Hinton、Bengio和姚期智聯(lián)名發(fā)文表示,先進的AI可以為人類解決長久以來的問題,但同時也帶來巨大的風(fēng)險,呼吁全球共同通過技術(shù)、政策和法律手段來規(guī)范自主AI的發(fā)展和應(yīng)用。

10.百度李彥宏:大模型時代真正的價值在于原生應(yīng)用

2023年12月16日,李彥宏在極客公園創(chuàng)新大會2024上提出,大模型時代的來臨,真正的價值在于原生應(yīng)用,而原生應(yīng)用無論對于大廠、中小企業(yè)或創(chuàng)業(yè)者來說,都是很大的機會。

十大公司

1.國外企業(yè)

(1)Meta:從單一社交媒體互聯(lián)網(wǎng)公司成長為全球科技龍頭企業(yè)

Meta自2023年開始發(fā)力人工智能,以開源大模型Llama系列及其衍生的羊駝家族雄霸大模型開源界,有望在OpenAI閉源生態(tài)之外培育另一個龐大開源大模型生態(tài)。Meta市值從2022年3190億美元低谷翻身,2023年企業(yè)市值突破萬億美元。

(2)微軟:以Windows和Office軟件聞名的全球科技領(lǐng)航者

微軟在AI領(lǐng)域展開持續(xù)創(chuàng)新,在力推OpenAI大模型和AI工具包的同時推出自研大模型、小模型,企業(yè)主要盈利來源為云計算平臺Azure、Copilot付費服務(wù)及與OpenAI、Mistral AI等的收入分成。2024年微軟預(yù)期營收達2479億美元,市值將突破3萬億美元。

(3)英偉達:全球領(lǐng)先的GPU制造商和AI計算公司

英偉達已成為全球AI算力的主導(dǎo)者,在AI領(lǐng)域,業(yè)務(wù)遵從端到端、訓(xùn)推一體、軟件全棧布局思路,相關(guān)產(chǎn)品從下向上,主要包括AI芯片(訓(xùn)練、推理)、網(wǎng)絡(luò)(芯片互聯(lián)、設(shè)備互聯(lián))、基礎(chǔ)軟件框架和應(yīng)用軟件等。2024財年英偉達營收高達609.2億美元,同比增長126%。

(4)谷歌:全球領(lǐng)先的搜索引擎和技術(shù)公司

谷歌深耕Gemini系列大模型,在多模態(tài)智能測試中取得領(lǐng)先成績的同時,深化從搜索引擎、Google Assistant智能交互到Cloud AI平臺的企業(yè)級解決方案。2023年谷歌營收為3073.9億美元,市值突破1.76萬億美元。

(5)OpenAI:以技術(shù)創(chuàng)新為核心、致力于AGI研究的美國人工智能研究機構(gòu)

OpenAI以“創(chuàng)建造福全人類的安全通用人工智能(AGI)”作為企業(yè)核心宗旨,產(chǎn)品聚焦模型和平臺工具層,包括GPT、DALL·E、Sora等基礎(chǔ)模型、聊天機器人ChatGPT、應(yīng)用商店GPT Store及開發(fā)工具等,其中ChatGPT被視作“繼互聯(lián)網(wǎng)和iPhone之后的第三次革命”。2024年2月,OpenAI估值約為800億美元。

2.國內(nèi)企業(yè)

(1)智譜AI:源自清華、全線對標OpenAI的人工智能龍頭

智譜AI由清華大學(xué)計算機系知識工程實驗室的技術(shù)成果轉(zhuǎn)化而來,致力于打造新一代認知智能大模型,專注于做大模型的中國創(chuàng)新,推出新一代基座大模型GLM-4,整體性能逼近GPT-4。2024年9月,智譜AI估值突破200億元大關(guān)。

(2)云從科技:提供高效人機協(xié)同操作系統(tǒng)和行業(yè)解決方案的人工智能企業(yè)

云從科技致力于打通數(shù)字世界和物理世界,通過開放的人機協(xié)同操作系統(tǒng)實現(xiàn)技術(shù)平臺化,為智慧金融、智慧城市、智慧治理、智慧商業(yè)、AIGC等領(lǐng)域提供人工智能服務(wù)與行業(yè)解決方案。2023年云從科技營業(yè)收入為6.28億元,同比增長19.4%。

(3)中國電信:國內(nèi)領(lǐng)先的大型全業(yè)務(wù)綜合智能通信信息服務(wù)運營商

中國電信2019年布局大數(shù)據(jù)和AI中心,在大模型領(lǐng)域持續(xù)投入和創(chuàng)新,從基礎(chǔ)研究到行業(yè)應(yīng)用,再到開源共享,正逐步構(gòu)建起一個涵蓋基礎(chǔ)設(shè)施、生態(tài)平臺和算力服務(wù)的完整大模型生態(tài)系統(tǒng)。2024年業(yè)績半年報顯示中國電信已在32個重點行業(yè)推出星辰行業(yè)大模型,在數(shù)字治理、數(shù)字民生、數(shù)字經(jīng)濟等領(lǐng)域服務(wù)客戶超過7600家。

(4)商湯科技:專注于計算機視覺和深度學(xué)習(xí)技術(shù)的AI獨角獸企業(yè)

商湯科技致力于持續(xù)引領(lǐng)人工智能前沿研究,前瞻性打造新型人工智能基礎(chǔ)設(shè)施—商湯AI大裝置SenseCore、建立“商湯日日新SenseNova”大模型及研發(fā)體系,推動高效率、低成本、規(guī);疉I創(chuàng)新和落地。2023年商湯科技營業(yè)收入為34.06億元,同比下降10.6%。

(5)科大訊飛:深耕人工智能技術(shù)的國內(nèi)智能語音龍頭企業(yè)

科大訊飛以語音識別和語音合成技術(shù)為核心能力,打造AI大模型護城河。推出訊飛星火大模型V4.0,將其作為能力底座,對內(nèi)重構(gòu)傳統(tǒng)業(yè)務(wù)如學(xué)習(xí)機、錄音筆等,對外面向政務(wù)、工業(yè)、農(nóng)業(yè)等行業(yè)提供大模型解決方案服務(wù)。2023年科大訊飛營業(yè)收入為196.5億元,同比增長4.41%。

注釋

1.【十大行業(yè)盛典】篩選規(guī)則:AI大模型生成與權(quán)威公眾號熱點文章相結(jié)合。將三個AI大模型(Kimi、文心一言、智譜AI)回答中列舉到的發(fā)布會、AI領(lǐng)域權(quán)威公眾號(騰訊研究院、阿里研究院、智東西、量子位等)閱讀量破千的資訊解讀,與《天翼智庫》往期大模型周報做重疊交叉,篩選出十大行業(yè)盛典相關(guān)文章。

2.【十大政策】篩選規(guī)則:AI大模型生成(Kimi、文心一言、智譜AI)與Top閱讀量相結(jié)合。1)三個大模型各生成國內(nèi)外影響力重大的政策法規(guī),合并計算詞頻>1的共9條,其中被收錄至大模型周報的有5條,按照關(guān)鍵詞搜索相關(guān)政策被收錄至周報的有1條;合計6條;2)按照公眾號閱讀量Top排序,篩選其中重要的政策意見,選出4條;3)上述10條按照國際-國內(nèi)順序列出。

3.【十大技術(shù)】篩選規(guī)則:權(quán)威公眾號技術(shù)熱點詞頻統(tǒng)計。對AI領(lǐng)域權(quán)威公眾號(騰訊研究院)發(fā)布的每周大模型技術(shù)關(guān)鍵詞進行歸類匯總與統(tǒng)計,根據(jù)關(guān)鍵詞詞頻篩選出Top10大模型技術(shù),與《天翼智庫》往期大模型周報做重疊交叉,從中篩選出相關(guān)文章。

4.【十大產(chǎn)品】篩選規(guī)則:AI產(chǎn)品榜單的國內(nèi)和全球應(yīng)用訪問量和增速相結(jié)合。全球前五的產(chǎn)品分別是ChatGPT、New Bing、Text to Image、Gemini、Character AI;國內(nèi)前五的產(chǎn)品分別是百度搜索、360AI搜索、Kimi|月之暗面、文心一言|百度、豆包|抖音,與《天翼智庫》往期大模型周報和AI投資風(fēng)向標做重疊交叉,從中篩選出相關(guān)文章。

5.數(shù)據(jù)來源:https://backlinko.com/bing-users。

6.注:Text to Image入選AI產(chǎn)品榜·全球總榜(月平均訪問量)Top5,由于《天翼智庫》未發(fā)布過相關(guān)動態(tài),所以未附跳轉(zhuǎn)鏈接。

7.注:《天翼智庫》“AI發(fā)展風(fēng)向標”系列文章中有關(guān)于Character AI產(chǎn)品的較為詳細介紹,因此跳轉(zhuǎn)至“AI發(fā)展風(fēng)向標”系列文章。

8.數(shù)據(jù)來源:《生成式人工智能應(yīng)用發(fā)展報告(2024)》。

9.【十大投融資】篩選規(guī)則:根據(jù)AI投融資事件金額,在《天翼智庫》往期大模型周報和AI投資風(fēng)向標中篩選出十大投融資相關(guān)文章。

10.【十大觀點】篩選規(guī)則:Top閱讀量與權(quán)威公眾號相結(jié)合。1)按照閱讀量排序,在閱讀量>200的周報中的“觀點”部分,與騰訊研究院公眾號內(nèi)容(不限于“AI速遞”欄目)交叉對比,選出5條;2)使用Kimi大模型生成大模型發(fā)展熱點領(lǐng)域,以此作為關(guān)鍵詞篩選周報中“觀點”部分,選出5條;3)上述10條按照Top閱讀量順序列出。

11.【十大公司】篩選規(guī)則:《天翼智庫》大模型周報閱讀量排序。通過對往期《天翼智庫》大模型周報——企業(yè)對標系列文章進行閱讀量排序,分別從中篩選出國內(nèi)、國外各5家典型企業(yè)。

本文作者

趙明明

戰(zhàn)略發(fā)展研究所

二級分析師

碩士,主要研究方向為工業(yè)互聯(lián)網(wǎng)、人工智能、金融科技、產(chǎn)業(yè)數(shù)字化等領(lǐng)域。

李國欽

戰(zhàn)略發(fā)展研究所

二級分析師

中級經(jīng)濟師,聚焦產(chǎn)業(yè)數(shù)字化和數(shù)據(jù)要素等領(lǐng)域,從事行業(yè)洞察研究等相關(guān)工作。

陳曉佳

戰(zhàn)略發(fā)展研究所

二級分析師

碩士,主要從事運營商競爭研究、產(chǎn)數(shù)市場研究等。

張媛玥

戰(zhàn)略發(fā)展研究所

一級分析師

就職于中國電信研究院,長期從事人工智能、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域的技術(shù)及產(chǎn)業(yè)研究。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國移動副總經(jīng)理張冬:5G揚帆開新篇,數(shù)智遠航啟新程
精彩專題
2024通信業(yè)年終盤點
2024數(shù)字科技生態(tài)大會
2024年度中國光電纜優(yōu)質(zhì)供應(yīng)商評選活動
2024全球6G發(fā)展大會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像