2024年大模型被焦慮裹挾,不再飛躍的技術(shù)、快要耗盡的數(shù)據(jù)、尚未出現(xiàn)的超級(jí)應(yīng)用……給這一年留下了遺憾,也為2025年大模型的發(fā)展定了調(diào)。
ChatGPT面世至今,大廠和創(chuàng)業(yè)公司高強(qiáng)度競(jìng)爭(zhēng)三年,差異化打法逐漸形成,談參數(shù)的越來(lái)越少,聚焦變現(xiàn)的越來(lái)越多,一個(gè)可對(duì)標(biāo)甚至超越移動(dòng)互聯(lián)網(wǎng)繁榮的大模型收獲季被期待。這場(chǎng)追逐中,更適應(yīng)市場(chǎng)的服務(wù)商和產(chǎn)品正在出現(xiàn),實(shí)實(shí)在在的數(shù)據(jù)是參考:1—9月,國(guó)內(nèi)原生AIGC(人工智能生成內(nèi)容)App月活規(guī)模從3303萬(wàn)漲到7913萬(wàn)。
視頻必爭(zhēng)
斑駁的星球表面,升騰的飛船蒸汽,導(dǎo)演葉錦添的AIGC作品《快遞員》講述了外星快遞員Lili的一次冒險(xiǎn)。在導(dǎo)演李少紅的AI短片《花滿渚》中,太平公主、秀禾等經(jīng)典女性角色被AI技術(shù)串聯(lián)。2024年最后一個(gè)月,國(guó)內(nèi)九位導(dǎo)演把AI視頻類型從科幻類型擴(kuò)展到親情、動(dòng)畫(huà)等更多方向。
年初到年末,視頻模型的風(fēng)將大廠和創(chuàng)業(yè)公司都拉進(jìn)這個(gè)賽道,字節(jié)跳動(dòng)、生數(shù)科技、快手先發(fā)制人,全年幾乎每個(gè)月都有視頻大模型的新動(dòng)作曝光。最新消息是快手的可靈AI更新至1.6版本,累計(jì)生成超6500萬(wàn)個(gè)視頻和超1.75億張圖片,騰訊混元大模型視頻生成功能“姍姍來(lái)遲”,字節(jié)跳動(dòng)的豆包視頻生成模型將于2025年1月正式對(duì)外開(kāi)放服務(wù)。
事實(shí)是,“還是會(huì)‘無(wú)中生有’”,“主體一致性問(wèn)題讓人頭大”,不是每個(gè)人都能熟練掌握視頻大模型。
“視頻生成的門(mén)檻還是挺高的,文生視頻的成功率不高,圖生視頻更主流!彬v訊混元多模態(tài)生成技術(shù)負(fù)責(zé)人凱撒告訴北京商報(bào)記者。
在和新壹科技副總裁毛木子交流時(shí),他也表示,“目前視頻生成模型市場(chǎng)仍處于起步階段,技術(shù)和應(yīng)用在不斷探索和完善中,市場(chǎng)參與者相對(duì)有限,產(chǎn)品迭代速度自然不如成熟市場(chǎng)快。從用戶體驗(yàn)視角看,雖然視頻生成模型迭代升級(jí)幅度可能不算大,但用戶對(duì)于高質(zhì)量、個(gè)性化視頻內(nèi)容的需求卻不斷增長(zhǎng),這進(jìn)一步增加了視頻生成模型的技術(shù)難度和研發(fā)成本”。
面對(duì)一個(gè)新工具,使用者都要經(jīng)歷一段學(xué)習(xí)期,本就具有視頻制作功底的人知道“釘子”在哪里,只需要與“錘子”磨合,于是博納影業(yè)(6.450, -0.21, -3.15%)與抖音合作推出AI科幻短劇《三星堆:未來(lái)啟示錄》,快手推出AI奇幻短劇《山海奇鏡之劈波斬浪》。
質(zhì)量的提升是顯而易見(jiàn)的,北京師范大學(xué)藝術(shù)與傳媒學(xué)院講師王廷軒在線下分享“2024大學(xué)生AI藝術(shù)季”內(nèi)容時(shí)向北京商報(bào)記者透露,“在影像品質(zhì)上AI作品基本會(huì)在一個(gè)水平線上;诨镜膶徝溃珹I可以讓一個(gè)相對(duì)業(yè)余的人只經(jīng)過(guò)一些簡(jiǎn)單的訓(xùn)練,作品就超過(guò)以往”。
對(duì)于2025年,毛木子的判斷是,“視頻生成賽道會(huì)更加注重內(nèi)容真實(shí)性和連貫性,以及個(gè)性化需求的滿足,在應(yīng)用場(chǎng)景上也將不斷拓展,廣告制作、影視創(chuàng)作到企業(yè)宣傳等領(lǐng)域都將受益于此。企業(yè)也會(huì)通過(guò)提供API接口、定制化服務(wù)等方式,將視頻生成技術(shù)應(yīng)用于更多場(chǎng)景中,實(shí)現(xiàn)盈利增長(zhǎng)”。
“數(shù)據(jù)墻”待解
和文生圖、文生文相比,視頻生成模型需要處理的信息量更多,這是技術(shù)突破難點(diǎn)。在整個(gè)大模型賽道,圍繞信息和數(shù)據(jù)要解決的問(wèn)題,也絕對(duì)算得上是熱門(mén)話題。
“2024年,全球訓(xùn)練大語(yǔ)言模型的效果普遍不及預(yù)期,可能已經(jīng)撞上‘?dāng)?shù)據(jù)墻’!睘榱俗C明這個(gè)結(jié)論,中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏拿OpenAI、Anthroipc等舉例,甚至直言大模型競(jìng)賽的上半場(chǎng)已經(jīng)進(jìn)入“垃圾時(shí)間”。
一個(gè)普遍的共識(shí)是過(guò)去30年來(lái)互聯(lián)網(wǎng)上積累的數(shù)據(jù),將在未來(lái)3—5年內(nèi)被AI耗盡!靶袠I(yè)要‘卷’合成數(shù)據(jù),也需要謹(jǐn)慎。”何寶宏說(shuō)。
談到Scaling Law(規(guī)模定律)放緩時(shí),創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù),獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶星空董事長(zhǎng)傅盛,月之暗面創(chuàng)始人楊植麟等都提到了數(shù)據(jù)。
“當(dāng)Scale(規(guī)模)差不多時(shí),更多算力可能并不一定能直接解決問(wèn)題,核心是高質(zhì)量的數(shù)據(jù)沒(méi)那么多了!睏钪谗胝f(shuō)。李開(kāi)復(fù)發(fā)問(wèn),“當(dāng)人類寫(xiě)的文字全部用于模型訓(xùn)練后,人類一年還能寫(xiě)多少字?用合成數(shù)據(jù)、多模態(tài)數(shù)據(jù)都是可嘗試的方向,但這些數(shù)據(jù)的價(jià)值仍然不如原始的高質(zhì)量文本數(shù)據(jù)”。傅盛直接捅破窗戶紙,“大模型行業(yè)競(jìng)爭(zhēng),真正的競(jìng)爭(zhēng)壁壘來(lái)自于數(shù)據(jù)”。
企業(yè)已經(jīng)在行動(dòng),7月騰訊推出了一個(gè)名為Persona Hub的合成數(shù)據(jù)生成器,螞蟻在11月上線AI數(shù)據(jù)合成與生產(chǎn)平臺(tái)AIGD,通過(guò)大規(guī)模合成互聯(lián)網(wǎng)所不覆蓋的高質(zhì)量、高價(jià)值垂直語(yǔ)料數(shù)據(jù),幫助科技廠商進(jìn)行AI模型訓(xùn)練。
但多個(gè)問(wèn)題擺在眼前,確保這些AI生成數(shù)據(jù)的準(zhǔn)確性和無(wú)偏性是一個(gè)關(guān)鍵挑戰(zhàn),合成數(shù)據(jù)會(huì)否破壞AI模型?到底多少合成數(shù)據(jù)才算過(guò)量?需要時(shí)間給出答案。
獵豹移動(dòng)切入數(shù)據(jù)的角度不太一樣,獵戶星空首席科學(xué)家韓堃告訴北京商報(bào)記者,“合成數(shù)據(jù)確實(shí)是一個(gè)很重要的補(bǔ)充,但僅僅使用合成數(shù)據(jù)肯定是不夠的”。獵豹移動(dòng)將重點(diǎn)放在大模型數(shù)據(jù)服務(wù)上,比如數(shù)據(jù)收集、清洗、標(biāo)準(zhǔn)、提示詞工程及評(píng)估等服務(wù)。它們也有靠經(jīng)驗(yàn)才能得到的答案,比如人工和機(jī)器處理數(shù)據(jù)的比例。
應(yīng)用大爆發(fā)
不管是合成還是服務(wù),從另一個(gè)角度看,大模型公司正在告別同質(zhì)化競(jìng)爭(zhēng),分散尋找價(jià)值洼地。
大模型“六小虎”(包括零一萬(wàn)物、百川智能等六家獨(dú)立大模型初創(chuàng)公司)的行動(dòng)很快!拔蚁朐龠^(guò)三年,六小虎中有些可能已經(jīng)變成‘龍’,有些變成‘狼’,有些變成‘兔子’了!崩铋_(kāi)復(fù)預(yù)測(cè),“相信六小虎都會(huì)找到務(wù)實(shí)的、獨(dú)特的、有價(jià)值的方向。大廠有必須要做的事情,我們不應(yīng)該用大廠的模式跟它們競(jìng)爭(zhēng),要找到自己擅長(zhǎng)的方向,做得比它們好,做大廠不會(huì)馬上會(huì)做的事情!彼傅木褪谴竽P偷穆涞貞(yīng)用。
和之前幾次互聯(lián)網(wǎng)風(fēng)口相比,差異化來(lái)得似乎更早一些,方向也更多元。百川智能創(chuàng)始人王小川的愿望是,“用AI大模型造醫(yī)生”;零一萬(wàn)物的解決方案當(dāng)下主要面向電商直播、辦公會(huì)議等場(chǎng)景;智譜B端的中標(biāo)項(xiàng)目讓人羨慕……
創(chuàng)業(yè)公司希望避開(kāi)大廠的射程,大廠則在想辦法既靈活又厚實(shí)。12月中下旬,阿里旗下的AI應(yīng)用“通義”被曝將正式從阿里云分拆,并入阿里智能信息事業(yè)群;通義to C方向的產(chǎn)品經(jīng)理以及相關(guān)的工程團(tuán)隊(duì),一并調(diào)整至阿里智能信息事業(yè)群。調(diào)整后,通義PC及App團(tuán)隊(duì)與智能搜索產(chǎn)品“夸克”平級(jí),原有的通義實(shí)驗(yàn)室仍留在阿里云體系內(nèi)。
雖然阿里集團(tuán)和阿里云就此均未回應(yīng),但沖刺的信號(hào)不言而喻。
百度更不用說(shuō),創(chuàng)始人李彥宏早就喊出:智能體是AI應(yīng)用的最主流形式,即將迎來(lái)爆發(fā)點(diǎn);百度不是要推出一個(gè)“超級(jí)應(yīng)用”,是要幫助更多人更多企業(yè)打造出數(shù)百萬(wàn)“超級(jí)有用”的應(yīng)用。預(yù)計(jì)到2028年,中國(guó)AI Agent(智能體)市場(chǎng)規(guī)模將激增至8520億元,年復(fù)合增長(zhǎng)率達(dá)72.7%,銀河證券的預(yù)測(cè)只是佐證之一。
不久前,全國(guó)工業(yè)和信息化工作會(huì)議強(qiáng)調(diào),2025年要加強(qiáng)通用大模型和行業(yè)大模型研發(fā)布局和重點(diǎn)場(chǎng)景應(yīng)用?梢灶A(yù)見(jiàn),中國(guó)科技公司擅長(zhǎng)的應(yīng)用大戰(zhàn)蓄勢(shì)待發(fā)。