11月14日,擁有千億參數的夸克自研大模型正式發(fā)布,立刻占據CMMLU榜單第一名?淇舜竽P蛯糜谕ㄓ盟阉、醫(yī)療健康、教育學習、職場辦公等多個場景。性能方面,其整體水平已經超過GPT-3.5,其中在寫作、考試等部分場景中可以超過GPT-4,成為國產大模型中名副其實的“學霸”。
評測成績顯示,夸克大模型在發(fā)布后一舉登頂CMMLU榜單,平均分達到77.08分,在社會科學和其他兩個類別中分別斬獲第一。在國內專業(yè)考試測試中,夸克大模型取得高考滿分的成績,還通過了臨床執(zhí)業(yè)醫(yī)師資格考試。一系列優(yōu)異成績的背后,是夸克在大模型技術研發(fā)方面的戰(zhàn)略定力與持續(xù)投入。經過多年發(fā)展,夸克積累的四方面優(yōu)勢,才是培養(yǎng)出這位“新學霸”的原動力。
首先,夸克大模型擁有的海量數據優(yōu)勢,基于智能化的搜索能力和自然語言處理技術,夸克擁有最完整的中文數據庫,在每天數以億計的信息處理后,能更好地理解、評估、提煉中文知識體系,了解不同用戶對工作、學習、生活上的真實需求。這些搜索請求和大數據也組成了夸克大模型的第一層優(yōu)勢。
第二,夸克在教育、醫(yī)療、文檔等垂直領域上的優(yōu)勢可以繼續(xù)在大模型領域發(fā)揮作用。目前,夸克自建及擁有各類題庫、知識點、醫(yī)療知識圖譜、書籍及出版物等資料,沉淀了非常豐富的數據及用戶場景,無論是考試資料還是硬核知識,夸克都構建了一套完整的知識內容體系,在大模型原生應用落地的過程中,將進一步提升用戶效率。
第三,夸克通過技術能力可以更好地識別知識正確性。尤其在通用知識、圖文知識、專業(yè)知識、推理知識、寫作增強等方面,夸克建立了從內容、搜索再到推理的一套可辨別知識真?zhèn)蔚募夹g體系,讓大模型提供的內容更具有準確性和專業(yè)性。
第四,就是夸克的平臺優(yōu)勢。據悉,為了實現全棧自研的技術路線,夸克搭建數百人規(guī)模的獨立產研團隊,每天處理過億級別的實時數據。同時,在搜索、教育醫(yī)療垂直業(yè)務,有行業(yè)團隊會根據用戶需求的變化,進行大模型的預訓練與精調,以幫助用戶解決生活中面臨的實際問題。
在國內大模型賽道持續(xù)火爆的當下,夸克為什么能做出千億級參數的自研大模型?夸克技術負責人表示,堅持自研大模型的研發(fā)路線是服務于夸克的業(yè)務戰(zhàn)略,也是持續(xù)推動夸克App在產品體驗創(chuàng)新和邁向新一代搜索的技術底座。
作為近年來成長速度最快的互聯網產品之一,夸克App在跨場景應用上引領行業(yè)風向。根據QuestMobile發(fā)布的《2023年輕人群智能效率應用研究》報告顯示,夸克App在泛學生人群和新生代職場人群的用戶占比最高,年輕用戶使用時長位列行業(yè)第一。
去年底ChatGPT掀起新一輪人工智能熱潮以來,業(yè)內就有觀點認為,以搜索為代表的信息服務場景是大模型開發(fā)及應用的最佳平臺。大模型產品仍在跑馬圈地,夸克大模型依托四大優(yōu)勢,發(fā)布千億級參數的大模型,或將開啟AIGC信息服務新風向,更精準、高效地滿足用戶解決實際問題的需求。