采寫 | 丁廣勝
出品 | 網(wǎng)易智能《洞見》欄目
十多款芯片問世,多起并購案,這是過去500多天里中國AI芯片的熱度。
始料未及的事件再次點燃了學界業(yè)界和整個輿論場,在人工智能技術躋身世界前列的背景之下,我們開始期待它成為中國芯片的“嫁衣”。
人工智能的概念開始伴隨著每片新品一個個拋向大眾視野。
AI芯片指專門針對AI算法的專用集成電路,不同于傳統(tǒng)的CPU、GPU,后者雖然可以用來執(zhí)行AI計算,但速度和性能都影響了商用效果。
一位芯片工程師舉例到,自動駕駛需要識別道路行人紅綠燈等狀況,但如果用當前的CPU去算,估計車翻到溝里了還沒發(fā)現(xiàn)前方是河。
而如果是GPU,速度當然快得多,但其巨大的功耗和高昂的費用依然不是AI場景理想的選擇。不僅如此,AI芯片還在場景側分為云端和終端,大量數(shù)據(jù)訓練人工神經網(wǎng)絡的場景在云端完成,追求低成本和低功耗地推理則在終端搞定。
真實需求,不缺場景,資金到位,前赴后繼的AI芯片公司紛紛上路,但造芯片可不是趕風口,設計、制造、封測整個鏈條之艱難讓無數(shù)人卻步。而且這還是一個板凳坐得十年冷的體力活。
跌宕起伏又心潮澎湃,棘地荊天又發(fā)奮為雄,這都匯聚成這批AI芯片創(chuàng)業(yè)者們的造“芯”故事。
尋找最優(yōu)解
2013年秋天,張軍是云知聲在深圳唯一的銷售人員,負責開拓白電客戶。
他經常和前來出差的聯(lián)合創(chuàng)始人李霄寒請教,怎么才能幫助傳統(tǒng)家電企業(yè)提升競爭力?起初,他們在云端提供SaaS服務,給客戶提供語音識別能力,但很快意識到這還不夠。
他們發(fā)現(xiàn)物聯(lián)網(wǎng)設備和手機不一樣,手機端的語音識別可能不是剛需,但在家居生活和獨立辦公場合,人類最自然的交互方式就會有它的用武之地。
當時的深圳辦公室只有12平方米,里面兩張桌子,三把椅子,大家頭腦風暴想做一個類似“U盤”的東西,有標準的接口,可以把它插到家電上實現(xiàn)語音交互。
2015年8月,這個后來取名叫做智能語音模塊(IVM)的產品大獲成功,一個硬件版可以標準化的對接不同的客戶,型號A和型號B都可以輕松適配,格力空調、華帝油煙機順利出貨。
深圳團隊開始搬進了大辦公室,團隊招兵買馬。
不過,短短的幾個月之后,他們又發(fā)現(xiàn)了新的問題,板子帶芯片,各種各樣的東西串起來,每個其實都不貴,但加起來成本太高了,客戶問李霄寒:你這東西如果賣一百塊錢,那只能放在高端產品上,低端產品就賣幾百塊錢,我沒法用。
怎么辦?有人提出自己造芯片,把東西集成到芯片里解決問題,但一算賬發(fā)現(xiàn),如果無法一片片攤薄,總體算下來還是貴。
這個事情經過了激烈的討論,甚至有投資人頗有怨言的找到他們說,我們投一筆錢不是特寬裕,你們拿去做芯片,大家都知道芯片高投入周期長,你們?yōu)槭裁匆觯?/P>
也不能怪投資人,被稱為“獨角獸捕手”的金沙江創(chuàng)投董事總經理朱嘯虎就有言,“中國VC不是不投芯片,之前我們投了好幾個都血本無歸。”那個時候,所有的投資人都會提到投入成本高、門檻高、周期長、回報率低。
時間到了15年下半年,團隊還是拍板要上,因為他們發(fā)現(xiàn)這里有一個尖銳的矛盾是長期不可調和的,只有足夠的算力和功能才能支撐起AI應用,但成本是主要的限制因素。
一款AI產品,有了好的底層支撐就需要高出一兩百的成本,但又想出量就必須以更低的售價,這樣還不想降低算力就只能通過芯片本身了,沒有其它解。
他們判斷這是整個IoT方向的問題,云知聲CEO黃偉說“不做芯片就是死路一條”。
對抗短期“情緒”
動手稍快的是時任百度深度學習研究院副院長余凱,他于2015年6月1日離開百度,一周之后就開始為新公司造勢“我們要做人工智能時代的英特爾”。
讓他毅然離開并火速創(chuàng)業(yè)的原因,也正是由于篤定AI的變量并不在軟件,而是處理器架構,底層計算效率和功耗不解決,應用層就會多做很多無用功。
因為隨著嵌入式處理器的功能不斷外延,質變已然發(fā)生,北京航空航天大學教授何立民曾談及,自從人工智能進入機器的深度學習時代,原有MCU的硬件加速已無法滿足高速海量數(shù)值計算要求,以及大數(shù)據(jù)的云間交互要求。
這樣一來,在嵌入式領域便出現(xiàn)了MCU與AI芯片兩個有本質差異的芯片群,前者以控制見長,后者以計算見長。
找準了方向,緊接著余凱遇到一個好消息一個壞消息。
順利的是創(chuàng)業(yè)團隊的搭建,基本上就是找老朋友老部下,吃幾頓飯挖幾圈一支三五十人的戰(zhàn)斗部隊就拉好了,團隊漲到幾百人之后遇到的管理困擾,那是后話。
壞消息是在有豪華團隊背書之下,輕松完成第一輪融資之后,接下來去哪里找錢。
在那個“人機大戰(zhàn)”還沒有到來的2015年秋天,老百姓特別是投資人根本看不懂這個家伙要做什么?余凱連續(xù)談到六七十家投資機構,無一出手。
那會兒的風口是共享單車和P2P。
以至于那場影響世界人工智能發(fā)展的“人機大戰(zhàn)”到來時,余凱積極參與并出現(xiàn)在網(wǎng)易的直播間,作為技術嘉賓講解AlphaGo,也通過這樣的機會為自己正在做的事兒正名。
2016年3月9日至15日在韓國首爾進行的圍棋比賽,AlphaGo圍棋以總比分4比1戰(zhàn)勝李世石。余凱信心大增,這意味著大多數(shù)人開始看懂人工智能和AI芯片的開始。
余凱的芯片“部隊”
他從創(chuàng)業(yè)伊始就說要堅持戰(zhàn)略判斷,不為大環(huán)境左右,這付出了不少代價,令他一直感到困惑的是,短期的情緒和競爭所造成的市場影響,在中國是被放大的,這也是為什么很多國外投資人來中國賺不到錢,他們往往低估“局部”的力量。
好在“人機大戰(zhàn)”過去的幾個月之內,地平線連續(xù)獲得了Yuri Milner、雙湖投資、青云創(chuàng)投和祥峰投資的資金馳援,并在第二年拿到了英特爾領投的超一億美金A+輪。
過冬的糧草終于備足了。
余凱說地平線做的是“反共識”的事情,百度系自動駕駛創(chuàng)業(yè)只有他們采取不同路線,這就導致談的時候處于兩個極端,要么一拍即合,要么無法正常對話,你要做的就是找到想法一致的人。
巨頭種子遇變數(shù)
2015年左右地平線和云知聲開始大量投入兵力,寒武紀雖創(chuàng)立最晚,但原始積累已早早在中科院計算所完成。
陳云霽、陳天石兄弟
2014年,身在中國科學院計算技術研究所的陳云霽、陳天石課題組就提出了深度學習處理器指令集DianNaoYu,被計算機體系結構領域頂級國際會議ISCA2016所接收,其評分排名所有近300篇投稿的第一名。
那時的模擬實驗表明,采用DianNaoYu指令集的寒武紀深度學習處理器相對于x86指令集的CPU有兩個數(shù)量級的性能提升。
陳云霽、陳天石兄弟開始嶄露頭角。
陳云霽9歲上中學,14歲進入中科大少年班,24歲取得中科院計算所博士學位,29歲晉升為研究員,33歲榮獲中國青年科技獎和中科院青年科學家獎。兄弟二人平步青云,循著同樣的步伐直到再次“交匯”。
2008年,陳云霽兄弟開始聯(lián)手打造AI芯片,利用各自的科研優(yōu)勢攻關,在此之前,陳云霽已經跟隨中國“龍芯之父”胡偉武十余年。胡偉武帶領團隊在2016年研制成功的龍芯3A3000處理器已經用在了北斗二代衛(wèi)星。
同一年,寒武紀科技公司成立并順勢推出了首款可商用的深度學習處理器寒武紀1A,這個速度早于業(yè)界。
陳天石曾說,寒武紀只有小幾百人的團隊,已經做了很多事情,全球第一款終端AI處理器落地、全球第一款多核終端AI處理器落地、中國第一顆云端人工智能芯片落地、三代終端IP產品發(fā)布。
他說難以想象AI芯片領域不誕生新巨頭,這顯示著寒武紀的勃勃野心。但很快他們需要面對的是華為自己做芯片,外界指“拋棄”寒武紀的質疑。
陳天石回應華為發(fā)布的峰值性能16T的昇騰310和寒武紀發(fā)布的MLU100沒有競爭,場景不同,峰值性能也不同,作為一家開放獨立的芯片公司,要具備寬廣的視野。
不知道這是否是他的心里話,但至少在前往巨頭路上的變數(shù)多了起來。
AI芯片是時代機遇,更是技術所需,在這波崛起潮水之中,最早開始投入研發(fā)的還屬海思,但一直被華為“雪藏”。
早在2004年,華為全資子公司海思半導體逐漸登上歷史舞臺,他們起初主攻基帶芯片、視頻編碼芯片和為自家手機打造麒麟芯片,而和AI芯片扯上關系要從2017年說起。
2017年9月初,華為在柏林發(fā)布了麒麟970,宣稱這是“全球第一枚手機AI芯片”,其中集成了寒武紀1A處理器的IP作為其核心AI處理單元。次年8月,麒麟980同樣搭載了寒武紀1A的優(yōu)化版本。
不過,從2018年10月開始,寒武紀迎來壞消息,情理之中,意料之外,“客戶”華為推出全棧全場景AI解決方案和昇騰910、昇騰310兩款AI芯片。
海思成增長率最高的芯片設計公司
在絕地求生之前,華為創(chuàng)始人任正非就計劃在芯片上投入四億美元和兩萬人,23年以來,海思的舵手何庭波從工程師直至總裁,她歷經微米到納米,再到現(xiàn)在的5納米技術。
這些積淀和努力,都成為海思在AI芯片時代的強力儲備,正在開花結實,昇騰910、昇騰310、麒麟980的下一代們正在加速度。
創(chuàng)造性和秩序性講道理
寒武紀有中科院背景,海思有華為這艘巨輪作為背靠,一千多位高級半導體專家參與本身就是超級壁壘。
而團隊的建設和磨合對于云知聲和地平線這樣的創(chuàng)業(yè)公司來說就沒那么容易了。
從2015年開始決定做AI芯片,直到2016年中才正式步入正軌,云知聲組建芯片團隊經歷了漫長而又艱難的磨合期。直到“關鍵先生”謝冠超2015年11月加入,負責整個IoT事業(yè)部,其中最重要的KPI就是造芯片。
從深圳到北京,云知聲的解決方案開始迎來徹底革新。
有了帶頭打仗的人,但作戰(zhàn)部隊還在緩慢的招聘和打磨,令彼時的管理層最為棘手的問題是算法團隊和芯片團隊的“互掐”。這是軟硬件結合的AI芯片必須經歷的陣痛,雙方在底線的邊緣瘋狂相互試探。
如果是通用芯片,成本高企且有比較大的內存和存儲空間,但一旦到了AI芯片,特別是邊緣側,多一點點東西都是成本的痛苦,那就希望算法團隊配合裁剪。
這個時候算法團隊就炸毛了,拍桌子瞪眼睛在辦公室是常事,說這個東西我已經做到極致了,而且我很忙。雙方爭執(zhí)不下,只能等老大拍板。
在老大眼里,那就是倒推,如果這款芯片成立,就必須滿足資源限制的需求;算法是你給我的資源越多,我給你的性能就越好。現(xiàn)在要做的就是確認性能水平,然后榨干每一個空間,達成和解。
在AI芯片的研發(fā)過程之中,這是團隊在每一個引擎,每一個模塊,都會遇到的事情。
余凱將這個問題歸結為理念沖突,招聘時有人問他,你做軟件就做軟件,軟硬件結合是干嘛?
他認為這是打頭陣必須經歷的“風阻”,地平線芯片團隊也在初期的相當長時間內協(xié)同工作不融洽,軟件開發(fā)強調快速迭代,而硬件強調系統(tǒng)性的程序思維。
一個快一個慢,一個講創(chuàng)造性,一個講秩序,這兩撥人有天然的對抗性。
從2015年10月,地平線第一個芯片工程師入職,第一行芯片代碼敲出,開始做前端開發(fā),經歷了寫代碼,測試代碼,畫一層一層的物理實現(xiàn)圖的過程,再到制造樣片,最終在2017年8月16日點亮。同年12月20日,第一代芯片連同基于芯片開發(fā)的多個典型應用發(fā)布。
其實,一開始芯片團隊自己都懷疑,“能成嗎?啥啥都沒有。 。但項目真正跑起來之后,團隊的信心開始愈發(fā)堅定。
在某一個關鍵的節(jié)點,為了保證芯片研發(fā)進度,據(jù)說地平線算法負責人黃暢把自己鎖在小會議室里,噼里啪啦寫了兩個星期的代碼,并在門口掛了張牌子:“封閉開發(fā)中,請勿打擾”。
兩個星期之后,拿著最終版本的算法架構,黃暢走出小會議室,黑眼圈深重,頂著凌亂的頭發(fā),眼里閃著光,“搞定了!”
磨合成熟的團隊讓地平線的芯片研發(fā)周期縮小到了22個月,不同于互聯(lián)網(wǎng)行業(yè)的快速試錯和迭代,芯片還絕對錯不得。余凱說,一款AI芯片研發(fā)成本超過5000萬美金,這對創(chuàng)業(yè)公司來講是風險極高、壓力極大的事情。
只造武器不打仗
造芯兩年,2018年5月,云知聲交出了第一代芯片“雨燕”,面向智能家居和智能音箱,在更低成本和功耗下提供更高的算力。芯片采用了ARM的架構和自主算法,選擇臺聯(lián)電代工和一家中國臺灣企業(yè)完成封測。
沒成想,黎明之前最黑暗,5月16日的芯片發(fā)布會,一度讓云知聲決定取消,因為本來就緒的芯片突然點不亮,大家驚出一身冷汗。
李霄寒迅速組織排查,發(fā)展板子圖有問題,立即改了一版重新驗證,用時一周,有驚無險。
芯片發(fā)布之后的語音功能測試也讓團隊煞費苦心,客戶大多是南方人,有次經過幾天幾夜的測試調整終于過關,但最后一群人灰頭土臉的又被打了回來,因為客戶老板的口音來自另外的更小眾的地方。
黃偉們慶祝芯片第一次點亮
李霄寒把造AI芯片的挑戰(zhàn)歸結為三個原因,首先是怎樣在整個體系架構上做到能耗比的最優(yōu),怎樣突破馮·諾依曼內存墻,其次是做好軟硬一體,最后是要理解應用場景。
云知聲是物聯(lián)網(wǎng)專用芯片,地平線是圍繞車載的智能駕駛的計算和AIoT場景的專用芯片。
不約而同的是,他們的商業(yè)模式都顯得克制,就像英特爾不會成為聯(lián)想和戴爾一樣。別人都在垂直往上做應用的時候,余凱希望能在底層呆著,往上做,等于互相之間競爭。
一個是掙整個產業(yè)鏈的錢,一個是掙平臺的錢,他們選擇后者,大家都知道做芯片只有鋪量才能活下去,盡可能的避免參戰(zhàn),只作為輸送彈藥的角色,是他們的生存之道。
余凱常言只造武器不打仗就是這個道理。
云知聲同樣,在2018年下半年開始交付芯片的時候,他們思考最多的就是交付給客戶的是什么?他們雖然不是芯片和應用都包辦,但因為物聯(lián)網(wǎng)領域的不同,他們還是會為客戶準備好諸多現(xiàn)成的功能應用。
團隊調研發(fā)現(xiàn),物聯(lián)網(wǎng)市場需要的不是一個AI芯片,而是一個應用于物聯(lián)網(wǎng)的AI功能,比如你拿出一個智能燈泡的方案,里面有一個芯片不假,但功能才是客戶看重的。
有一次,李霄寒把AI芯片拿到一個賣燈的廠家,老板看了一臉茫然地望著他,你給我這個干嘛?但他又說這個芯片還有哪些功能,芯片和軟件連同后臺服務,并且能實現(xiàn)這樣那樣的功能,老板就把他請進屋坐下來詳談了。
相比于云知聲早半年,2017年底,地平線發(fā)布了征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器。
余凱把芯片架構比作人的左腦和右腦,負責理性計算還是采用了ARM的架構,負責感性的部分被稱為BPU(Brain Processing Unit)——這是地平線自主設計的主要用于人工智能計算的部分。
征程1.0和旭日1.0芯片采用了芯片地平線第一代BPU架構“高斯”,提出算法來定義芯片,他們贊同計算機先驅、圖靈獎得主的理念“真正認真對待軟件的人應該做自己的硬件”。
創(chuàng)業(yè)四年有余,大家對軟件算法的熱情和投入依然令余凱困惑,一直以來他都堅信算法的門檻會越來越低,事實上,我們也可以看到很多純粹的人工智能算法公司正在調整航向。
熱鬧是他們的
這波AI芯片熱,做智能語音的公司最熱鬧,做計算機視覺的公司最低調。
此話怎講?資深分析師吳磊的觀點是,無論是機器人還是空調的語音控制模塊,都是新的東西,這是屬于語音領域的機會,所以他們更愿意嘗試AI芯片。
商湯、云從這類計算機視覺公司的業(yè)務并沒有創(chuàng)造出新的設備,網(wǎng)絡攝像頭或專業(yè)攝像頭都是已經在那的,他們目前是要解決數(shù)據(jù)流到服務器之后,沒有被有效利用的事情。
云從科技就是一家將重心放在計算機視覺的人工智能公司,2017年底工程技術負責人湯麗斌團隊遇到一個困擾,他們此前把算法放在PC端,這個“金貴”的PC設備又怕冷,又怕濕,又怕臟,還得有人伺候。
他們亟待找到能把算法塞到相機端的方法。
第一步是芯片選型,這個時間大概持續(xù)三個月左右,產品部和算法部進行協(xié)調,把市面上有接觸的所有符合場景需要的芯片一個一個拿到測試。
如果遇到中意的有不合適,還會和芯片供應商商量著做定制化,比如有些芯片不是專門為終端設備做的,為PC設計就不會周全的考慮緊湊環(huán)境。
而且,除非選的是通用芯片,一般專用芯片的話產品的設計和芯片的選型會同步進行,稍微滯后一點芯片。以防萬一如果芯片最后搞不定,這個產品都不用設計。大家會卡著相同的時間點把產品設計敲定。
湯麗斌還發(fā)現(xiàn),國內外的芯片企業(yè)都很優(yōu)秀,但支持速度會有些許差異,國際大廠的支持速度是國內同類型公司的三分之一,原因之一在于國際大廠會將技術需求反饋到國外總部,整體決策流程較長,而國內公司可以迅速根據(jù)客戶需求對芯片進行定制化。
2018年3月,云從科技的第一代AI智能相機“炬眼”面市,采用了英特爾的芯片,雙方在算法和硬件的功耗上成立專項做了優(yōu)化,功耗降到了15瓦,順利出貨。
幾個月之后,第二代AI智能相機提上日程,華為海思的芯片成為主要選擇,雖然成熟度還在打磨,但給湯麗斌吃定心丸的是,性能提升明顯。他們可以在產品上市前花更多精力在算法的打磨和場景功能的調研方面。
從2019年開始,湯麗斌就在不停的走訪客戶,很多銀行和他反復提及網(wǎng)點投訴率的事情,有時候客戶感到業(yè)務流程復雜、等待叫號時間長容易生氣,這個時候安撫是第一位的。
他們在廣東農行試點了一個應用,后臺可以看到網(wǎng)店有多少人,每個人頭頂會顯示一個狀態(tài),一般的等待時間上限是15分鐘,到時候如果還沒叫號,你就需要去問候一下了,或者倒杯水讓顧客的情緒降檔。
這些直抵客戶的東西,都是作為一家不造芯片的人工智能廠商,算法“就”芯片的工作。所以前期選型一款優(yōu)秀的AI芯片就至關重要。
對扎十年馬步說No
不過,同屬計算機視覺陣營的依圖還是坐不住了,幾乎在同一時間發(fā)現(xiàn)問題,一家選擇有求于人,一家選擇身體力行。
今年5月,乘著新聞聯(lián)播的預熱,創(chuàng)始人朱瓏在上海灘發(fā)布“求索”芯片,這是一顆同時兼顧云端和邊緣端場景的SoC級芯片。劍指英偉達。
依圖展示“求索”芯片性能
他們打算造芯片是在2017年2月,而后投資了AI芯片初創(chuàng)團隊ThinkForce,這家由芯片行業(yè)老兵組成的軍團讓依圖造芯路變得順暢起來。依圖提供視覺算法,ThinkForce承擔硬件研發(fā)。這印了朱瓏口中“算法即芯片”的理念。
這是一個完整的故事,終端側有海思在,依圖可能沒那么容易,但云端側他們自己就有強算力需求。
但芯片行業(yè)浸潤多年的專家,張兵的疑問是,依圖的需求能不能撐起足夠的量,如果不能,依圖既做業(yè)務又做芯片,處境還是略顯尷尬。相比完全第三方獨立做底層的寒武紀,在芯片方面更有機會。
一位已經離職的依圖工程師胡小軍和網(wǎng)易智能《洞見》說道,其實在早期朱瓏經常強調要扎十年馬步,那為什么現(xiàn)在依圖急了?
因為2017年去融資的時候,對于扎馬步這件事,投資人第一個不答應。而且現(xiàn)在依圖的營收壓力在陡增。這也許是最好的選擇。
無論怎樣,每一條道都可能通往羅馬,這是他們關于芯片的故事,也是中國芯崛起的佐證,不管前方是地雷陣還是萬丈深淵,每個人看上去都神采奕奕。
通用芯片終于到頭了。
(應被采訪者要求,吳磊、張兵、胡小軍為化名。)