48728 歷史進程中的英偉達

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
歷史進程中的英偉達
2023/09/29
成功引起自滿,自滿導致失敗,只有偏執狂才能生存。
本文來自于微信公眾號“新立場NewPosition”(ID:xinlichangNP),作者:B 哥,編輯:李凡,投融界經授權發布。

1993年4月5日(ri),黃仁勛這(zhe)天(tian)剛好滿30歲,和普里(li)姆以及(ji)馬拉喬夫斯基三人,在加(jia)州圣何塞(sai)一(yi)家(jia)連鎖餐廳里(li)討論(lun)著創業(ye)成立公(gong)司的事(shi)。

這家丹(dan)尼餐廳位于一座(zuo)立交橋旁邊(bian),環境吵(chao)鬧同時裝修簡陋,店鋪的前臉布滿了彈孔,因(yin)為(wei)路(lu)過的社會(hui)人(ren)經(jing)常(chang)朝(chao)停在門前的警車開槍。三(san)個創始人(ren)此時正拿雞蛋(dan)卷裹(guo)香腸片,就著劣質焦咖啡,英偉達就在這樣的環境下誕(dan)生(sheng)了。

黃仁勛出生(sheng)在(zai)臺南囝仔(zi),今天從這個地方往東北方向不(bu)到20公(gong)里,就是臺積電的第十八晶圓廠。

這個生產基地2017年底開工建(jian)設,預(yu)計到今年的(de)總投資額將(jiang)超(chao)過1000億美(mei)元,是臺積電最(zui)昂貴的(de)晶圓(yuan)廠,其最(zui)先進的(de)5納(na)米(mi)和3納(na)米(mi)制程在(zai)這落地。無論是英偉達的(de)RTX4000系列游戲顯卡,還是當下(xia)一卡難(nan)求的(de)H100,都在(zai)這里完成從硅到芯(xin)片的(de)關鍵轉化。兩家公司相互(hu)成就,如今共同掌握(wo)著尖頂星科(ke)技,市值合(he)計1.5萬億美(mei)元。

從成(cheng)立之日算起,黃仁(ren)勛在英偉達CEO位置上干了整整三十年。論敬(jing)業程(cheng)度(du),硅(gui)谷同(tong)行里大概(gai)少有人能(neng)出(chu)其(qi)右。

在硅(gui)谷敘事模式里(li)(li),這里(li)(li)成功的科技公司(si)通(tong)常在年輕創(chuang)始人帶領下迅速(su)成長為(wei)(wei)世(shi)界巨(ju)(ju)頭(tou),或者已(yi)經成為(wei)(wei)世(shi)界巨(ju)(ju)頭(tou)的公司(si)因為(wei)(wei)跟不上形(xing)勢(shi)而快速(su)沒落,又或者沒落后(hou)又再次憑借某(mou)個拳頭(tou)產品重新變得偉大。總之來來回(hui)回(hui),興(xing)也勃焉(yan)亡也忽焉(yan),核心就是(shi)一個快字。

以這樣的視角打量,英偉(wei)達顯(xian)然不(bu)(bu)太一(yi)樣。除了在最初創業時差點“暴斃(bi)”,英偉(wei)達在長達二十年的時間里活得相當寧靜,談(tan)不(bu)(bu)上驚(jing)艷但(dan)也沒遭遇(yu)大災大難(nan)。

直(zhi)到(dao)最近幾(ji)年,英(ying)偉(wei)達突然開掛爆種,從人工智能到(dao)加密貨幣,從元宇宙到(dao)ChatGPT,不是英(ying)偉(wei)達在追風(feng)口(kou)(kou),而(er)更像是風(feng)口(kou)(kou)失(shi)了智般往英(ying)偉(wei)達身上(shang)撞(zhuang)。

作為總設(she)計師,黃仁(ren)勛本(ben)人顯然不會認(ren)可這種說法。在(zai)他那里,英偉達的故事應該是關于技(ji)術理解(jie)、商(shang)業遠見和長期(qi)主義的絕(jue)佳范例。

頂多(duo)再加(jia)一點小小的(de)運氣。

01、東亞的風瞇了黃仁勛的眼

黃(huang)仁勛和另外兩個合伙(huo)人(ren)最終決定創(chuang)業時,有著相當樸素但又同時觸及本(ben)質(zhi)的(de)(de)思(si)考。無論(lun)電影、電視或(huo)者印刷(shua)的(de)(de)書籍(ji)報紙,抑(yi)或(huo)是(shi)音樂,這些都是(shi)人(ren)類用來表達想(xiang)法講述故事的(de)(de)媒介。

而當(dang)時(shi)正顯露雛形的(de)3D圖像技術(shu),憑借實時(shi)生成的(de)畫(hua)面和互動(dong)性,將(jiang)有可能成為(wei)下一種(zhong)新的(de)大眾媒介。

唯一的問題是此時的3D圖像任務,由于需要耗費極高的計(ji)算(suan)量,只(zhi)有使(shi)用極其龐大的專業工作(zuo)站(zhan)才能完成。而黃(huang)仁勛和英偉達想要做的,就(jiu)是把這項(xiang)技術變(bian)得足夠(gou)便宜,然后普及它。

事(shi)實上,1993年(nian)英(ying)偉達(da)成(cheng)立的時候,它是(shi)第一家嘗試把3D圖像(xiang)推向普通消費者的公(gong)司(si)。不過首先做到(dao)這件(jian)事(shi)的公(gong)司(si)并不是(shi)英(ying)偉達(da),索尼在(zai)一年(nian)零八(ba)個月(yue)后推出(chu)(chu)的初(chu)代PS游戲(xi)主(zhu)機要成(cheng)功(gong)得(de)多,在(zai)推出(chu)(chu)九年(nian)后,這款主(zhu)機出(chu)(chu)貨(huo)量突破(po)了1億臺(tai)。

另一方面,英(ying)偉達(da)前(qian)期的先發(fa)優勢很(hen)快就不復存在(zai),短短兩年(nian)時間(jian)里(li)極客(ke)遍地(di)的硅谷就冒出(chu)了90家英(ying)偉達(da)的競爭者。而在(zai)這(zhe)兩年(nian)時間(jian)里(li),市場(chang)形勢已經發(fa)生了翻天(tian)覆地(di)的變化,問題出(chu)在(zai)DRAM這(zhe)個元器件上面。

從(cong)技術原理上(shang)說,圖(tu)像在(zai)(zai)計算機內部的存儲(chu)需(xu)要(yao)消耗相(xiang)當大的空間(jian)資源。在(zai)(zai)未經壓縮的情況下,如今一張1080P的圖(tu)片(pian)含有(you)超(chao)(chao)過(guo)兩百萬像素點(dian)(1920 × 1080),按照(zhao)8比(bi)特的色深,每個(ge)像素點(dian)需(xu)要(yao)4個(ge)字節的存儲(chu)空間(jian),所有(you)像素點(dian)合計超(chao)(chao)過(guo)8M字節。而要(yao)產生動態連續(xu)的觀(guan)感(gan),屏(ping)幕上(shang)顯示的圖(tu)像還需(xu)要(yao)保持(chi)每秒多(duo)次刷新。

盡管在(zai)(zai)30年前屏幕(mu)的(de)(de)顯(xian)示規格(ge),無(wu)論是(shi)(shi)說分辨率還是(shi)(shi)色彩還沒有這么高,但存儲空間(jian)仍然是(shi)(shi)在(zai)(zai)算力之(zhi)外3D圖(tu)像技(ji)術的(de)(de)關鍵瓶頸。在(zai)(zai)英偉達成立的(de)(de)1993年,DRAM內存的(de)(de)價格(ge)在(zai)(zai)50美元/MB這個水(shui)平,主(zhu)流VGA顯(xian)示器(qi)的(de)(de)分辨率則是(shi)(shi)640*480。

即(ji)便(bian)使用當時最先進的解(jie)決方案,3D圖像顯示所(suo)(suo)需(xu)要的DRAM也得4MB,所(suo)(suo)以單(dan)單(dan)是(shi)這(zhe)塊DRAM的成本就需(xu)要200美(mei)元。

加上(shang)(shang)板上(shang)(shang)的(de)(de)控(kong)制芯片(pian)和(he)其他組(zu)件,再算上(shang)(shang)一定的(de)(de)利潤空間,最終(zhong)這些(xie)產品的(de)(de)定價得要1000美元(yuan)(yuan)往上(shang)(shang)。雖然(ran)今天游戲玩家花大(da)幾千或(huo)者上(shang)(shang)萬的(de)(de)價格買張(zhang)顯卡(ka)還處(chu)在(zai)可以理(li)解的(de)(de)范疇,但這是(shi)因為圍(wei)繞這張(zhang)顯卡(ka)已經建立(li)起了豐富的(de)(de)生態。而在(zai)30年前是(shi)沒(mei)有這么多所謂的(de)(de)3A大(da)作的(de)(de),消(xiao)費(fei)級市場不會有人愿意花這么多錢買個(ge)電(dian)子(zi)元(yuan)(yuan)件回來(lai)當擺設。

所(suo)以(yi)黃仁勛他們(men)圍(wei)繞DRAM搞了(le)技術(shu)創(chuang)新(xin),使得英偉達(da)產品需(xu)要的(de)內存(cun)空間大(da)大(da)降低,從(cong)紅杉(shan)那(nei)里融到的(de)1千萬美元很(hen)大(da)部分(fen)也都花在了(le)這個“遙遙領先”的(de)解決方(fang)案上。黃仁勛本來以(yi)為這會(hui)給他們(men)的(de)產品帶來差(cha)異化(hua)的(de)競爭力,但到創(chuang)業的(de)第二年(nian),DRAM的(de)價(jia)格(ge)就從(cong)單價(jia)50美元跌到了(le)5美元。

這(zhe)意味著英(ying)偉達前期(qi)瞄著內存優化(hua)做的巨(ju)大投入完全打了水漂。

后來的(de)(de)(de)幾(ji)乎所有文章都把英偉達NV1這款產品(pin)的(de)(de)(de)失(shi)敗,歸結到跟OpenGL路線的(de)(de)(de)三角渲染(ran)模式不兼容(rong)上(shang)面,但實(shi)際上(shang)不兼容(rong)并(bing)不是(shi)NV1失(shi)敗的(de)(de)(de)真正(zheng)原因(yin)。給(gei)NV1造成(cheng)致命打(da)擊的(de)(de)(de),是(shi)內(nei)存價格暴(bao)跌把NV1從(cong)先進(jin)變成(cheng)了不先進(jin),而(er)一款不先進(jin)的(de)(de)(de)產品(pin)并(bing)沒有機會參(can)與行業(ye)標準(zhun)的(de)(de)(de)塑造,最(zui)終的(de)(de)(de)不兼容(rong)其實(shi)是(shi)結果(guo)而(er)非原因(yin)。

DRAM價格暴跌(die)的(de)原(yuan)因是(shi)(shi)供過于求(qiu),新產能的(de)主(zhu)要貢獻者是(shi)(shi)亞洲(zhou)人。在九十年代(dai),韓(han)(han)國(guo)和(he)臺灣的(de)經(jing)濟都出(chu)現了爆發性(xing)增長,兩(liang)家的(de)經(jing)濟模式都是(shi)(shi)出(chu)口導向,支柱(zhu)產業是(shi)(shi)電子(zi)和(he)半導體。以韓(han)(han)國(guo)為(wei)例,在政府支持(chi)下,幾(ji)家財(cai)閥借助從銀行獲得的(de)貸款大量進行資本開支,生產規模迅速擴張。僅韓(han)(han)國(guo)內存行業產能在1991到1995的(de)短(duan)短(duan)幾(ji)年里(li)就增長了8.3倍。

由于行(xing)業特性(xing),內存晶圓廠需(xu)要保持(chi)很高的產能利用率才能攤平(ping)固(gu)定成本(ben)。內存廠商甚(shen)至會(hui)在(zai)明知(zhi)供給遠超需(xu)求的情況下繼(ji)續生(sheng)產,這進一步推低了產品價(jia)格。不過這些余波對黃(huang)仁勛而(er)言已經不重要了,因(yin)為此刻的英偉達要拋掉過去另起新灶了。

02、英特爾不是對手,是黑洞

在(zai)NV1發布(bu)的(de)(de)兩年后,英(ying)(ying)偉(wei)達迎來了第一(yi)款成功(gong)的(de)(de)產(chan)品:RIVA128。RIVA128這塊(kuai)產(chan)品標(biao)志著(zhu)英(ying)(ying)偉(wei)達在(zai)技術(shu)路(lu)線上的(de)(de)重大轉向,英(ying)(ying)偉(wei)達徹底放(fang)棄了之前與行業不兼容的(de)(de)解決(jue)方案(an),選擇全面擁抱Direct3D和OpenGL的(de)(de)技術(shu)規范。

這個時(shi)候3Dfx公司生產的Voodoo顯卡已經成(cheng)為行(xing)業標(biao)桿,而剛推出的RIVA128由于驅動問題(ti)在圖像(xiang)質量(liang)上跟Voodoo有明(ming)顯差距。

不過(guo)英偉達(da)通(tong)過(guo)后續的(de)固件更新,很快使RIVA128輸出(chu)的(de)圖像畫質趕(gan)上甚至超越Voodoo。在這(zhe)種情況(kuang)下,RIVA128兩個(ge)設計優勢就體現了出(chu)來。

一(yi)方面(mian)(mian),大概是(shi)前期走(zou)自主路(lu)線累積的技術基(ji)礎,英偉達在RIVA128上通過特殊的內存(cun)架構設計,使得其能(neng)夠輸出更高分辨(bian)率(lv)的圖(tu)像。另一(yi)方面(mian)(mian),跟Voodoo顯卡(ka)不(bu)同,RIVA128同時(shi)集成了(le)2D和3D圖(tu)形芯(xin)片,這使得插RIVA128的電腦不(bu)需(xu)要一(yi)張單獨的2D顯卡(ka)來處(chu)理輸出。

接下來的(de)(de)時間里(li),RIVA128及其(qi)改款產品(pin)幫助英(ying)(ying)偉達(da)(da)在顯卡市場站穩了(le)腳跟。1999年,英(ying)(ying)偉達(da)(da)發布(bu)了(le)第一款GeForce系列產品(pin):GeForce256。盡管在這(zhe)之前其(qi)實已(yi)經有了(le)類似的(de)(de)概念,但(dan)英(ying)(ying)偉達(da)(da)仍然把GeForce256稱之為“世界上第一款GPU”,GPU這(zhe)個(ge)新潮的(de)(de)詞(ci)匯走向(xiang)大(da)眾化也是從這(zhe)開始的(de)(de)。

GeForce256的確(que)算(suan)得上(shang)是一(yi)張劃時代(dai)的GPU,它第一(yi)次把多邊形轉換與(yu)光(guang)源處理(T&L)相關的幾何計(ji)算(suan)從CPU肩上(shang)解(jie)放了(le)出來。

這里我(wo)們(men)不妨(fang)對芯片特點做個簡(jian)單的科普(pu)。所有的芯片大(da)致可以分(fen)成兩個類型,通(tong)(tong)才(cai)和專才(cai)。通(tong)(tong)才(cai)類型的芯片就(jiu)是(shi)CPU,它(ta)們(men)是(shi)不折不扣的多面手,能(neng)夠執行各種通(tong)(tong)用普(pu)遍(bian)的計(ji)算任(ren)務。而GPU則更接近專才(cai),它(ta)們(men)就(jiu)像(xiang)精通(tong)(tong)某項技藝的大(da)國工匠,擅長于把聚焦范(fan)圍內的任(ren)務做到極致。

而芯片行業歷史上的(de)一個大趨勢,就(jiu)(jiu)是(shi)由(you)于(yu)摩爾定(ding)律(lv)的(de)存(cun)在,CPU能(neng)做的(de)事情越來(lai)越多,性能(neng)也越來(lai)越強。這(zhe)就(jiu)(jiu)導(dao)致很多計算任務開始是(shi)由(you)專(zhuan)有(you)設備完成(cheng)的(de),但當這(zhe)些(xie)任務變得普遍同時(shi)(shi)又趨于(yu)穩定(ding)的(de)時(shi)(shi)候,把它(ta)們集成(cheng)進CPU就(jiu)(jiu)是(shi)水到渠成(cheng)的(de)轉折。

這個(ge)過(guo)程中,CPU廠(chang)商加強(qiang)了產(chan)品競爭力(li),消費者因為集成獲得了性價比,只有(you)原來這些專(zhuan)有(you)廠(chang)商被(bei)掃(sao)進了歷史的垃(la)圾堆:通才型(xing)芯片像個(ge)黑洞一(yi)樣,把專(zhuan)才芯片吸納進去(qu)。

比如,密碼學(xue)作為現(xian)代網(wang)絡通(tong)信的(de)(de)關鍵基礎設施,初(chu)期就(jiu)是靠單獨(du)的(de)(de)集成電路(lu)實現(xian)的(de)(de),后來(lai)變(bian)成了(le)CPU的(de)(de)幾條(tiao)指令。其他像音(yin)頻卡(ka)、視頻卡(ka)之類(lei)的(de)(de)產品,也都重復了(le)類(lei)似的(de)(de)發展路(lu)徑(jing)。

在這個背景(jing)下,再來看(kan)GeForce256將(jiang)T&L計算任務從(cong)CPU那(nei)里拿過來的操作(zuo)(zuo),就(jiu)有了非同(tong)一般的象征意義。因為從(cong)行業發展方向來說,這是跟我們上(shang)面描述(shu)的“通才吸納專才”這個過程完全(quan)相反的動作(zuo)(zuo)。

作為(wei)芯(xin)片行業(ye)一(yi)個(ge)剛(gang)剛(gang)起步(bu)的(de)玩家,在(zai)看到那些同(tong)行前赴后(hou)繼(ji)的(de)悲慘命運過后(hou),黃仁勛(xun)明(ming)白只(zhi)有(you)創造獨特價值,企(qi)業(ye)才(cai)有(you)長期存在(zai)的(de)可能。

幸(xing)運的(de)(de)是,跟密(mi)碼學(xue)或者普通(tong)的(de)(de)音視(shi)頻解碼相比,3D圖像(xiang)領域有著高(gao)得(de)多的(de)(de)天花(hua)板。普通(tong)用(yong)戶總是在(zai)期待(dai)畫面(mian)質量更加精致,圖像(xiang)刷新速率更高(gao),這(zhe)帶(dai)來了(le)對(dui)GPU性(xing)能(neng)的(de)(de)追求。而反過來當GPU對(dui)現有需求進行回應后(hou),又(you)會再度激發新的(de)(de)需求,這(zhe)構成了(le)長期維持(chi)的(de)(de)正向循(xun)環激勵。

直到現(xian)在(zai),最(zui)旗(qi)艦GPU往往也只是剛(gang)好滿足最(zui)苛刻3A游戲的(de)(de)性能(neng)需求。同時(shi),像(xiang)元宇(yu)宙這類新的(de)(de)應用前景,已經因為觸(chu)及現(xian)有的(de)(de)算力瓶頸而難以到達。

所以(yi)現實(shi)的情況總(zong)是,即便核顯(xian)達(da)到(dao)了幾年(nian)前獨立GPU的性能,英(ying)偉(wei)達(da)新(xin)的GPU又與(yu)之拉(la)開(kai)了顯(xian)著的差距。對英(ying)特爾而言,在很長一段時間里它(ta)(ta)其實(shi)算不(bu)上(shang)英(ying)偉(wei)達(da)的對手,因為它(ta)(ta)并(bing)不(bu)想進入并(bing)主導GPU這(zhe)個行業,而是在等待吞并(bing)并(bing)消滅這(zhe)個行業,就像它(ta)(ta)曾(ceng)經多次做到(dao)的那(nei)樣(yang)。

03、漫長季節里長出的CUDA

到(dao)目前為止的(de)(de)30年里(li),除(chu)了創立初期那段(duan)時(shi)間,此后(hou)的(de)(de)英偉(wei)達(da)(da)(da)幾(ji)乎(hu)再(zai)也沒有遇到(dao)過生(sheng)死存亡的(de)(de)危急時(shi)刻。在把昔日巨頭(tou)3Dfx收(shou)入(ru)囊中過后(hou),GPU行業進入(ru)了英偉(wei)達(da)(da)(da)/ATI寡頭(tou)壟斷時(shi)代。隨(sui)后(hou)十幾(ji)年里(li)英偉(wei)達(da)(da)(da)的(de)(de)市場份額穩(wen)步提升(sheng)(sheng),但整體營收(shou)則在2008年達(da)(da)(da)到(dao)40億(yi)美元過后(hou),緩(huan)慢振(zhen)蕩(dang)提升(sheng)(sheng),最終在2016年才艱難到(dao)達(da)(da)(da)50億(yi)美元的(de)(de)里(li)程碑。

與(yu)之對應的(de)是(shi),在2016年之前,英(ying)偉達的(de)股(gu)價(jia)保持在10美元以下(xia)的(de)區間隨業(ye)績(ji)表現(xian)浮動。這是(shi)一段漫長的(de)季節(jie),過程中黃仁勛帶領同事做(zuo)了辛勤的(de)嘗(chang)試(shi),英(ying)偉達龐大(da)帝國的(de)地基(ji)在此期(qi)間悄然建立。

我們(men)在上(shang)個部分曾經談過,為了避免被集成,造GPU的英(ying)偉達需要跑得比(bi)造CPU的英(ying)特爾更快。這個目標是通(tong)過造更強大(da)(da)的芯片,同時向開(kai)發者群(qun)體(ti)提供(gong)更多能有(you)效利用(yong)這些(xie)強大(da)(da)芯片的工具棧來實(shi)現的。

這個群(qun)體里比例最大的(de)一(yi)部分是(shi)游(you)戲開(kai)發者,所以英偉達發明(ming)了可編(bian)程著色(se)器(programmable shader)這樣的(de)技術,來使得游(you)戲開(kai)發在畫面呈現上(shang)有(you)更多的(de)靈活(huo)度和(he)特色(se)。

黃(huang)仁勛本人把可編程(cheng)著色器視為英偉達史上最關鍵的創新之一,它擴(kuo)張了(le)行(xing)業(ye)邊界,也(ye)(ye)正是這項(xiang)技術使(shi)GPU能夠消耗掉越(yue)(yue)來(lai)越(yue)(yue)多(duo)的晶體管和算力,也(ye)(ye)就(jiu)避(bi)免了(le)被CPU或者主板(ban)上的芯片組集(ji)成吞并(bing)。

但黃仁勛的(de)技術遠(yuan)見在(zai)于,他不(bu)只是帶(dai)著英偉達沿著計(ji)算圖形這條路走(zou)到(dao)底,還(huan)很早就看(kan)到(dao)了GPU和CPU在(zai)計(ji)算范式上的(de)本質區(qu)別,并以極大的(de)耐心和勇氣為此(ci)做(zuo)了充分的(de)準(zhun)備。

人們在(zai)進入千禧年(nian)后不久,其實(shi)就已(yi)經(jing)發(fa)現摩(mo)爾(er)定律在(zai)逐(zhu)步失效,因而(er)多(duo)核CPU漸(jian)成(cheng)趨勢(shi)。發(fa)展(zhan)到今(jin)天,頂級的消(xiao)費級CPU已(yi)經(jing)堆到16個(ge)(ge)物(wu)理核心,服(fu)務(wu)器CPU甚至有(you)高(gao)達(da)128個(ge)(ge)物(wu)理核心,因此面向CPU的多(duo)線程并行編(bian)程早(zao)已(yi)變得相當普(pu)遍。

但CPU的(de)多(duo)核并行(xing)跟(gen)GPU出發點完全不同,多(duo)核CPU的(de)出現更多(duo)是為應對單核性能難以繼續保(bao)持大幅提升的(de)退而求其次,而GPU從(cong)一開始方(fang)法(fa)論就是把大問題(ti)分解成(cheng)盡可(ke)能多(duo)的(de)小(xiao)問題(ti),然后(hou)再用盡可(ke)能多(duo)的(de)“弱(ruo)”計(ji)算核心(xin)去解決這些小(xiao)問題(ti)。

舉個(ge)例子,跟如今高(gao)端消費級CPU的16個(ge)核(he)心(xin)(xin)相比,像4090這(zhe)類高(gao)端的消費級GPU擁有超過16000個(ge)核(he)心(xin)(xin),千倍(bei)的量變(bian)顯然意味著質變(bian)。

以(yi)可編程著色器為(wei)代表(biao)的(de)技術,只是上述(shu)模(mo)式在(zai)圖形計算領(ling)域(yu)的(de)應(ying)用,將其進一步推而(er)廣之至通(tong)用計算領(ling)域(yu)將有(you)更廣闊的(de)新世界,而(er)英(ying)偉達打開(kai)這(zhe)個新世界的(de)鑰匙就是CUDA。

用黃仁勛(xun)的(de)話說,第(di)一(yi)步是(shi)“make graphics programmable”, 第(di)二步則是(shi)“open up GPU for programmability for all kinds of things”。

在(zai)英偉達推出CUDA之前,GPU編程(cheng)是(shi)件非常麻煩(fan)的(de)事(shi)情,需(xu)要寫很多底層代(dai)碼。CUDA的(de)易用性使得更廣泛的(de)人群成(cheng)為開發者,釋(shi)放出GPU這個計算平臺的(de)潛力。但在(zai)英偉達的(de)每張顯卡(ka)上都嵌入對CUDA的(de)支(zhi)持是(shi)種成(cheng)本(ben)很高的(de)做法,CUDA體系的(de)研(yan)發和(he)維護也都需(xu)要巨量(liang)的(de)資源投入。

不(bu)過無(wu)論(lun)黃仁勛如何苦口婆心地闡述(shu)CUDA是項多么偉大(da)的(de)(de)創新,華爾(er)街的(de)(de)分(fen)析師們(men)并(bing)不(bu)買賬,所以英偉達(da)的(de)(de)股*長期保持在個位數(shu)美元的(de)(de)位置徘徊。站在今天往回看,當然會有人罵這群分(fen)析師身在寶山不(bu)識(shi)寶。不(bu)過分(fen)析師也有話說啊,畢(bi)竟(jing)這些年里科技公司吹過但沒實(shi)現的(de)(de)牛逼太多了(le)。

04、失敗的Tegra,成功的Orin

2013年9月5日(ri),雷軍(jun)在北京國家會議中心發布了(le)第三(san)代小(xiao)米手(shou)機。黃(huang)(huang)仁勛當(dang)(dang)時作為特邀嘉(jia)賓,也來到了(le)現場。當(dang)(dang)時小(xiao)米還沒有PC產品線(xian),黃(huang)(huang)仁勛來北京是(shi)為了(le)給旗(qi)下的手(shou)機SoC站臺,小(xiao)米3的移動(dong)版用的是(shi)英(ying)偉(wei)達Tegra4四核(he)CPU。

盡管發布會上兩人(ren)談(tan)笑(xiao)風生,但雷軍并沒有把寶全壓在英(ying)偉達上面(mian),小米3的(de)聯(lian)通和(he)電信版(ban)都用的(de)高通處理器(qi)。

這是(shi)英(ying)偉達進軍移動(dong)計(ji)算領(ling)域的(de)高(gao)光時刻,也是(shi)黃仁勛當時為(wei)英(ying)偉達尋(xun)找的(de)下個星(xing)辰大海。在智(zhi)能手(shou)機浪潮興起(qi)后,黃仁勛認為(wei)移動(dong)計(ji)算領(ling)域的(de)蓬勃需(xu)求將誘發一場革(ge)命,這最(zui)終甚至會反過來顛覆PC和服務(wu)器市場。

2011年初,黃(huang)仁勛接受科技媒體(ti)VentureBeat采訪時說到,Tegra系(xi)列芯片將會使英偉(wei)達的有效市場(chang)擴大6倍。

不(bu)過在說完(wan)這(zhe)(zhe)句話后,黃仁勛(xun)還順便跟了句諾(nuo)(nuo)基亞從(cong)塞班系(xi)統向Windows的轉型(xing)會(hui)是(shi)英(ying)偉達的“絕(jue)好機會(hui)”。除諾(nuo)(nuo)基亞之(zhi)外,Tegra芯片(pian)的另一(yi)個關鍵客戶是(shi)摩托(tuo)羅拉(la)。旗下(xia)的安卓(zhuo)平(ping)(ping)板(ban)Motorola Xoom正是(shi)使用(yong)的Tegra2芯片(pian)。在蘋(pin)果的iPad2代500美元(yuan)起售的情況下(xia),Xoom這(zhe)(zhe)款平(ping)(ping)板(ban)的定價達到了800美元(yuan)。

事后(hou)來看,這(zhe)些細節大概已然預示(shi)了英偉達Tegra產(chan)品(pin)線進入移(yi)動芯片市場將(jiang)遭受的失敗。

不(bu)過英偉(wei)達對Tegra的投入并非竹籃(lan)打水(shui),頗(po)有(you)失之東隅收之桑榆的幸運感。在最終(zhong)因(yin)為基帶(dai)問題徹底退出手機市場后,Tegra系列產(chan)品轉變了設計目(mu)標(biao),從此前(qian)瞄準功耗(hao)和效(xiao)率的表現調整到專注于(yu)性能(neng)。

典型的(de)代表(biao)產品是Tegra X1,該款芯片被(bei)用在(zai)了(le)任天堂的(de)Switch游戲主(zhu)機(ji)上面(mian),被(bei)認為帶來了(le)優質(zhi)的(de)畫面(mian)體驗(yan)。

更(geng)進一步的,研(yan)發Tegra系列芯片(pian)的過程中(zhong),英偉(wei)達積累(lei)了豐富的SoC開發經驗,這(zhe)雖然最終(zhong)沒(mei)能撬開移動市(shi)場,但卻幫助英偉(wei)達快速(su)布局了智能汽車(che)時代。在(zai)采用(yong)軟硬件全(quan)棧自研(yan)之前,特斯拉汽車(che)上就搭載的Tegra X2芯片(pian)。

同(tong)時,當前(qian)高端智能汽車上標配的(de)Orin芯(xin)片(pian)也(ye)是屬于Tegra這個系列。實(shi)際上,目前(qian)英偉達服(fu)務于駕駛輔助的(de)“Nvidia Drive”和服(fu)務于嵌入式設備自(zi)動化的(de)“Nvidia Jetson”都是基于Tegra系列芯(xin)片(pian)。

自動(dong)駕駛芯片(pian)是智能駕駛平臺的關鍵要素,在英(ying)偉(wei)達之外,高通(tong)和英(ying)特爾也對此雄心勃勃。不過(guo)就目(mu)前的形(xing)勢來說,英(ying)偉(wei)達仍然處(chu)于明顯(xian)領(ling)先的位(wei)置(zhi)。

英特爾這(zhe)邊,在(zai)(zai)以高額溢價支付153億(yi)美元(yuan)收購Mobileye過后,雖(sui)然一(yi)舉跨進了汽車零部件供應商的(de)第一(yi)陣營,但在(zai)(zai)高端(duan)產品性能上已被英偉達拉開差距。根(gen)據Mobileye向美國證監會SEC提(ti)交的(de)文件,Mobileye的(de)估(gu)值已從去年3月的(de)500億(yi)美元(yuan)大(da)幅(fu)下滑(hua)至160億(yi)美元(yuan)。而高通這(zhe)邊,在(zai)(zai)以440億(yi)美元(yuan)收購恩智(zhi)浦的(de)交易告(gao)吹后,主(zhu)要(yao)聲量更多集中在(zai)(zai)以驍龍8155為代表的(de)座艙(cang)芯片上面。

05、算法、硬件和彩票

愛(ai)迪生在1877年造出了(le)世界上第一臺(tai)留聲機,隨后這(zhe)項發明跟黑膠唱片一起,在那個(ge)(ge)年代的(de)音(yin)樂愛(ai)好者群體(ti)里(li)擴散(san)開來。但愛(ai)迪生本人(ren)(ren)對(dui)這(zhe)個(ge)(ge)現實(shi)感(gan)到沮喪和失望,因為他(ta)最初為留聲機設(she)計的(de)用途(tu)是(shi)記錄(lu)臨終(zhong)之人(ren)(ren)的(de)遺(yi)言。跟這(zhe)個(ge)(ge)設(she)想比起來,拿留聲機聽(ting)音(yin)樂這(zhe)事就有(you)點(dian)太low了(le)。

在科技史上(shang),這種不按劇(ju)本(ben)走的(de)發明其實不少,另外一(yi)(yi)個較為著(zhu)名的(de)例子是(shi)輝瑞公司研(yan)發的(de)心血管藥物(wu)西地(di)那(nei)非(fei)。這種命運(yun)的(de)奇(qi)特安(an)排(pai)有(you)時是(shi)一(yi)(yi)種捉弄,有(you)時則被證明是(shi)一(yi)(yi)種幸運(yun),就像英偉達一(yi)(yi)樣。

當然,這么說并不(bu)是要(yao)(yao)否定(ding)黃仁勛的技術眼光和商業才(cai)能,而是強調在個人奮斗的因素之外(wai),也要(yao)(yao)考慮到歷史的行程。

黃仁(ren)勛(xun)當然一(yi)直知道在電子(zi)游戲之(zhi)外,英偉達的GPU存(cun)在更多(duo)的潛力,從(cong)一(yi)種新的計算范式(shi)角(jiao)度來(lai)理解GPU,將會帶來(lai)大得多(duo)的可能(neng)。但(dan)根據福布斯2016的一(yi)篇文章,他(ta)并沒(mei)有實(shi)際(ji)上預料到(dao)深度學習會成(cheng)為GPU的爆發性(xing)應用。

深度學習(xi)的(de)基礎性工作(zuo)早在(zai)(zai)(zai)上個世(shi)紀就(jiu)(jiu)已經奠基完畢(bi):反(fan)向傳播算法最(zui)早在(zai)(zai)(zai)1963年就(jiu)(jiu)已經提出,深度卷積神經網絡則(ze)是在(zai)(zai)(zai)1979年就(jiu)(jiu)存(cun)在(zai)(zai)(zai)了。但在(zai)(zai)(zai)中(zhong)間這幾十年里(li),這些概念并沒有被發(fa)揚(yang)光大,直到(dao)我(wo)們有了足夠多的(de)數據和充分的(de)算力。

事實上,Google Brain一位(wei)叫做(zuo)薩拉·胡克的(de)(de)研究員把(ba)深度(du)學習(xi)通過現代GPU設備取得的(de)(de)進(jin)展稱之為中了“硬件彩票”。雖然薩拉那篇(pian)論文的(de)(de)核心(xin)觀點是想(xiang)提醒公眾,如今在(zai)學術(shu)界(jie)和業界(jie)取得成功(gong)脫穎而出的(de)(de)研究想(xiang)法(fa)(fa),很大可能并不是因為這些想(xiang)法(fa)(fa)本身在(zai)解決對(dui)應問(wen)題(ti)上優于其(qi)他失敗的(de)(de)idea,只(zhi)是因為這類想(xiang)法(fa)(fa)更符(fu)合現有的(de)(de)硬件環境。

她認為深(shen)度學習(xi)在GPU這(zhe)類并行計算(suan)設備(bei)幫助下取(qu)得(de)的(de)成績,或許就是例(li)子(zi)。但從薩拉的(de)觀點中(zhong)(zhong),我(wo)們顯然也可以反過來(lai)窺見一(yi)絲GPU最終被深(shen)度學習(xi)選中(zhong)(zhong)的(de)偶然性。

今天(tian)我們(men)談起深度學習(xi)的(de)(de)(de)(de)起源和(he)(he)英(ying)偉(wei)達(da)的(de)(de)(de)(de)命運拐點時(shi),總是(shi)繞不開的(de)(de)(de)(de)一個標志(zhi)性事件,即2012年Hinton及他的(de)(de)(de)(de)博士生Krizhevsky和(he)(he)Sutskever參加(jia)ImageNet圖像(xiang)識別大(da)賽(sai)時(shi),用(yong)卷(juan)積神經網(wang)(wang)絡把錯(cuo)誤率從(cong)上年度的(de)(de)(de)(de)25%一舉降(jiang)到了(le)15%。而Krizhevsky等(deng)人在訓(xun)練(lian)神經網(wang)(wang)絡模型的(de)(de)(de)(de)時(shi)候,使用(yong)了(le)兩(liang)張英(ying)偉(wei)達(da)的(de)(de)(de)(de)GeForce游戲(xi)顯卡學習(xi)了(le)120萬張圖片。

但Krizhevsky等人并不是第(di)一個(ge)使用(yong)GPU來(lai)訓練深度神經(jing)網絡的(de)學者(zhe)。吳恩達(da)的(de)斯坦福團隊(dui)在(zai)2008年就寫了一篇《Large-scale Deep Unsupervised Learning using Graphics Processors》的(de)論文,里(li)面提到用(yong)GPU可以大幅(fu)加速神經(jing)網絡模型的(de)學習(xi)過程。

然而直到2013年(nian)的(de)(de)英(ying)偉達(da)(da)GTC大會上,黃仁(ren)勛(xun)(xun)演講時(shi)的(de)(de)keynote里都(dou)基本沒有怎么提AI。要(yao)等(deng)到第二年(nian)的(de)(de)GTC,我們才會看到黃仁(ren)勛(xun)(xun)把人工智能(neng)領域(yu)看作英(ying)偉達(da)(da)最關鍵的(de)(de)業(ye)務。

這也說明黃仁勛并(bing)非一開始就(jiu)推all in AI,而是(shi)在業界已(yi)然形成風氣后才做這件事(shi)。不過即(ji)便(bian)從這時(shi)間節點上(shang)來說,英偉(wei)達的動(dong)作也算相當早了。

當然,如之前所說,沒有精準預見(jian)AI會(hui)在(zai)多年后(hou)成(cheng)為英偉達的(de)帝國基座(zuo),并不影響黃仁勛(xun)的(de)偉大。

某種程(cheng)度上(shang)說(shuo),從最初沿(yan)著圖像計算這(zhe)個方向的(de)(de)(de)創新,到后來圍繞(rao)CUDA建(jian)立的(de)(de)(de)技術生態,英(ying)偉達的(de)(de)(de)布(bu)局(ju)注定將會(hui)長(chang)出(chu)驚艷(yan)的(de)(de)(de)果實。黃仁勛沒(mei)有(you)預(yu)料到這(zhe)個果實具體會(hui)是什(shen)么,但他知道它一(yi)定會(hui)長(chang)出(chu)來。

最(zui)新(xin)的(de)二(er)季度財報顯示(shi),英偉達(da)本季營(ying)收(shou)(shou)達(da)到(dao)了(le)破紀錄的(de)135.1億美(mei)元,同比增(zeng)長101%。其中,最(zui)大貢(gong)獻為數據中心(xin)業務,當季業務收(shou)(shou)入(ru)為103.2億美(mei)元,同比增(zeng)長171%,同創(chuang)下(xia)歷史新(xin)高。即便在(zai)之前的(de)業績指引(yin)里,已經預料到(dao)這(zhe)個季度營(ying)收(shou)(shou)和(he)利潤會爆(bao),但管理層和(he)華爾街都沒想到(dao)會爆(bao)的(de)這(zhe)么厲害。

自(zi)2021財年Q2數據(ju)中(zhong)心營收超(chao)過游(you)戲(xi)業務以來,前(qian)者日益成(cheng)為英偉(wei)達業績的壓艙(cang)石。二季(ji)度數據(ju)中(zhong)心業務收入(ru)(ru)占(zhan)總收入(ru)(ru)的比例(li)從去年同期的35%上升到了76%。

如果要(yao)提英(ying)偉達近(jin)幾(ji)年(nian)唯一經歷的一個挫敗,大(da)概(gai)就(jiu)是2020年(nian)對Arm公司的收購因監管(guan)原因告吹(chui)。

我們之前在第(di)二部分(fen)里提到過,從芯(xin)片(pian)的分(fen)類來說,英特爾(er)和(he)英偉達分(fen)別處于通(tong)才和(he)專才兩端。當(dang)下數(shu)據中(zhong)心(xin)的發(fa)(fa)展趨(qu)勢(shi)是(shi)系(xi)(xi)統集成(cheng)程度越(yue)(yue)來越(yue)(yue)高(gao),越(yue)(yue)來越(yue)(yue)往SoC的方向發(fa)(fa)展,芯(xin)片(pian)公(gong)司需要整合CPU和(he)GPU,就像蘋果在消費(fei)者業務里M系(xi)(xi)列芯(xin)片(pian)做的那樣。

而隨著數(shu)據中(zhong)心業務對于兩家公(gong)司的重要性不(bu)斷提(ti)升,二者都在試(shi)圖彌補(bu)自身的短板(ban)。

英(ying)特爾(er)一直(zhi)都是(shi)做(zuo)CPU的(de)(de),它需要(yao)往專才的(de)(de)方向靠,所以(yi)過去(qu)幾年接連收購了(le)Altera、Mobileye、Habana Labs等公司;而英(ying)偉(wei)達一直(zhi)都是(shi)做(zuo)GPU的(de)(de),所以(yi)它需要(yao)往通(tong)才的(de)(de)方向靠,這(zhe)構成了(le)它收購Arm的(de)(de)基本邏輯。另(ling)外,從這(zhe)個(ge)角度看,AMD由(you)于在(zai)很早之前就收購了(le)ATI,有(you)著(zhu)多年CPU和GPU兩方面的(de)(de)打螺絲經驗(yan),所以(yi)理論上說它其實有(you)些獨特的(de)(de)優勢。

當然(ran),這樁收購案告吹的最大受(shou)害者可能是孫正義,即便他(ta)剛從(cong)Arm上(shang)市中回(hui)了波血。

當時軟銀(yin)因終(zhong)止收(shou)購獲(huo)得(de)的(de)12.5億美(mei)元(yuan)分手費,對于本來(lai)(lai)可能獲(huo)得(de)的(de)收(shou)益來(lai)(lai)說(shuo)顯得(de)不值(zhi)一(yi)提。因為2020年(nian)的(de)時候(hou)英(ying)偉達(da)的(de)收(shou)購要約是120億美(mei)元(yuan)現金(jin),加上215億美(mei)元(yuan)的(de)英(ying)偉達(da)股*。如果按照最新(xin)市(shi)值(zhi)計算,這筆交易的(de)價值(zhi)已經在千億美(mei)元(yuan)規模。這樣(yang)看,孫正義(yi)愿景基金(jin)上個(ge)財年(nian)虧損的(de)320億美(mei)元(yuan),或許都有(you)機會找補回來(lai)(lai)。

06、寫在最后

英特爾的創始員(yuan)工和第三任(ren)CEO安迪·格魯夫曾(ceng)說過一句話(hua),“成功引起(qi)自滿(man),自滿(man)導致失(shi)敗,只有偏執狂才能生存”。

我們(men)很(hen)難說這是否道出了英特(te)爾(er)錯失新浪(lang)潮的原因,但可以(yi)確定的是,黃仁勛的偏執(zhi)是今天成就(jiu)英偉(wei)達的關鍵。在商(shang)業和技(ji)術兩方面,他(ta)都稱得(de)上是天才。

在(zai)目所能及的(de)(de)范圍(wei)內,當下的(de)(de)英偉達(da)還沒有與之匹敵的(de)(de)對手。但(dan)萬億英偉達(da)所昭示的(de)(de)簡單(dan)事實是,它(ta)正處在(zai)一條前途光明但(dan)又令人趨之若鶩的(de)(de)賽道上(shang)。谷歌亞馬(ma)遜(xun)微軟(ruan)這些大(da)廠都(dou)在(zai)嘗(chang)試自(zi)己設計的(de)(de)AI加速芯片,瞄(miao)準(zhun)自(zi)動駕駛和其他(ta)AI算力的(de)(de)創業公(gong)司(si)如雨后(hou)春筍,而已被甩(shuai)在(zai)身后(hou)的(de)(de)AMD和英特爾更有充分的(de)(de)可(ke)能卷土(tu)重來。

黃仁勛仍需帶領英(ying)偉達的同志(zhi)繼續保(bao)持謙(qian)虛謹慎(shen)、不驕不躁的作(zuo)風。

芯片 顯(xian)卡 英偉達
評論
還可輸入300個字
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微信訂閱