48382 60億手機用戶,大模型的刺激戰場

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
60億手機用戶,大模型的刺激戰場
鋅產業 ·

山竹

2023/08/12
大模型從未離開過智能手機這一刺激戰場,大模型也將繼續在擁有超過60億用戶的智能手機上繼續“強化學習”。
本文來自于微信公眾號“鋅產業”(ID:xinchanye2021),作者:山竹,投融界經授權發布。

2023年過(guo)去(qu)幾(ji)個月里,高通(tong)一直在鼓吹手機大模型。

就好(hao)像(xiang)是要用行(xing)動證(zheng)明,大(da)模(mo)型這件事兒(er),不能只(zhi)肥了英偉(wei)達(da),高(gao)通也要分杯羹。

高通著(zhu)急(ji)是有原(yuan)因的,畢竟智能(neng)手機市場已經觸頂,XR市場還未起量(liang),高通剛剛公布的三季度財報中(zhong)“智能(neng)手機芯片(pian)銷(xiao)量(liang)下降25%,QCT部門銷(xiao)售(shou)額同比下降24%”格外顯眼(yan)。

這與英(ying)偉達H10043萬張的供給(gei)缺口形成了鮮(xian)明的對比。

于是,我們看到(dao),今年2月,高通官方YouTube發布了一(yi)(yi)則40秒(miao)的“短(duan)視頻(pin)”,在這(zhe)個視頻(pin)中,高通為一(yi)(yi)部有明顯驍龍(long)標識(shi)的安卓手機裝上了StableDiffusion,并用14.42秒(miao)生成了一(yi)(yi)張(zhang)AI圖片。

StableDiffusion是(shi)當下(xia)最火的AI繪圖(tu)軟件,也(ye)是(shi)一個(ge)擁有10億參(can)數的大(da)模型。

不過(guo),10億級參數的(de)StableDiffusion顯(xian)然無(wu)法與(yu)如今(jin)千億級參數的(de)GPT-3.5、萬億級參數的(de)GPT-4相(xiang)提并論。

高通(tong)的(de)目標自然也不(bu)止于此(ci),高通(tong)隨后(hou)不(bu)僅又在手機(ji)上演示了15億參數的(de)ControlNet,還多次對外布道,“年內將在手機(ji)上支持100億級大模型。”

就在(zai)英偉達顯(xian)卡賣瘋了的(de)這(zhe)一年,看似與大模型(xing)中間隔著(zhu)無數張H100的(de)手(shou)機,開(kai)始要上大模型(xing)了。

然而,手機上(shang)大(da)模型這(zhe)件事兒,可(ke)能遠(yuan)沒(mei)有你想得那(nei)么高級(ji),但遠(yuan)比(bi)你想得要(yao)(yao)重要(yao)(yao)。

01

谷(gu)歌將“小(xiao)模型(xing)”裝進手機里

2017年(nian)7月,谷歌(ge)母(mu)公司(si)Alphabet宣布,接任谷歌(ge)CEO一(yi)職兩年(nian)的SundarPichai正式進(jin)入董事會(hui)。

對于Pichai來說(shuo),這無(wu)疑是對他(ta)過去兩年工作(zuo)最(zui)大的肯定。

而就在兩個月前(qian)的谷歌(ge)I/O2017大會上(shang),Pichai剛剛宣布,接下來,谷歌(ge)公(gong)司(si)戰(zhan)略(lve)將從(cong)“Mobilefirst”轉向(xiang)“AIfirst”,AI開始上(shang)升為谷歌(ge)的公(gong)司(si)戰(zhan)略(lve),這時距離谷歌(ge)收(shou)購DeepMind剛剛過去三年(nian)。

60億手機用戶,大模型的刺激戰場

這一年發(fa)生的另一件奠(dian)定了谷(gu)歌在(zai)AI領(ling)域江湖地(di)位的事兒是,谷(gu)歌大(da)腦團隊在(zai)發(fa)表(biao)的《AttentionIsAllYouNeed》中創造性地(di)提出了Transformer架構。

這一架構不僅成(cheng)為(wei)后來人工智能和自然語言技(ji)術發展(zhan)的(de)基石,也直接促使OpenAI團隊開創了如今的(de)ChatGPT盛世。

不過,這(zhe)些(xie)不是我們今(jin)天要(yao)討論的(de)重點,我們今(jin)天要(yao)討論的(de)是谷歌在這(zhe)一(yi)年(nian)另一(yi)項,對于手機這(zhe)樣的(de)終端設備影響深遠的(de)AI突破——聯邦學習(FederatedLearning)。

機器學習是人工智(zhi)能(neng)的主(zhu)流研究(jiu)方(fang)法,然而,以往將這樣的人工智(zhi)能(neng)能(neng)力(li)應用(yong)到(dao)終端(duan)設(she)備上時,通(tong)常(chang)需要經歷一個“終端(duan)數據收集-發送數據到(dao)云端(duan)-云端(duan)模型訓練-終端(duan)執行(xing)決(jue)策”這樣一條長鏈路(lu)。

究(jiu)其原因(yin),是因(yin)為終端(duan)設(she)備算(suan)力(li)和存儲資源(yuan)都極為有(you)限,要在(zai)手機這樣的終端(duan)上進(jin)行(xing)AI模型(xing)訓練不現(xian)實。

不過,谷歌并不這么想(xiang),他們通(tong)過一(yi)個(ge)頗為討巧的方法——端云協同(tong),嘗試在終(zhong)端上研究人工智能技術。

2017年(nian)4月6日(ri),谷歌(ge)(ge)在官方博客中更新了一篇文章——《FederatedLearning:CollaborativeMachineLearningwithoutCentralizedTrainingData》,在這篇文章中,谷歌(ge)(ge)AI科(ke)學(xue)家指出:

“在(zai)(zai)手(shou)機從云端下載AI模型(xing)后,在(zai)(zai)手(shou)機上,通過手(shou)機上的(de)數據(ju)訓練并(bing)改(gai)(gai)(gai)進模型(xing),改(gai)(gai)(gai)進部分被單獨總(zong)結(jie)并(bing)發(fa)送回(hui)云端,用于改(gai)(gai)(gai)進云端‘大(da)模型(xing)’。

這(zhe)其中,所有訓練數據(ju)都(dou)保留在手機本(ben)地,不再單獨(du)更新并存(cun)儲到云端(duan)。”

聯(lian)邦學(xue)習的(de)模(mo)式(shi),優(you)點在(zai)于解決了人工(gong)智能研究過程中的(de)數據安全問題(ti),但是(shi)并沒有從根本上解決本地設備算力、存儲資(zi)源(yuan)受(shou)限的(de)問題(ti)。

在聯邦學習框(kuang)架(jia)之下(xia),最初下(xia)載到(dao)本地(di)設備的(de)(de)AI模(mo)型(xing)和云(yun)端AI模(mo)型(xing)是一個(ge)同樣大(da)小的(de)(de)模(mo)型(xing),好在谷歌當時找到(dao)了(le)一個(ge)恰好符合這(zhe)一方法的(de)(de)應用場景——手機輸入(ru)法。

谷歌當時(shi)是基于自家的(de)Gboard輸入(ru)法做(zuo)了一(yi)個端側系統中(zhong)的(de)推薦(jian)引擎,當你用手(shou)機的(de)Gboard輸入(ru)一(yi)個字母或單詞時(shi),推薦(jian)引擎會根據你的(de)歷史(shi)使用數據推薦(jian)相應的(de)關聯內(nei)容給你。

這樣的功能在(zai)諸如百度(du)輸入法、搜狗輸入法等各(ge)類輸入法中(zhong)已經得到(dao)了廣泛使(shi)用(yong),也(ye)在(zai)潛移默化中(zhong)改變著(zhu)我們的手機(ji)使(shi)用(yong)習慣。

例如現在(zai)越來越多人(ren)在(zai)手機上已經(jing)習慣了使用九宮格輸入(ru)法(fa),背(bei)后少不(bu)了這種推薦引擎帶來的(de)便利(li)和魔力。

不過,手機輸(shu)入法涉及的單詞量(liang)有限,通常一門(men)語言的常用(yong)單詞量(liang)在1萬個左右(you),有國(guo)內研究團隊預測,谷(gu)歌(ge)當時推(tui)(tui)出的這(zhe)一輸(shu)入法推(tui)(tui)薦引擎模型體積可能只有約1.4MB大小(xiao)。

因而(er),嚴格意義上(shang)來說(shuo),谷歌六(liu)年前提出的聯邦學習,實際上(shang)只是將占用(yong)資源(yuan)量有限的“AI小模(mo)型(xing)”裝進(jin)了手機(ji)里。

谷歌的聯邦學(xue)習,只(zhi)是驗證了端側AI的可行性(xing),邁出(chu)了端側AI的“一小(xiao)步”。

02

超越“小(xiao)模(mo)型”

就(jiu)在(zai)谷歌提出聯邦(bang)學習不久(jiu),由于其在(zai)隱(yin)私性和安全(quan)性上(shang)的突出表現,使得它在(zai)金融領域得到(dao)了廣泛應用。

與此同時,端側AI的(de)發(fa)展(zhan),也并沒有停(ting)在“AI小模型”上。

上(shang)海交大(da)吳(wu)帆教授團(tuan)(tuan)隊是從2019年開始(shi)研究(jiu)端側(ce)人(ren)工智(zhi)能技(ji)術,吳(wu)帆教授團(tuan)(tuan)隊當(dang)時是與阿里(li)的團(tuan)(tuan)隊基于手機淘寶的應用(yong)需(xu)求,做的偏應用(yong)性的技(ji)術研究(jiu)。

每當你在(zai)手機上打(da)開京東或淘寶等線上購(gou)物平臺時,第一屏上總會出(chu)現你最近搜(sou)索過(guo)或想過(guo)要買的商(shang)品,這背(bei)后其實就是(shi)一套類(lei)似前文中(zhong)提到的輸入法推薦引擎一樣(yang)的推薦引擎。

不過,電商(shang)平臺(tai)面向(xiang)的(de)是10億(yi)級用戶和(he)(he)數十億(yi)商(shang)品信息,因而推薦引(yin)擎所需的(de)計算資源(yuan)和(he)(he)存儲資源(yuan),都是輸入法這樣(yang)的(de)手機應用無(wu)法比擬(ni)的(de)。

60億手機用戶,大模型的刺激戰場

僅(jin)僅(jin)以模(mo)型大小(xiao)來看,要想嵌入20億個商品信息,模(mo)型規(gui)模(mo)就已經(jing)達到了130GB,如果(guo)仍然(ran)照搬(ban)谷歌提(ti)出的(de)聯邦學習框架,本地設備顯(xian)然(ran)無(wu)法提(ti)供如此規(gui)模(mo)的(de)硬件資源(yuan)。

而如果(guo)是使用減枝、量化、知(zhi)識蒸餾等(deng)傳統模(mo)型(xing)壓縮方法,端(duan)側AI推薦引擎的準(zhun)確率(lv)又會大打折(zhe)扣。

因(yin)而,吳帆教授(shou)團隊借鑒聯(lian)邦(bang)學習的思路,研究出了一(yi)套適用于手機淘寶這樣“大模型”的端側推薦引擎構建(jian)機制:

第(di)一步,將與用戶(hu)特征數(shu)據(ju)相關的局部模(mo)型切分下(xia)來(lai),并將這個局部模(mo)型下(xia)載到(dao)本地結合本地數(shu)據(ju)進行模(mo)型訓練;

第二步,下載(zai)到本地(di)的模(mo)型經(jing)由本地(di)用戶(hu)數(shu)據(ju)訓(xun)練(lian)后(hou),將本地(di)參數(shu)根據(ju)本地(di)模(mo)型特(te)性和(he)數(shu)據(ju)量進行加(jia)權計算;

第三步(bu),加權計算(suan)后的本(ben)地參數上傳到(dao)云端,對云端全局大模(mo)型進行訓練(lian)。

在吳帆教授團隊的(de)(de)這套思路(lu)中,推薦(jian)模(mo)型(xing)同樣被(bei)切分為云(yun)(yun)端(duan)模(mo)型(xing)和(手機(ji)(ji))本(ben)地模(mo)型(xing),不同的(de)(de)是,云(yun)(yun)端(duan)模(mo)型(xing)是最終完整的(de)(de)“大模(mo)型(xing)”,手機(ji)(ji)本(ben)地模(mo)型(xing)則是根據(ju)每個用戶特征本(ben)地訓練(lian)形成(cheng)的(de)(de)個性(xing)化用戶“小模(mo)型(xing)”。

據吳(wu)帆(fan)教授公開的(de)研(yan)究數據顯(xian)示,每位用戶每個月關注的(de)商品數大(da)概在300個左右,因而手機(ji)本(ben)地的(de)推薦模(mo)型(xing)大(da)小只有0.27MB左右,甚至比輸入法的(de)手機(ji)本(ben)地推薦模(mo)型(xing)還要(yao)小。

這正(zheng)是淘寶在移(yi)動互(hu)聯網時代能夠精準掌握用戶(hu)購物習慣和用戶(hu)畫(hua)像(xiang)的一個秘密武(wu)器。

03

手機大(da)模(mo)型的歷(li)史使命

現在再來看(kan)高通提(ti)出的手(shou)機大(da)模(mo)型和混合AI這件事兒,似(si)乎也沒有多高級(ji)。

畢竟,在(zai)過去(qu)這些(xie)年(nian)里,已經有(you)不少(shao)團隊在(zai)嘗試將各(ge)類算法(fa)模型、推薦引擎放(fang)到手(shou)機上了(le)。

那么(me)(me),為什么(me)(me)這件事兒這么(me)(me)重要(yao)呢?

這(zhe)是因(yin)為部署在(zai)(zai)云端的人工智(zhi)能算法,在(zai)(zai)手機這(zhe)類設備中(zhong)應用時,存(cun)在(zai)(zai)三個問題(ti):

第(di)一,服務響應延時高;

第二,服務個性化不足;

第(di)三,云服(fu)務器壓(ya)力大。

前兩者(zhe)關乎用戶(hu)使用體(ti)驗,就像身處5G時(shi)代的我們(men),回過頭來(lai)看,已經(jing)完全無(wu)法忍(ren)受2G、3G時(shi)代時(shi)手機打開一個網頁都需要幾秒延(yan)時(shi)的體(ti)驗一樣。

喬(qiao)布斯在(zai)2007年發(fa)布第一(yi)代蘋果手(shou)(shou)機(ji)(ji)時,現場演示手(shou)(shou)機(ji)(ji)沖浪(lang),打(da)開紐約時報時都需要讀(du)秒(miao),如果現在(zai)我們(men)打(da)開京東、淘(tao)寶(bao)、支(zhi)付(fu)寶(bao),首(shou)頁推薦內容需要讀(du)秒(miao)才(cai)能(neng)呈現的話,那將(jiang)是一(yi)個(ge)不(bu)敢想象(xiang)的恐怖故事。

不過,端側AI更重(zhong)要的意義(yi),其實在于(yu)分擔云計算(suan)的壓力。

云(yun)(yun)計算(suan)是我們(men)(men)當下這個(ge)時代一項獨特的技術(shu),它的出現(xian)讓(rang)我們(men)(men)能夠集(ji)中計算(suan)資源辦(ban)大事兒。然而,我們(men)(men)也(ye)看到,即(ji)便數(shu)據中心(xin)已經被納(na)入(ru)到我們(men)(men)國家的新基建建設規劃(hua)之中,但(dan)是云(yun)(yun)計算(suan)資源依(yi)舊緊張。

尤其(qi)是大模型的(de)出(chu)現,對計算資源(yuan)提出(chu)了更高的(de)要求,高通今年特別(bie)出(chu)了一份混合AI的(de)研究報告,報告中(zhong)援引摩(mo)根士丹利的(de)數據指出(chu):

生成式AI每(mei)次(ci)搜索(suo)的成本(ben)(ben)是傳統搜索(suo)方法的10倍(bei),以(yi)目前(qian)每(mei)天(tian)超過100億(yi)次(ci)搜索(suo)計算(suan)為例,即便基(ji)于大語言模型的搜索(suo)僅(jin)占其中一小部分,每(mei)年增量成本(ben)(ben)也(ye)可能會達到數十億(yi)美元。

而作為如今每年擁有(you)十幾億(yi)出貨量的(de)個人終端,智(zhi)能手機就像是(shi)擁有(you)大量閑(xian)置算(suan)力的(de)移動計算(suan)單元,如果能在(zai)這些設備閑(xian)置時間里將這些碎片化、分布式算(suan)力利用起來,將會產生不小的(de)社會效益(yi)。

而這,或許才是手機大模型真(zhen)正的歷史使命。

04

留給手機(ji)大模型的三(san)個問(wen)題(ti)

2022年1月(yue)24日,中國(guo)工(gong)程院院刊舉辦第三屆信息與電子工(gong)程領(ling)域(yu)青年學術前沿(yan)論(lun)壇,彼時,還是阿(a)里達摩院智能計算實驗(yan)室負(fu)責(ze)人的周靖人,對外發布了阿(a)里的“洛犀”端云協(xie)同平(ping)臺。

這一平臺,背(bei)后(hou)是阿里達摩院、浙江大學(xue)上(shang)海高等研(yan)究(jiu)院、上(shang)海人(ren)工(gong)智能(neng)實驗(yan)室(shi)三個國內頂級研(yan)究(jiu)機構合作產物,其作用,正是實現端云協同的人(ren)工(gong)智能(neng)。

此外,據吳帆教授近日(ri)透露,吳帆教授團(tuan)隊(dui)在端(duan)云協同AI上(shang)的工(gong)作,也(ye)被納入到了科(ke)技部2030人工(gong)智能(neng)重大專(zhuan)項(xiang)的扶持項(xiang)目之列。

不過,他(ta)也指出,目前端云(yun)協同AI仍(reng)然存在三方面難(nan)題:

第一,云(yun)上大(da)模(mo)(mo)型與端側小模(mo)(mo)型之間的高(gao)效遷移問題;

第二,端側持續性增強學習(xi)所面臨的資源占(zhan)用(yong)問題;

第三,端側新知(zhi)識如何高效(xiao)匯聚、融(rong)合到云測(ce),支持云測(ce)大(da)模型演進的問題(ti)。

2023年(nian),大(da)模型(xing)(xing)炸裂了整個科(ke)技(ji)圈,人們都(dou)驚訝地看著(zhu)它(ta)肆無忌憚的表演,盡管大(da)模型(xing)(xing)對(dui)計算資源有超高的需求(qiu),無論是(shi)入局大(da)模型(xing)(xing)戰場的科(ke)技(ji)巨(ju)頭,還是(shi)創業(ye)團隊,都(dou)在瘋搶GPU資源,但這并(bing)不(bu)影響大(da)模型(xing)(xing)在手機上的部(bu)署。

實際(ji)上(shang)(shang),早在(zai)(zai)今(jin)年4月,也就(jiu)是在(zai)(zai)高通(tong)在(zai)(zai)安卓手機上(shang)(shang)演示基于(yu)StableDiffusion的(de)AI作圖沒多(duo)久,Midjourney就(jiu)已(yi)經“落戶”QQ,QQ用(yong)戶就(jiu)已(yi)經可以在(zai)(zai)手機端(duan)進入這(zhe)一(yi)大火(huo)的(de)AI作圖工具(ju)的(de)“體(ti)驗服(fu)”。

這同樣(yang)是基于端云協同AI的(de)一次嘗試。

高(gao)通今年(nian)提出的(de)“年(nian)內在手機上支(zhi)持(chi)100億(yi)級大模(mo)(mo)型”的(de)目標,雖然聽(ting)上去有些(xie)不可思議,實則(ze)同樣是基于其提出的(de)混合AI模(mo)(mo)式,也就是端(duan)云協同AI。

這(zhe)么看來(lai),大(da)模(mo)(mo)型從未離開過智能手(shou)機(ji)這(zhe)一(yi)刺激(ji)戰場,大(da)模(mo)(mo)型也將(jiang)繼續在擁(yong)有超(chao)過60億用戶的智能手(shou)機(ji)上繼續“強化學(xue)習”。

大(da)模型 智能手機(ji) 科技
評論
還可輸入300個字
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微信訂(ding)閱