60亿手机用户，大模型的刺激战场

60億手機用戶，大模型的刺激戰場

山竹

2023/08/12

大模型從未離開過智能手機這一刺激戰場，大模型也將繼續在擁有超過60億用戶的智能手機上繼續“強化學習”。

本文來自于微信公眾號“鋅產業”（ID：xinchanye2021），作者：山竹，投融界經授權發布。

2023年過(guo)去(qu)幾(ji)個月里，高通(tong)一直在鼓吹手機大模型。

就好(hao)像(xiang)是要用行(xing)動證(zheng)明，大(da)模(mo)型這件事兒(er)，不能只(zhi)肥了英偉(wei)達(da)，高(gao)通也要分杯羹。

高通著(zhu)急(ji)是有原(yuan)因的，畢竟智能(neng)手機市場已經觸頂，XR市場還未起量(liang)，高通剛剛公布的三季度財報中(zhong)“智能(neng)手機芯片(pian)銷(xiao)量(liang)下降25%，QCT部門銷(xiao)售(shou)額同比下降24%”格外顯眼(yan)。

這與英(ying)偉達H10043萬張的供給(gei)缺口形成了鮮(xian)明的對比。

于是，我們看到(dao)，今年2月，高通官方YouTube發布了一(yi)(yi)則40秒(miao)的“短(duan)視頻(pin)”，在這(zhe)個視頻(pin)中，高通為一(yi)(yi)部有明顯驍龍(long)標識(shi)的安卓手機裝上了StableDiffusion，并用14.42秒(miao)生成了一(yi)(yi)張(zhang)AI圖片。

StableDiffusion是(shi)當下(xia)最火的AI繪圖(tu)軟件，也(ye)是(shi)一個(ge)擁有10億參(can)數的大(da)模型。

不過(guo)，10億級參數的(de)StableDiffusion顯(xian)然無(wu)法與(yu)如今(jin)千億級參數的(de)GPT-3.5、萬億級參數的(de)GPT-4相(xiang)提并論。

高通(tong)的(de)目標自然也不(bu)止于此(ci)，高通(tong)隨后(hou)不(bu)僅又在手機(ji)上演示了15億參數的(de)ControlNet，還多次對外布道，“年內將在手機(ji)上支持100億級大模型。”

就在(zai)英偉達顯(xian)卡賣瘋了的(de)這(zhe)一年，看似與大模型(xing)中間隔著(zhu)無數張H100的(de)手(shou)機，開(kai)始要上大模型(xing)了。

然而，手機上(shang)大(da)模型這(zhe)件事兒，可(ke)能遠(yuan)沒(mei)有你想得那(nei)么高級(ji)，但遠(yuan)比(bi)你想得要(yao)(yao)重要(yao)(yao)。

谷(gu)歌將“小(xiao)模型(xing)”裝進手機里

2017年(nian)7月，谷歌(ge)母(mu)公司(si)Alphabet宣布，接任谷歌(ge)CEO一(yi)職兩年(nian)的SundarPichai正式進(jin)入董事會(hui)。

對于Pichai來說(shuo)，這無(wu)疑是對他(ta)過去兩年工作(zuo)最(zui)大的肯定。

而就在兩個月前(qian)的谷歌(ge)I/O2017大會上(shang)，Pichai剛剛宣布，接下來，谷歌(ge)公(gong)司(si)戰(zhan)略(lve)將從(cong)“Mobilefirst”轉向(xiang)“AIfirst”，AI開始上(shang)升為谷歌(ge)的公(gong)司(si)戰(zhan)略(lve)，這時距離谷歌(ge)收(shou)購DeepMind剛剛過去三年(nian)。

60億手機用戶，大模型的刺激戰場

這一年發(fa)生的另一件奠(dian)定了谷(gu)歌在(zai)AI領(ling)域江湖地(di)位的事兒是，谷(gu)歌大(da)腦團隊在(zai)發(fa)表(biao)的《AttentionIsAllYouNeed》中創造性地(di)提出了Transformer架構。

這一架構不僅成(cheng)為(wei)后來人工智能和自然語言技(ji)術發展(zhan)的(de)基石，也直接促使OpenAI團隊開創了如今的(de)ChatGPT盛世。

不過，這(zhe)些(xie)不是我們今(jin)天要(yao)討論的(de)重點，我們今(jin)天要(yao)討論的(de)是谷歌在這(zhe)一(yi)年(nian)另一(yi)項，對于手機這(zhe)樣的(de)終端設備影響深遠的(de)AI突破——聯邦學習（FederatedLearning）。

機器學習是人工智(zhi)能(neng)的主(zhu)流研究(jiu)方(fang)法，然而，以往將這樣的人工智(zhi)能(neng)能(neng)力(li)應用(yong)到(dao)終端(duan)設(she)備上時，通(tong)常(chang)需要經歷一個“終端(duan)數據收集-發送數據到(dao)云端(duan)-云端(duan)模型訓練-終端(duan)執行(xing)決(jue)策”這樣一條長鏈路(lu)。

究(jiu)其原因(yin)，是因(yin)為終端(duan)設(she)備算(suan)力(li)和存儲資源(yuan)都極為有(you)限，要在(zai)手機這樣的終端(duan)上進(jin)行(xing)AI模型(xing)訓練不現(xian)實。

不過，谷歌并不這么想(xiang)，他們通(tong)過一(yi)個(ge)頗為討巧的方法——端云協同(tong)，嘗試在終(zhong)端上研究人工智能技術。

2017年(nian)4月6日(ri)，谷歌(ge)(ge)在官方博客中更新了一篇文章——《FederatedLearning：CollaborativeMachineLearningwithoutCentralizedTrainingData》，在這篇文章中，谷歌(ge)(ge)AI科(ke)學(xue)家指出：

“在(zai)(zai)手(shou)機從云端下載AI模型(xing)后，在(zai)(zai)手(shou)機上，通過手(shou)機上的(de)數據(ju)訓練并(bing)改(gai)(gai)(gai)進模型(xing)，改(gai)(gai)(gai)進部分被單獨總(zong)結(jie)并(bing)發(fa)送回(hui)云端，用于改(gai)(gai)(gai)進云端‘大(da)模型(xing)’。

這(zhe)其中，所有訓練數據(ju)都(dou)保留在手機本(ben)地，不再單獨(du)更新并存(cun)儲到云端(duan)。”

聯(lian)邦學(xue)習的(de)模(mo)式(shi)，優(you)點在(zai)于解決了人工(gong)智能研究過程中的(de)數據安全問題(ti)，但是(shi)并沒有從根本上解決本地設備算力、存儲資(zi)源(yuan)受(shou)限的(de)問題(ti)。

在聯邦學習框(kuang)架(jia)之下(xia)，最初下(xia)載到(dao)本地(di)設備的(de)(de)AI模(mo)型(xing)和云(yun)端AI模(mo)型(xing)是一個(ge)同樣大(da)小的(de)(de)模(mo)型(xing)，好在谷歌當時找到(dao)了(le)一個(ge)恰好符合這(zhe)一方法的(de)(de)應用場景——手機輸入(ru)法。

谷歌當時(shi)是基于自家的(de)Gboard輸入(ru)法做(zuo)了一(yi)個端側系統中(zhong)的(de)推薦(jian)引擎，當你用手(shou)機的(de)Gboard輸入(ru)一(yi)個字母或單詞時(shi)，推薦(jian)引擎會根據你的(de)歷史(shi)使用數據推薦(jian)相應的(de)關聯內(nei)容給你。

這樣的功能在(zai)諸如百度(du)輸入法、搜狗輸入法等各(ge)類輸入法中(zhong)已經得到(dao)了廣泛使(shi)用(yong)，也(ye)在(zai)潛移默化中(zhong)改變著(zhu)我們的手機(ji)使(shi)用(yong)習慣。

例如現在(zai)越來越多人(ren)在(zai)手機上已經(jing)習慣了使用九宮格輸入(ru)法(fa)，背(bei)后少不(bu)了這種推薦引擎帶來的(de)便利(li)和魔力。

不過，手機輸(shu)入法涉及的單詞量(liang)有限，通常一門(men)語言的常用(yong)單詞量(liang)在1萬個左右(you)，有國(guo)內研究團隊預測，谷(gu)歌(ge)當時推(tui)(tui)出的這(zhe)一輸(shu)入法推(tui)(tui)薦引擎模型體積可能只有約1.4MB大小(xiao)。

因而(er)，嚴格意義上(shang)來說(shuo)，谷歌六(liu)年前提出的聯邦學習，實際上(shang)只是將占用(yong)資源(yuan)量有限的“AI小模(mo)型(xing)”裝進(jin)了手機(ji)里。

谷歌的聯邦學(xue)習，只(zhi)是驗證了端側AI的可行性(xing)，邁出(chu)了端側AI的“一小(xiao)步”。

超越“小(xiao)模(mo)型”

就(jiu)在(zai)谷歌提出聯邦(bang)學習不久(jiu)，由于其在(zai)隱(yin)私性和安全(quan)性上(shang)的突出表現，使得它在(zai)金融領域得到(dao)了廣泛應用。

與此同時，端側AI的(de)發(fa)展(zhan)，也并沒有停(ting)在“AI小模型”上。

上(shang)海交大(da)吳(wu)帆教授團(tuan)(tuan)隊是從2019年開始(shi)研究(jiu)端側(ce)人(ren)工智(zhi)能技(ji)術，吳(wu)帆教授團(tuan)(tuan)隊當(dang)時是與阿里(li)的團(tuan)(tuan)隊基于手機淘寶的應用(yong)需(xu)求，做的偏應用(yong)性的技(ji)術研究(jiu)。

每當你在(zai)手機上打(da)開京東或淘寶等線上購(gou)物平臺時，第一屏上總會出(chu)現你最近搜(sou)索過(guo)或想過(guo)要買的商(shang)品，這背(bei)后其實就是(shi)一套類(lei)似前文中(zhong)提到的輸入法推薦引擎一樣(yang)的推薦引擎。

不過，電商(shang)平臺(tai)面向(xiang)的(de)是10億(yi)級用戶和(he)(he)數十億(yi)商(shang)品信息，因而推薦引(yin)擎所需的(de)計算資源(yuan)和(he)(he)存儲資源(yuan)，都是輸入法這樣(yang)的(de)手機應用無(wu)法比擬(ni)的(de)。

60億手機用戶，大模型的刺激戰場

僅(jin)僅(jin)以模(mo)型大小(xiao)來看，要想嵌入20億個商品信息，模(mo)型規(gui)模(mo)就已經(jing)達到了130GB，如果(guo)仍然(ran)照搬(ban)谷歌提(ti)出的(de)聯邦學習框架，本地設備顯(xian)然(ran)無(wu)法提(ti)供如此規(gui)模(mo)的(de)硬件資源(yuan)。

而如果(guo)是使用減枝、量化、知(zhi)識蒸餾等(deng)傳統模(mo)型(xing)壓縮方法，端(duan)側AI推薦引擎的準(zhun)確率(lv)又會大打折(zhe)扣。

因(yin)而，吳帆教授(shou)團隊借鑒聯(lian)邦(bang)學習的思路，研究出了一(yi)套適用于手機淘寶這樣“大模型”的端側推薦引擎構建(jian)機制：

第(di)一步，將與用戶(hu)特征數(shu)據(ju)相關的局部模(mo)型切分下(xia)來(lai)，并將這個局部模(mo)型下(xia)載到(dao)本地結合本地數(shu)據(ju)進行模(mo)型訓練；

第二步，下載(zai)到本地(di)的模(mo)型經(jing)由本地(di)用戶(hu)數(shu)據(ju)訓(xun)練(lian)后(hou)，將本地(di)參數(shu)根據(ju)本地(di)模(mo)型特(te)性和(he)數(shu)據(ju)量進行加(jia)權計算；

第三步(bu)，加權計算(suan)后的本(ben)地參數上傳到(dao)云端，對云端全局大模(mo)型進行訓練(lian)。

在吳帆教授團隊的(de)(de)這套思路(lu)中，推薦(jian)模(mo)型(xing)同樣被(bei)切分為云(yun)(yun)端(duan)模(mo)型(xing)和（手機(ji)(ji)）本(ben)地模(mo)型(xing)，不同的(de)(de)是，云(yun)(yun)端(duan)模(mo)型(xing)是最終完整的(de)(de)“大模(mo)型(xing)”，手機(ji)(ji)本(ben)地模(mo)型(xing)則是根據(ju)每個用戶特征本(ben)地訓練(lian)形成(cheng)的(de)(de)個性(xing)化用戶“小模(mo)型(xing)”。

據吳(wu)帆(fan)教授公開的(de)研(yan)究數據顯(xian)示，每位用戶每個月關注的(de)商品數大(da)概在300個左右，因而手機(ji)本(ben)地的(de)推薦模(mo)型(xing)大(da)小只有0.27MB左右，甚至比輸入法的(de)手機(ji)本(ben)地推薦模(mo)型(xing)還要(yao)小。

這正(zheng)是淘寶在移(yi)動互(hu)聯網時代能夠精準掌握用戶(hu)購物習慣和用戶(hu)畫(hua)像(xiang)的一個秘密武(wu)器。

手機大(da)模(mo)型的歷(li)史使命

現在再來看(kan)高通提(ti)出的手(shou)機大(da)模(mo)型和混合AI這件事兒，似(si)乎也沒有多高級(ji)。

畢竟，在(zai)過去(qu)這些(xie)年(nian)里，已經有(you)不少(shao)團隊在(zai)嘗試將各(ge)類算法(fa)模型、推薦引擎放(fang)到手(shou)機上了(le)。

那么(me)(me)，為什么(me)(me)這件事兒這么(me)(me)重要(yao)呢？

這(zhe)是因(yin)為部署在(zai)(zai)云端的人工智(zhi)能算法，在(zai)(zai)手機這(zhe)類設備中(zhong)應用時，存(cun)在(zai)(zai)三個問題(ti)：

第(di)一，服務響應延時高；

第二，服務個性化不足；

第(di)三，云服(fu)務器壓(ya)力大。

前兩者(zhe)關乎用戶(hu)使用體(ti)驗，就像身處5G時(shi)代的我們(men)，回過頭來(lai)看，已經(jing)完全無(wu)法忍(ren)受2G、3G時(shi)代時(shi)手機打開一個網頁都需要幾秒延(yan)時(shi)的體(ti)驗一樣。

喬(qiao)布斯在(zai)2007年發(fa)布第一(yi)代蘋果手(shou)(shou)機(ji)(ji)時，現場演示手(shou)(shou)機(ji)(ji)沖浪(lang)，打(da)開紐約時報時都需要讀(du)秒(miao)，如果現在(zai)我們(men)打(da)開京東、淘(tao)寶(bao)、支(zhi)付(fu)寶(bao)，首(shou)頁推薦內容需要讀(du)秒(miao)才(cai)能(neng)呈現的話，那將(jiang)是一(yi)個(ge)不(bu)敢想象(xiang)的恐怖故事。

不過，端側AI更重(zhong)要的意義(yi)，其實在于(yu)分擔云計算(suan)的壓力。

云(yun)(yun)計算(suan)是我們(men)(men)當下這個(ge)時代一項獨特的技術(shu)，它的出現(xian)讓(rang)我們(men)(men)能夠集(ji)中計算(suan)資源辦(ban)大事兒。然而，我們(men)(men)也(ye)看到，即(ji)便數(shu)據中心(xin)已經被納(na)入(ru)到我們(men)(men)國家的新基建建設規劃(hua)之中，但(dan)是云(yun)(yun)計算(suan)資源依(yi)舊緊張。

尤其(qi)是大模型的(de)出(chu)現，對計算資源(yuan)提出(chu)了更高的(de)要求，高通今年特別(bie)出(chu)了一份混合AI的(de)研究報告，報告中(zhong)援引摩(mo)根士丹利的(de)數據指出(chu)：

生成式AI每(mei)次(ci)搜索(suo)的成本(ben)(ben)是傳統搜索(suo)方法的10倍(bei)，以(yi)目前(qian)每(mei)天(tian)超過100億(yi)次(ci)搜索(suo)計算(suan)為例，即便基(ji)于大語言模型的搜索(suo)僅(jin)占其中一小部分，每(mei)年增量成本(ben)(ben)也(ye)可能會達到數十億(yi)美元。

而作為如今每年擁有(you)十幾億(yi)出貨量的(de)個人終端，智(zhi)能手機就像是(shi)擁有(you)大量閑(xian)置算(suan)力的(de)移動計算(suan)單元，如果能在(zai)這些設備閑(xian)置時間里將這些碎片化、分布式算(suan)力利用起來，將會產生不小的(de)社會效益(yi)。

而這，或許才是手機大模型真(zhen)正的歷史使命。

留給手機(ji)大模型的三(san)個問(wen)題(ti)

2022年1月(yue)24日，中國(guo)工(gong)程院院刊舉辦第三屆信息與電子工(gong)程領(ling)域(yu)青年學術前沿(yan)論(lun)壇，彼時，還是阿(a)里達摩院智能計算實驗(yan)室負(fu)責(ze)人的周靖人，對外發布了阿(a)里的“洛犀”端云協(xie)同平(ping)臺。

這一平臺，背(bei)后(hou)是阿里達摩院、浙江大學(xue)上(shang)海高等研(yan)究(jiu)院、上(shang)海人(ren)工(gong)智能(neng)實驗(yan)室(shi)三個國內頂級研(yan)究(jiu)機構合作產物，其作用，正是實現端云協同的人(ren)工(gong)智能(neng)。

此外，據吳帆教授近日(ri)透露，吳帆教授團(tuan)隊(dui)在端(duan)云協同AI上(shang)的工(gong)作，也(ye)被納入到了科(ke)技部2030人工(gong)智能(neng)重大專(zhuan)項(xiang)的扶持項(xiang)目之列。

不過，他(ta)也指出，目前端云(yun)協同AI仍(reng)然存在三方面難(nan)題：

第一，云(yun)上大(da)模(mo)(mo)型與端側小模(mo)(mo)型之間的高(gao)效遷移問題；

第二，端側持續性增強學習(xi)所面臨的資源占(zhan)用(yong)問題；

第三，端側新知(zhi)識如何高效(xiao)匯聚、融(rong)合到云測(ce)，支持云測(ce)大(da)模型演進的問題(ti)。

2023年(nian)，大(da)模型(xing)(xing)炸裂了整個科(ke)技(ji)圈，人們都(dou)驚訝地看著(zhu)它(ta)肆無忌憚的表演，盡管大(da)模型(xing)(xing)對(dui)計算資源有超高的需求(qiu)，無論是(shi)入局大(da)模型(xing)(xing)戰場的科(ke)技(ji)巨(ju)頭，還是(shi)創業(ye)團隊，都(dou)在瘋搶GPU資源，但這并(bing)不(bu)影響大(da)模型(xing)(xing)在手機上的部(bu)署。

實際(ji)上(shang)(shang)，早在(zai)(zai)今(jin)年4月，也就(jiu)是在(zai)(zai)高通(tong)在(zai)(zai)安卓手機上(shang)(shang)演示基于(yu)StableDiffusion的(de)AI作圖沒多(duo)久，Midjourney就(jiu)已(yi)經“落戶”QQ，QQ用(yong)戶就(jiu)已(yi)經可以在(zai)(zai)手機端(duan)進入這(zhe)一(yi)大火(huo)的(de)AI作圖工具(ju)的(de)“體(ti)驗服(fu)”。

這同樣(yang)是基于端云協同AI的(de)一次嘗試。

高(gao)通今年(nian)提出的(de)“年(nian)內在手機上支(zhi)持(chi)100億(yi)級大模(mo)(mo)型”的(de)目標，雖然聽(ting)上去有些(xie)不可思議，實則(ze)同樣是基于其提出的(de)混合AI模(mo)(mo)式，也就是端(duan)云協同AI。

這(zhe)么看來(lai)，大(da)模(mo)(mo)型從未離開過智能手(shou)機(ji)這(zhe)一(yi)刺激(ji)戰場，大(da)模(mo)(mo)型也將(jiang)繼續在擁(yong)有超(chao)過60億用戶的智能手(shou)機(ji)上繼續“強化學(xue)習”。

大(da)模型智能手機(ji) 科技

評論

還可輸入300個字

發布留言

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇