大模型冷思考：企业“可控”价值创造空间还有多少？

大模型冷思考：企業“可控”價值創造空間還有多少？

葉遠風

2023/11/03

可以說，大模型給了這個時代全新的增量價值方向，只有幫助企業實現對“可控”價值創造的把握，才能讓企業在這個全新方向更有著力點。

本文來自于微信公眾號“智能相對論”（ID：aixdlun），作者：葉遠風，投融界經授權發布。

毫無疑問，大模型熱潮(chao)正一浪高過一浪。

在(zai)發展進程上，從最開始(shi)(shi)的(de)技(ji)術比(bi)拼到現在(zai)已開始(shi)(shi)全(quan)面強(qiang)調(diao)商(shang)業價值(zhi)變現，百度(du)、科大訊飛等(deng)廠商(shang)都喊出類似(si)“不能(neng)落(luo)地的(de)大模型沒有(you)意義”等(deng)口號。

在模(mo)(mo)型(xing)(xing)類(lei)(lei)型(xing)(xing)上(shang)，除(chu)了(le)百度(du)文心(xin)大模(mo)(mo)型(xing)(xing)、訊飛星火認知大模(mo)(mo)型(xing)(xing)、阿(a)里(li)通(tong)義千問大模(mo)(mo)型(xing)(xing)等通(tong)用大模(mo)(mo)型(xing)(xing)，醫藥研發(fa)、金融等垂(chui)直大模(mo)(mo)型(xing)(xing)正積極涌現。幾(ji)個(ge)月(yue)前(qian)，新華三集團(tuan)在業(ye)內首提“私(si)域(yu)(yu)大模(mo)(mo)型(xing)(xing)”概念，并發(fa)布融合了(le)行(xing)業(ye)屬(shu)性及地(di)域(yu)(yu)屬(shu)性的(de)私(si)域(yu)(yu)大模(mo)(mo)型(xing)(xing)——“百業(ye)靈犀”LinSeer，為(wei)行(xing)業(ye)增添了(le)企業(ye)落地(di)大模(mo)(mo)型(xing)(xing)的(de)創新類(lei)(lei)型(xing)(xing)。

而在更直接(jie)的數字上，截止到(dao)2023年10月初，國內僅公開的大模型數量已達238個，百模大戰(zhan)正在升級(ji)千模大戰(zhan)。

……接近(jin)一年(nian)的(de)熱潮后大模型沒有冷卻的(de)跡象(xiang)，行業普遍的(de)共識形成，這(zhe)不(bu)是(shi)風口，而是(shi)技術革(ge)命。

然而，歷史一次次證明，賽道越是熱鬧，參賽者越需要冷(leng)靜的思考。

種種跡象(xiang)顯示，雖(sui)然看起(qi)來百花齊放，但(dan)事實上(shang)AI三大(da)要素(su)(算力、數據、算法(fa))，以及大(da)模型發展的行業規則中，當(dang)下以及未(wei)來很(hen)多因素(su)已經既定(ding)，一頭熱扎進(jin)去的企業們(men)，更應該尋(xun)找(zhao)的是那些不(bu)由既成的客觀(guan)因素(su)所限制(zhi)、能夠進(jin)行自我價值(zhi)發揮的地方，才能盡可能獲得(de)相對競爭優勢。

算力“積木化”，

可控價值創造集中到“調度”環節

算(suan)力(li)常(chang)常(chang)被視為大模型(xing)發展的瓶(ping)頸問題(ti)，但(dan)是，如果從是否“可控”的視角(jiao)看，在業務(wu)層面企業能自己做出決定從而影響算(suan)力(li)獲取的地方(fang)，其實(shi)越(yue)(yue)來(lai)越(yue)(yue)少。

IT時代Windows+Intel構(gou)建(jian)起WinTel體，演變為(wei)(wei)移(yi)動互(hu)聯網時代安卓+ARM(以高通為(wei)(wei)代表)，到了大(da)(da)模型(xing)(xing)時代，又進一(yi)步(bu)演化為(wei)(wei)AI大(da)(da)模型(xing)(xing)+GPU——在(zai)當前，Nvidia已經成為(wei)(wei)大(da)(da)模型(xing)(xing)趨(qu)同的算力來源。

2021的(de)Ampere(對(dui)應(ying)A100等)、2022年的(de)Hopper(對(dui)應(ying)H100等)、2023的(de)Ada架構(gou)……性價比高(gao)不高(gao)，要看(kan)Nvidia架構(gou)發(fa)展有多快。

算(suan)力(li)不再(zai)是瓶頸，或者說，其“總體基本面”的提升并沒有什么(me)操作空間——要(yao)多少算(suan)力(li)就需要(yao)多少資本投(tou)(tou)入(ru)(ru)，反過來有多少資本投(tou)(tou)入(ru)(ru)基本也(ye)能買來多少算(suan)力(li)。

當算力“口子”被外(wai)部技(ji)術、內部預算等限定(ding)，通(tong)過調度(du)提升既有資源利用效率，就成為企業(ye)“可(ke)控”的價值創造過程。特別是私域大模(mo)型(xing)，對于(yu)企業(ye)來說，AI大模(mo)型(xing)的大小需(xu)要平衡算力和能耗(hao)的開支，應選擇適合行業(ye)特點和業(ye)務特點的大模(mo)型(xing)進行私域部署。

此(ci)時，如(ru)何榨取硬件資(zi)源(yuan)提(ti)供(gong)的每(mei)一滴(di)能(neng)(neng)力，加(jia)速(su)模型的訓練速(su)度(du)成(cheng)為首要考慮的問題，而這方面術業有專攻，往往依賴(lai)基(ji)礎設施(shi)服務(wu)廠(chang)(chang)商(shang)——針對算力等底層基(ji)礎設施(shi)提(ti)供(gong)支撐成(cheng)為考驗各(ge)個服務(wu)廠(chang)(chang)商(shang)最基(ji)本的能(neng)(neng)力，其中尤以算力調度(du)能(neng)(neng)力是(shi)其重(zhong)點。

算(suan)(suan)(suan)力(li)調(diao)(diao)度往(wang)往(wang)需(xu)(xu)要多維能(neng)(neng)力(li)協同(tong)，所以(yi)，作為業內(nei)首(shou)倡(chang)私域大(da)模型的(de)(de)新華三給(gei)出了自(zi)己的(de)(de)回(hui)答：依(yi)托通過傲飛算(suan)(suan)(suan)力(li)平臺(tai)實現算(suan)(suan)(suan)力(li)調(diao)(diao)度的(de)(de)“最優(you)解(jie)”，讓(rang)算(suan)(suan)(suan)力(li)可(ke)以(yi)最大(da)化(hua)的(de)(de)按需(xu)(xu)調(diao)(diao)度。另一(yi)方面以(yi)綠洲平臺(tai)實現大(da)模型所需(xu)(xu)的(de)(de)數(shu)(shu)據支撐，同(tong)時在(zai)分(fen)布式訓(xun)練等需(xu)(xu)求下以(yi)智能(neng)(neng)無損網(wang)絡支持AI集群訓(xun)練，配備高性能(neng)(neng)存儲帶來更好的(de)(de)底層(ceng)存儲支撐，甚(shen)至還建設有液(ye)冷(leng)數(shu)(shu)據中(zhong)心來維持算(suan)(suan)(suan)力(li)輸出的(de)(de)穩定性，以(yi)此(ci)構成一(yi)套完整的(de)(de)智算(suan)(suan)(suan)解(jie)決方案。

而(er)新華三算力(li)(li)調度的“主(zhu)腦”傲飛算力(li)(li)平臺(tai)則具(ju)備異構計算資(zi)(zi)源統一管理、多元算力(li)(li)資(zi)(zi)源智(zhi)能(neng)(neng)(neng)調度的能(neng)(neng)(neng)力(li)(li)，提供(gong)包含(han)智(zhi)能(neng)(neng)(neng)標注(zhu)、智(zhi)能(neng)(neng)(neng)訓練、智(zhi)能(neng)(neng)(neng)調優(you)、智(zhi)能(neng)(neng)(neng)部(bu)署(shu)、智(zhi)能(neng)(neng)(neng)推理的全流程算力(li)(li)智(zhi)能(neng)(neng)(neng)調度能(neng)(neng)(neng)力(li)(li)。

按官(guan)方數(shu)據，該平臺能夠將算力(li)利(li)用率提(ti)高至(zhi)70%以上。同時，還支持8000節點(dian)的算力(li)調度，并發訓練(lian)時間縮短至(zhi)50%，且斷點(dian)自動接續無感知訓練(lian)更穩定(ding)，在既有GPU資源下能全方面(mian)提(ti)升大模型(xing)訓練(lian)性能。

說白了(le)，就是(shi)(shi)通(tong)過(guo)一(yi)系列(lie)算力流程環節(jie)的(de)(de)銜接優化(hua)(尤其是(shi)(shi)面對并(bing)行計(ji)(ji)算與分布式計(ji)(ji)算需求)，在充分保障訓練與應(ying)用需求的(de)(de)同(tong)時(shi)降低GPU的(de)(de)空閑時(shi)間，讓巨大(da)成本獲取來的(de)(de)算力資源工作盡可能飽和。

總體而(er)言，這(zhe)一整套(tao)高性能算(suan)(suan)力(li)集群及調(diao)度讓(rang)客戶能夠實現算(suan)(suan)力(li)、存力(li)、運力(li)協同感(gan)知，實現算(suan)(suan)力(li)資(zi)(zi)源充分(fen)供給、靈活部署(shu)、異構算(suan)(suan)力(li)最優(you)調(diao)度——雖然(ran)有多少算(suan)(suan)力(li)資(zi)(zi)源很難控制，但用好這(zhe)些資(zi)(zi)源企業卻能夠做到完全可控。

當然，除了提升算力利用效率，行業中一(yi)些做法還(huan)在(zai)試圖通過其(qi)他方式直接降低(di)模型訓練對(dui)GPU資源的要求，例(li)如數據(ju)存儲層面進行算子優(you)化等，未來(lai)或(huo)也存在(zai)較(jiao)大(da)的價值開發(fa)空間。

數據“斷面化”，以數據質量建設

帶來“護城河”成為企業的必然選擇

目前，企業能(neng)夠獲得(de)的數(shu)據量(liang)來源(yuan)主(zhu)要包括公開的數(shu)據集與(yu)自身(shen)沉淀。

在當下時(shi)(shi)間斷面，這兩(liang)種都只能(neng)被(bei)動等待或由時(shi)(shi)間積累(lei)，數(shu)據“量(liang)”其實很難有(you)突破，優(you)勢有(you)就是(shi)有(you)，沒(mei)有(you)就是(shi)沒(mei)有(you)，并(bing)不可控。

當然，也(ye)有(you)一(yi)些(xie)企業試圖(tu)主(zhu)(zhu)動出擊，例(li)如國(guo)外公司Inflection AI以大規模提問(wen)的方式(shi)來主(zhu)(zhu)動提升數據沉淀速度(du)，但這顯然這并不(bu)會(hui)是主(zhu)(zhu)流。

“量”上不可控，則可控的價值創造空間必須(xu)更聚焦于“質”上。

中信智(zhi)(zhi)庫(ku)《人工(gong)智(zhi)(zhi)能十大發展趨(qu)勢》認為，“未來一個模型的好(hao)壞，80%由(you)數(shu)據質量決定。”

從長遠視角(jiao)看，大(da)模型(xing)的競爭并不(bu)是要比誰跑得更快，而(er)是比誰走得更遠，這就(jiu)需(xu)要大(da)模型(xing)真實的應用效(xiao)果(guo)，也就(jiu)需(xu)要通過各(ge)種方(fang)式提升數據質量，來鍛造大(da)模型(xing)發展(zhan)的“內功”。

在數(shu)據(ju)的計(ji)劃、獲取(qu)、存儲、共享、維護、應用(yong)等環節，都需要針對性(xing)(xing)的數(shu)據(ju)管理、治(zhi)理，最(zui)終提升(sheng)數(shu)據(ju)質量。這是一個(ge)系統性(xing)(xing)工(gong)程(cheng)，也為市面上的基(ji)礎設(she)施服務商們(men)帶來了機會。

例(li)如新(xin)華(hua)三的綠洲平臺就以場景需(xu)求為導(dao)向，打造(zao)了一個(ge)圍繞數據(ju)采集、存儲、管理和應用的全棧數據(ju)平臺。

通過內置AI算法，綠洲平臺(tai)大大提升(sheng)(sheng)了數(shu)(shu)據(ju)(ju)標記能力，讓數(shu)(shu)據(ju)(ju)治理、數(shu)(shu)據(ju)(ju)開(kai)發(fa)等過去很繁雜(za)的流(liu)程工作變得極為(wei)簡單，而知識圖譜構建能力則幫助(zhu)數(shu)(shu)據(ju)(ju)躍升(sheng)(sheng)為(wei)知識，從而能夠更好地被業務(wu)場(chang)景所使用(yong)。

事實上，數據(ju)深加工帶來高質量數據(ju)訓練一直(zhi)是前沿大模型(xing)的核心競爭力所在，OpenAI一貫公開其訓練過(guo)程及算(suan)法(fa)，但對數據(ju)如何處(chu)理緘口不言(yan)。

回過頭來看，數(shu)據(ju)的(de)“要素(su)化(hua)(hua)”與(yu)“資產(chan)化(hua)(hua)”正在(zai)讓百行百業再次審視數(shu)據(ju)的(de)價(jia)值(zhi)，在(zai)數(shu)據(ju)越(yue)來越(yue)作(zuo)為一(yi)種新型生產(chan)力要素(su)的(de)時(shi)代，大(da)模型的(de)本(ben)質可以視作(zuo)一(yi)種挖掘數(shu)據(ju)要素(su)價(jia)值(zhi)的(de)工(gong)具，而工(gong)具不(bu)決(jue)定(ding)價(jia)值(zhi)，只決(jue)定(ding)效(xiao)率。

大(da)模(mo)型終將走入(ru)底(di)層(ceng)成為(wei)一種(zhong)普遍的(de)后端能力(li)，技(ji)術(shu)本身(shen)越來越無法成為(wei)護(hu)城(cheng)河(he)(he)，而數(shu)據則(ze)代表了(le)企(qi)業在前端與(yu)客戶/用(yong)戶的(de)連(lian)接程度，數(shu)據要素的(de)價(jia)值(zhi)釋放將成為(wei)企(qi)業真正的(de)“護(hu)城(cheng)河(he)(he)”。

所(suo)有的數(shu)據類平臺提升數(shu)據質量的過程(cheng)，就是在幫助企(qi)業(ye)進一步挖掘數(shu)據要素價值、沉淀數(shu)據資產(chan)，真正打造企(qi)業(ye)的“護城河(he)”。

算法“收斂化”，

殊途同歸下企業需聚焦訓練效率提升

算法是(shi)大模型(xing)的能(neng)力核心，但長(chang)期(qi)來看，算法能(neng)力卻(que)終將“收斂”。

目前的(de)(de)大模型算法基本上都(dou)基于Transformer架構(gou)，該架構(gou)解決了過(guo)去RNN架構(gou)難以并(bing)行(xing)化等(deng)核(he)心缺陷(xian)，是基因“優勝劣(lie)汰”的(de)(de)結(jie)果，BERT、GPT、T5、GLM等(deng)都(dou)其(qi)“衍生品”。

所以，算法生來都幾乎有(you)著相同的(de)“基因”。

而(er)在開(kai)發框架(jia)層(ceng)面(mian)，伴隨著開(kai)源(yuan)生(sheng)態(tai)建設，國外的(de)TensorFlow、Pytorch，國內(nei)的(de)MindSpore等幾個主流框架(jia)逐(zhu)步成為共(gong)同的(de)選擇。

這意味著(zhu)，算法的后(hou)天(tian)的“成長環境”也逐步趨同。

先天(tian)+后天(tian)，算(suan)法創新當下看起來百花(hua)齊放，但在(zai)未(wei)來其價(jia)值創新的空間(jian)將逐步收窄，企業能夠通過努(nu)力(li)獲得(de)的相對優勢將越來越少(shao)。

甚至，在Llama 2掀起(qi)的開(kai)源浪潮下，算(suan)法創新的價值被進一步壓(ya)縮。

因此，從長期來看，企(qi)業最“可控”的價值(zhi)創(chuang)造將側重(zhong)到訓練效率而(er)非(fei)算法創(chuang)新上(shang)——同樣(yang)的能力(li)與潛力(li)，PK更快(kuai)速地訓練迭代。

很多(duo)廠(chang)商提供的開(kai)發(fa)工具鏈都在直接推進訓(xun)練效(xiao)率，而一(yi)些原本旨在提供算力服(fu)務的平臺(tai)也實(shi)現了等價的功能。

例如(ru)，傲飛算力平臺支(zhi)持斷(duan)點自動接(jie)續無感知訓練(lian)(lian)，其(qi)原本目(mu)的(de)在于降低(di)參數(shu)迭代期間的(de)GPU資源等待、提升(sheng)資源利用效率(lv)(lv)，但客觀上也(ye)直接(jie)帶來訓練(lian)(lian)效率(lv)(lv)的(de)提升(sheng)，讓算法加速迭代，先把潛力跑出來。

畢竟，加速算法(fa)訓練，就是(shi)在提升算力(li)資(zi)源(yuan)利用效率。

行業規則“沉淀化”：

長期主義仍需回歸到正確的價值觀

大模(mo)型(xing)熱潮中，人(ren)人(ren)都(dou)會不(bu)自(zi)覺追求技(ji)術(shu)與商(shang)業價值“上(shang)限”，但大模(mo)型(xing)“下限”問題也(ye)日益突出，例(li)如數據隱私、數據安(an)全、知(zhi)識產權、技(ji)術(shu)濫用等(deng)。

從企業的視角看，行業規則建(jian)立迫(po)在(zai)眉睫，但其形(xing)成過程同(tong)樣存在(zai)著不由(you)企業決定(ding)的“客(ke)觀因素”。

關于行業發展的一些法律(lv)法規，監管部門(men)在(zai)逐步沉淀(dian)，例(li)如(ru)國(guo)家網信(xin)辦聯合多部門(men)公(gong)布(bu)的《生成式(shi)人工(gong)智能服務管理(li)暫行辦法》，企業要做(zuo)的是(shi)等待并盡力配合與落實。

關于(yu)行(xing)業(ye)統一共識，也需要一個個沉淀，例(li)如，目前已經有從(cong)業(ye)者提議行(xing)業(ye)協(xie)作開發統一、可信的框架，在隱私保護、模型效(xiao)用和訓練(lian)效(xiao)率之(zhi)間取(qu)得(de)平(ping)衡，企業(ye)要做的是積極響(xiang)應、積極參與。

但(dan)在一些規則(ze)上，企業(ye)能(neng)(neng)夠、也(ye)必須充分發揮“可控”的價值創造能(neng)(neng)力。

例如，大模型數據安全“容錯(cuo)率低(di)”，企(qi)業必(bi)須加大投入。

很多(duo)基(ji)礎設施廠商都(dou)提供了相關(guan)的服務，例(li)如(ru)新華(hua)三的私域大(da)模(mo)型百業靈犀以(yi)內(nei)置(zhi)安(an)全限制提示詞和(he)(he)出入內(nei)容(rong)過(guo)濾攔(lan)截(jie)(jie)對所(suo)有場景下大(da)模(mo)型生成(cheng)內(nei)容(rong)進(jin)行(xing)安(an)全性限制，針對所(suo)有出入流量和(he)(he)內(nei)容(rong)進(jin)行(xing)安(an)全審計(ji)和(he)(he)敏感信息攔(lan)截(jie)(jie)。

當然，最直觀反應(ying)大模型倫理、體現“下限(xian)”的是場(chang)景應(ying)用的選擇問題。

科(ke)研、制造(zao)、醫藥、法(fa)律……大模型已經走向諸多能帶來社(she)會正向價(jia)值(zhi)的場景(jing)。但是，諸如偽造(zao)視頻進行詐騙等(deng)“場景(jing)應用”也已經出(chu)現，基于強力的大模型技術有著更(geng)強的欺(qi)騙性。

技術是刀，大模型是一把更鋒利的刀，它的作(zuo)用和價值(zhi)由使用的人決定。

說到底(di)，企業需要構(gou)建正(zheng)確的價值觀，將大模型(xing)能力(li)導向(xiang)數字經濟的正(zheng)向(xiang)價值上，才能守(shou)住“下(xia)限”、實現大模型(xing)的長期健康(kang)發展。

結語

大(da)模型賽道上，企業必須在“可控”的價(jia)值創造空間(jian)上發(fa)力，才能不斷在各(ge)個維度(du)獲得更多相對競爭優勢與發(fa)展可能性(xing)。

企業也必須(xu)以此為標準選擇基礎(chu)設施服務(wu)、大(da)模(mo)型服務(wu)的廠商，尤其是在多個維(wei)度都能滿足需要的廠商。

可以說，大模(mo)型給了(le)這個時代全(quan)新(xin)的增量價值方向(xiang)，只有幫助(zhu)企(qi)業實現對“可控”價值創造的把握(wo)，才能讓企(qi)業在這個全(quan)新(xin)方向(xiang)更有著力點。

人工智能大模型

評論

還可輸入300個字

發布留言

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇