49015 大模型冷思考:企業“可控”價值創造空間還有多少?

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
大模型冷思考:企業“可控”價值創造空間還有多少?
智能相對論 ·

葉遠風

2023/11/03
可以說,大模型給了這個時代全新的增量價值方向,只有幫助企業實現對“可控”價值創造的把握,才能讓企業在這個全新方向更有著力點。
本文來自于微信公眾號“智能相對論”(ID:aixdlun),作者:葉遠風,投融界經授權發布。

毫無疑問,大模型熱潮(chao)正一浪高過一浪。

在(zai)發展進程上,從最開始(shi)(shi)的(de)技(ji)術比(bi)拼到現在(zai)已開始(shi)(shi)全(quan)面強(qiang)調(diao)商(shang)業價值(zhi)變現,百度(du)、科大訊飛等(deng)廠商(shang)都喊出類似(si)“不能(neng)落(luo)地的(de)大模型沒有(you)意義”等(deng)口號。

在模(mo)(mo)型(xing)(xing)類(lei)(lei)型(xing)(xing)上(shang),除(chu)了(le)百度(du)文心(xin)大模(mo)(mo)型(xing)(xing)、訊飛星火認知大模(mo)(mo)型(xing)(xing)、阿(a)里(li)通(tong)義千問大模(mo)(mo)型(xing)(xing)等通(tong)用大模(mo)(mo)型(xing)(xing),醫藥研發(fa)、金融等垂(chui)直大模(mo)(mo)型(xing)(xing)正積極涌現。幾(ji)個(ge)月(yue)前(qian),新華三集團(tuan)在業(ye)內首提“私(si)域(yu)(yu)大模(mo)(mo)型(xing)(xing)”概念,并發(fa)布融合了(le)行(xing)業(ye)屬(shu)性及地(di)域(yu)(yu)屬(shu)性的(de)私(si)域(yu)(yu)大模(mo)(mo)型(xing)(xing)——“百業(ye)靈犀”LinSeer,為(wei)行(xing)業(ye)增添了(le)企業(ye)落地(di)大模(mo)(mo)型(xing)(xing)的(de)創新類(lei)(lei)型(xing)(xing)。

而在更直接(jie)的數字上,截止到(dao)2023年10月初,國內僅公開的大模型數量已達238個,百模大戰(zhan)正在升級(ji)千模大戰(zhan)。

……接近(jin)一年(nian)的(de)熱潮后大模型沒有冷卻的(de)跡象(xiang),行業普遍的(de)共識形成,這(zhe)不(bu)是(shi)風口,而是(shi)技術革(ge)命。

然而,歷史一次次證明,賽道越是熱鬧,參賽者越需要冷(leng)靜的思考。

種種跡象(xiang)顯示,雖(sui)然看起(qi)來百花齊放,但(dan)事實上(shang)AI三大(da)要素(su)(算力、數據、算法(fa)),以及大(da)模型發展的行業規則中,當(dang)下以及未(wei)來很(hen)多因素(su)已經既定(ding),一頭熱扎進(jin)去的企業們(men),更應該尋(xun)找(zhao)的是那些不(bu)由既成的客觀(guan)因素(su)所限制(zhi)、能夠進(jin)行自我價值(zhi)發揮的地方,才能盡可能獲得(de)相對競爭優勢。

01

算力“積木化”,

可控價值創造集中到“調度”環節

算(suan)力(li)常(chang)常(chang)被視為大模型(xing)發展的瓶(ping)頸問題(ti),但(dan)是,如果從是否“可控”的視角(jiao)看,在業務(wu)層面企業能自己做出決定從而影響算(suan)力(li)獲取的地方(fang),其實(shi)越(yue)(yue)來(lai)越(yue)(yue)少。

IT時代Windows+Intel構(gou)建(jian)起WinTel體,演變為(wei)(wei)移(yi)動互(hu)聯網時代安卓+ARM(以高通為(wei)(wei)代表),到了大(da)(da)模型(xing)(xing)時代,又進一(yi)步(bu)演化為(wei)(wei)AI大(da)(da)模型(xing)(xing)+GPU——在(zai)當前,Nvidia已經成為(wei)(wei)大(da)(da)模型(xing)(xing)趨(qu)同的算力來源。

2021的(de)Ampere(對(dui)應(ying)A100等)、2022年的(de)Hopper(對(dui)應(ying)H100等)、2023的(de)Ada架構(gou)……性價比高(gao)不高(gao),要看(kan)Nvidia架構(gou)發(fa)展有多快。

算(suan)力(li)不再(zai)是瓶頸,或者說,其“總體基本面”的提升并沒有什么(me)操作空間——要(yao)多少算(suan)力(li)就需要(yao)多少資本投(tou)(tou)入(ru)(ru),反過來有多少資本投(tou)(tou)入(ru)(ru)基本也(ye)能買來多少算(suan)力(li)。

當算力“口子”被外(wai)部技(ji)術、內部預算等限定(ding),通(tong)過調度(du)提升既有資源利用效率,就成為企業(ye)“可(ke)控”的價值創造過程。特別是私域大模(mo)型(xing),對于(yu)企業(ye)來說,AI大模(mo)型(xing)的大小需(xu)要平衡算力和能耗(hao)的開支,應選擇適合行業(ye)特點和業(ye)務特點的大模(mo)型(xing)進行私域部署。

此(ci)時,如(ru)何榨取硬件資(zi)源(yuan)提(ti)供(gong)的每(mei)一滴(di)能(neng)(neng)力,加(jia)速(su)模型的訓練速(su)度(du)成(cheng)為首要考慮的問題,而這方面術業有專攻,往往依賴(lai)基(ji)礎設施(shi)服務(wu)廠(chang)(chang)商(shang)——針對算力等底層基(ji)礎設施(shi)提(ti)供(gong)支撐成(cheng)為考驗各(ge)個服務(wu)廠(chang)(chang)商(shang)最基(ji)本的能(neng)(neng)力,其中尤以算力調度(du)能(neng)(neng)力是(shi)其重(zhong)點。

算(suan)(suan)(suan)力(li)調(diao)(diao)度往(wang)往(wang)需(xu)(xu)要多維能(neng)(neng)力(li)協同(tong),所以(yi),作為業內(nei)首(shou)倡(chang)私域大(da)模型的(de)(de)新華三給(gei)出了自(zi)己的(de)(de)回(hui)答:依(yi)托通過傲飛算(suan)(suan)(suan)力(li)平臺(tai)實現算(suan)(suan)(suan)力(li)調(diao)(diao)度的(de)(de)“最優(you)解(jie)”,讓(rang)算(suan)(suan)(suan)力(li)可(ke)以(yi)最大(da)化(hua)的(de)(de)按需(xu)(xu)調(diao)(diao)度。另一(yi)方面以(yi)綠洲平臺(tai)實現大(da)模型所需(xu)(xu)的(de)(de)數(shu)(shu)據支撐,同(tong)時在(zai)分(fen)布式訓(xun)練等需(xu)(xu)求下以(yi)智能(neng)(neng)無損網(wang)絡支持AI集群訓(xun)練,配備高性能(neng)(neng)存儲帶來更好的(de)(de)底層(ceng)存儲支撐,甚(shen)至還建設有液(ye)冷(leng)數(shu)(shu)據中(zhong)心來維持算(suan)(suan)(suan)力(li)輸出的(de)(de)穩定性,以(yi)此(ci)構成一(yi)套完整的(de)(de)智算(suan)(suan)(suan)解(jie)決方案。

而(er)新華三算力(li)(li)調度的“主(zhu)腦”傲飛算力(li)(li)平臺(tai)則具(ju)備異構計算資(zi)(zi)源統一管理、多元算力(li)(li)資(zi)(zi)源智(zhi)能(neng)(neng)(neng)調度的能(neng)(neng)(neng)力(li)(li),提供(gong)包含(han)智(zhi)能(neng)(neng)(neng)標注(zhu)、智(zhi)能(neng)(neng)(neng)訓練、智(zhi)能(neng)(neng)(neng)調優(you)、智(zhi)能(neng)(neng)(neng)部(bu)署(shu)、智(zhi)能(neng)(neng)(neng)推理的全流程算力(li)(li)智(zhi)能(neng)(neng)(neng)調度能(neng)(neng)(neng)力(li)(li)。

按官(guan)方數(shu)據,該平臺能夠將算力(li)利(li)用率提(ti)高至(zhi)70%以上。同時,還支持8000節點(dian)的算力(li)調度,并發訓練(lian)時間縮短至(zhi)50%,且斷點(dian)自動接續無感知訓練(lian)更穩定(ding),在既有GPU資源下能全方面(mian)提(ti)升大模型(xing)訓練(lian)性能。

說白了(le),就是(shi)(shi)通(tong)過(guo)一(yi)系列(lie)算力流程環節(jie)的(de)(de)銜接優化(hua)(尤其是(shi)(shi)面對并(bing)行計(ji)(ji)算與分布式計(ji)(ji)算需求),在充分保障訓練與應(ying)用需求的(de)(de)同(tong)時(shi)降低GPU的(de)(de)空閑時(shi)間,讓巨大(da)成本獲取來的(de)(de)算力資源工作盡可能飽和。

總體而(er)言,這(zhe)一整套(tao)高性能算(suan)(suan)力(li)集群及調(diao)度讓(rang)客戶能夠實現算(suan)(suan)力(li)、存力(li)、運力(li)協同感(gan)知,實現算(suan)(suan)力(li)資(zi)(zi)源充分(fen)供給、靈活部署(shu)、異構算(suan)(suan)力(li)最優(you)調(diao)度——雖然(ran)有多少算(suan)(suan)力(li)資(zi)(zi)源很難控制,但用好這(zhe)些資(zi)(zi)源企業卻能夠做到完全可控。

當然,除了提升算力利用效率,行業中一(yi)些做法還(huan)在(zai)試圖通過其(qi)他方式直接降低(di)模型訓練對(dui)GPU資源的要求,例(li)如數據(ju)存儲層面進行算子優(you)化等,未來(lai)或(huo)也存在(zai)較(jiao)大(da)的價值開發(fa)空間。

02

數據“斷面化”,以數據質量建設

帶來“護城河”成為企業的必然選擇

目前,企業能(neng)夠獲得(de)的數(shu)據量(liang)來源(yuan)主(zhu)要包括公開的數(shu)據集與(yu)自身(shen)沉淀。

在當下時(shi)(shi)間斷面,這兩(liang)種都只能(neng)被(bei)動等待或由時(shi)(shi)間積累(lei),數(shu)據“量(liang)”其實很難有(you)突破,優(you)勢有(you)就是(shi)有(you),沒(mei)有(you)就是(shi)沒(mei)有(you),并(bing)不可控。

當然,也(ye)有(you)一(yi)些(xie)企業試圖(tu)主(zhu)(zhu)動出擊,例(li)如國(guo)外公司Inflection AI以大規模提問(wen)的方式(shi)來主(zhu)(zhu)動提升數據沉淀速度(du),但這顯然這并不(bu)會(hui)是主(zhu)(zhu)流。

“量”上不可控,則可控的價值創造空間必須(xu)更聚焦于“質”上。

中信智(zhi)(zhi)庫(ku)《人工(gong)智(zhi)(zhi)能十大發展趨(qu)勢》認為,“未來一個模型的好(hao)壞,80%由(you)數(shu)據質量決定。”

從長遠視角(jiao)看,大(da)模型(xing)的競爭并不(bu)是要比誰跑得更快,而(er)是比誰走得更遠,這就(jiu)需(xu)要大(da)模型(xing)真實的應用效(xiao)果(guo),也就(jiu)需(xu)要通過各(ge)種方(fang)式提升數據質量,來鍛造大(da)模型(xing)發展(zhan)的“內功”。

在數(shu)據(ju)的計(ji)劃、獲取(qu)、存儲、共享、維護、應用(yong)等環節,都需要針對性(xing)(xing)的數(shu)據(ju)管理、治(zhi)理,最(zui)終提升(sheng)數(shu)據(ju)質量。這是一個(ge)系統性(xing)(xing)工(gong)程(cheng),也為市面上的基(ji)礎設(she)施服務商們(men)帶來了機會。

例(li)如新(xin)華(hua)三的綠洲平臺就以場景需(xu)求為導(dao)向,打造(zao)了一個(ge)圍繞數據(ju)采集、存儲、管理和應用的全棧數據(ju)平臺。

通過內置AI算法,綠洲平臺(tai)大大提升(sheng)(sheng)了數(shu)(shu)據(ju)(ju)標記能力,讓數(shu)(shu)據(ju)(ju)治理、數(shu)(shu)據(ju)(ju)開(kai)發(fa)等過去很繁雜(za)的流(liu)程工作變得極為(wei)簡單,而知識圖譜構建能力則幫助(zhu)數(shu)(shu)據(ju)(ju)躍升(sheng)(sheng)為(wei)知識,從而能夠更好地被業務(wu)場(chang)景所使用(yong)。

事實上,數據(ju)深加工帶來高質量數據(ju)訓練一直(zhi)是前沿大模型(xing)的核心競爭力所在,OpenAI一貫公開其訓練過(guo)程及算(suan)法(fa),但對數據(ju)如何處(chu)理緘口不言(yan)。

回過頭來看,數(shu)據(ju)的(de)“要素(su)化(hua)(hua)”與(yu)“資產(chan)化(hua)(hua)”正在(zai)讓百行百業再次審視數(shu)據(ju)的(de)價(jia)值(zhi),在(zai)數(shu)據(ju)越(yue)來越(yue)作(zuo)為一(yi)種新型生產(chan)力要素(su)的(de)時(shi)代,大(da)模型的(de)本(ben)質可以視作(zuo)一(yi)種挖掘數(shu)據(ju)要素(su)價(jia)值(zhi)的(de)工(gong)具,而工(gong)具不(bu)決(jue)定(ding)價(jia)值(zhi),只決(jue)定(ding)效(xiao)率。

大(da)模(mo)型終將走入(ru)底(di)層(ceng)成為(wei)一種(zhong)普遍的(de)后端能力(li),技(ji)術(shu)本身(shen)越來越無法成為(wei)護(hu)城(cheng)河(he)(he),而數(shu)據則(ze)代表了(le)企(qi)業在前端與(yu)客戶/用(yong)戶的(de)連(lian)接程度,數(shu)據要素的(de)價(jia)值(zhi)釋放將成為(wei)企(qi)業真正的(de)“護(hu)城(cheng)河(he)(he)”。

所(suo)有的數(shu)據類平臺提升數(shu)據質量的過程(cheng),就是在幫助企(qi)業(ye)進一步挖掘數(shu)據要素價值、沉淀數(shu)據資產(chan),真正打造企(qi)業(ye)的“護城河(he)”。

03

算法“收斂化”,

殊途同歸下企業需聚焦訓練效率提升

算法是(shi)大模型(xing)的能(neng)力核心,但長(chang)期(qi)來看,算法能(neng)力卻(que)終將“收斂”。

目前的(de)(de)大模型算法基本上都(dou)基于Transformer架構(gou),該架構(gou)解決了過(guo)去RNN架構(gou)難以并(bing)行(xing)化等(deng)核(he)心缺陷(xian),是基因“優勝劣(lie)汰”的(de)(de)結(jie)果,BERT、GPT、T5、GLM等(deng)都(dou)其(qi)“衍生品”。

所以,算法生來都幾乎有(you)著相同的(de)“基因”。

而(er)在開(kai)發框架(jia)層(ceng)面(mian),伴隨著開(kai)源(yuan)生(sheng)態(tai)建設,國外的(de)TensorFlow、Pytorch,國內(nei)的(de)MindSpore等幾個主流框架(jia)逐(zhu)步成為共(gong)同的(de)選擇。

這意味著(zhu),算法的后(hou)天(tian)的“成長環境”也逐步趨同。

先天(tian)+后天(tian),算(suan)法創新當下看起來百花(hua)齊放,但在(zai)未(wei)來其價(jia)值創新的空間(jian)將逐步收窄,企業能夠通過努(nu)力(li)獲得(de)的相對優勢將越來越少(shao)。

甚至,在Llama 2掀起(qi)的開(kai)源浪潮下,算(suan)法創新的價值被進一步壓(ya)縮。

因此,從長期來看,企(qi)業最“可控”的價值(zhi)創(chuang)造將側重(zhong)到訓練效率而(er)非(fei)算法創(chuang)新上(shang)——同樣(yang)的能力(li)與潛力(li),PK更快(kuai)速地訓練迭代。

很多(duo)廠(chang)商提供的開(kai)發(fa)工具鏈都在直接推進訓(xun)練效(xiao)率,而一(yi)些原本旨在提供算力服(fu)務的平臺(tai)也實(shi)現了等價的功能。

例如(ru),傲飛算力平臺支(zhi)持斷(duan)點自動接(jie)續無感知訓練(lian)(lian),其(qi)原本目(mu)的(de)在于降低(di)參數(shu)迭代期間的(de)GPU資源等待、提升(sheng)資源利用效率(lv)(lv),但客觀上也(ye)直接(jie)帶來訓練(lian)(lian)效率(lv)(lv)的(de)提升(sheng),讓算法加速迭代,先把潛力跑出來。

畢竟,加速算法(fa)訓練,就是(shi)在提升算力(li)資(zi)源(yuan)利用效率。

04

行業規則“沉淀化”:

長期主義仍需回歸到正確的價值觀

大模(mo)型(xing)熱潮中,人(ren)人(ren)都(dou)會不(bu)自(zi)覺追求技(ji)術(shu)與商(shang)業價值“上(shang)限”,但大模(mo)型(xing)“下限”問題也(ye)日益突出,例(li)如數據隱私、數據安(an)全、知(zhi)識產權、技(ji)術(shu)濫用等(deng)。

從企業的視角看,行業規則建(jian)立迫(po)在(zai)眉睫,但其形(xing)成過程同(tong)樣存在(zai)著不由(you)企業決定(ding)的“客(ke)觀因素”。

關于行業發展的一些法律(lv)法規,監管部門(men)在(zai)逐步沉淀(dian),例(li)如(ru)國(guo)家網信(xin)辦聯合多部門(men)公(gong)布(bu)的《生成式(shi)人工(gong)智能服務管理(li)暫行辦法》,企業要做(zuo)的是(shi)等待并盡力配合與落實。

關于(yu)行(xing)業(ye)統一共識,也需要一個個沉淀,例(li)如,目前已經有從(cong)業(ye)者提議行(xing)業(ye)協(xie)作開發統一、可信的框架,在隱私保護、模型效(xiao)用和訓練(lian)效(xiao)率之(zhi)間取(qu)得(de)平(ping)衡,企業(ye)要做的是積極響(xiang)應、積極參與。

但(dan)在一些規則(ze)上,企業(ye)能(neng)(neng)夠、也(ye)必須充分發揮“可控”的價值創造能(neng)(neng)力。

例如,大模型數據安全“容錯(cuo)率低(di)”,企(qi)業必(bi)須加大投入。

很多(duo)基(ji)礎設施廠商都(dou)提供了相關(guan)的服務,例(li)如(ru)新華(hua)三的私域大(da)模(mo)型百業靈犀以(yi)內(nei)置(zhi)安(an)全限制提示詞和(he)(he)出入內(nei)容(rong)過(guo)濾攔(lan)截(jie)(jie)對所(suo)有場景下大(da)模(mo)型生成(cheng)內(nei)容(rong)進(jin)行(xing)安(an)全性限制,針對所(suo)有出入流量和(he)(he)內(nei)容(rong)進(jin)行(xing)安(an)全審計(ji)和(he)(he)敏感信息攔(lan)截(jie)(jie)。

當然,最直觀反應(ying)大模型倫理、體現“下限(xian)”的是場(chang)景應(ying)用的選擇問題。

科(ke)研、制造(zao)、醫藥、法(fa)律……大模型已經走向諸多能帶來社(she)會正向價(jia)值(zhi)的場景(jing)。但是,諸如偽造(zao)視頻進行詐騙等(deng)“場景(jing)應用”也已經出(chu)現,基于強力的大模型技術有著更(geng)強的欺(qi)騙性。

技術是刀,大模型是一把更鋒利的刀,它的作(zuo)用和價值(zhi)由使用的人決定。

說到底(di),企業需要構(gou)建正(zheng)確的價值觀,將大模型(xing)能力(li)導向(xiang)數字經濟的正(zheng)向(xiang)價值上,才能守(shou)住“下(xia)限”、實現大模型(xing)的長期健康(kang)發展。

05

結語

大(da)模型賽道上,企業必須在“可控”的價(jia)值創造空間(jian)上發(fa)力,才能不斷在各(ge)個維度(du)獲得更多相對競爭優勢與發(fa)展可能性(xing)。

企業也必須(xu)以此為標準選擇基礎(chu)設施服務(wu)、大(da)模(mo)型服務(wu)的廠商,尤其是在多個維(wei)度都能滿足需要的廠商。

可以說,大模(mo)型給了(le)這個時代全(quan)新(xin)的增量價值方向(xiang),只有幫助(zhu)企(qi)業實現對“可控”價值創造的把握(wo),才能讓企(qi)業在這個全(quan)新(xin)方向(xiang)更有著力點。

人工智能 大模型
評論
還可輸入300個字
專欄介紹
智能相對論
111篇文章
深挖人工智能這口井,評出咸淡,講出黑白,道出深淺。
+關注
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微(wei)信訂閱