“AI大模型”已经成创业热点

“AI大模型”已經成創業熱點

AI芯天下 ·

方文三

2023/02/21

如果將AI比作電力，那么大模型則相當于發電機，能將智能在更大的規模和范圍普及。

本文來自于微信公眾號“AI芯天下”（ID：World_2078），作者：方文三，投融界經授權發布。

AI大模型已(yi)經成為創業(ye)熱點。

2012年，李(li)志飛選擇回(hui)國，在語音交互領(ling)域創(chuang)業，創(chuang)立(li)出門問問。

前商(shang)湯(tang)科(ke)技副總裁、通(tong)用智(zhi)能技術負責人閆俊杰已(yi)進軍多模態AI大模型領域(yu)，于2021年11月(yue)成立人工智(zhi)能公司MiniMax。

MiniMax從(cong)底層做(zuo)起，形成了文(wen)本(ben)到視覺(jue)（texttovisual）、文(wen)本(ben)到語音（texttoaudio）、文(wen)本(ben)到文(wen)本(ben)（texttotext）三(san)大模(mo)態的基礎模(mo)型架構。

這可(ke)能是國(guo)內第(di)一(yi)家同時擁有3個模(mo)態大模(mo)型能力的(de)創(chuang)業公司(si)。

在(zai)toC方向(xiang)，其首款(kuan)AI虛擬聊(liao)天社交軟件(jian)Glow推出(chu)四(si)個月已經積累數(shu)百(bai)萬用戶；在(zai)toB方向(xiang)，MiniMax計劃在(zai)今年對外開放(fang)API。

Glow的基本玩法是在應(ying)用中創建虛擬AI機器人，可以(yi)根(gen)據(ju)用戶意愿賦(fu)予其性格，實(shi)現(xian)實(shi)時(shi)溝通、互動并建立情感連接。

“AI大模型”已經成創業熱點

助推AI應用走向(xiang)具體落地

如(ru)果將AI比作電(dian)(dian)力，那么大模(mo)型(xing)則相當于發電(dian)(dian)機，能(neng)將智能(neng)在更大的規模(mo)和范圍(wei)普及(ji)。

大模型的(de)智能(neng)能(neng)力在(zai)未來(lai)將成為一(yi)種公共基礎資源(yuan)，像電(dian)力或自來(lai)水一(yi)樣隨(sui)取隨(sui)用(yong)。

每個智能(neng)終端、每個APP，每個智能(neng)服務平臺，都(dou)可以像接入電網一樣，接入由IT基礎(chu)設(she)施(shi)組成的智力網絡，讓AI算法與技術能(neng)夠更(geng)廣(guang)泛(fan)地應用于各(ge)行各(ge)業。

最底層是AI通用大模型，上面(mian)可(ke)以做(zuo)AIGC，比如說(shuo)Midjourney可(ke)以畫畫，Jasper可(ke)以寫文案等(deng)；

也可以基于底(di)層模(mo)型做對(dui)話機器人，比如基于ChatGPT。

在美國，除了OpenAI和巨頭，還有另外(wai)三、四(si)家創(chuang)業公司也都(dou)(dou)在做(zuo)AI通用大(da)模型，都(dou)(dou)有大(da)幾億美金的投入。

首先(xian)它(ta)有超強的(de)語(yu)(yu)言能力，在學(xue)習語(yu)(yu)言的(de)過程(cheng)中，也(ye)學(xue)習了很多(duo)知識和邏輯(ji)。

模(mo)型學會了非常底層(ceng)的(de)(de)結(jie)構(gou)(gou)和機制(zhi)。萬物都是自然產生的(de)(de)，語言(yan)也好(hao)(hao)，生物結(jie)構(gou)(gou)也好(hao)(hao)，它一定符合某種我(wo)們目前(qian)難以解(jie)釋的(de)(de)規律。

模(mo)型經(jing)過互聯網上所有的(de)數據訓練之后，它(ta)也獲得了某種屬(shu)于自己的(de)解讀方式。

現在的通用(yong)大模型，即使進行了微調后，依舊可以做(zuo)多個任務。

預訓練(lian)的核心是讓(rang)它(ta)有基礎的認知和邏輯(ji)能力，通過(guo)微(wei)調引導，讓(rang)它(ta)能夠在各項任務上處理得更(geng)好，知道(dao)怎(zen)么(me)使用(yong)已(yi)有的知識。

“AI大模型”已經成創業熱點

國內公司(si)與機(ji)構競相研發

AI大(da)模(mo)(mo)型(xing)先后經歷了(le)預(yu)訓(xun)練(lian)模(mo)(mo)型(xing)、大(da)規(gui)模(mo)(mo)預(yu)訓(xun)練(lian)模(mo)(mo)型(xing)、超大(da)規(gui)模(mo)(mo)預(yu)訓(xun)練(lian)模(mo)(mo)型(xing)三個階段，參數量實現了(le)從(cong)億級到百萬億級的突破。

國外的超(chao)大規模預訓練模型起步(bu)于(yu)2018年，并在2021年進(jin)入[軍備競賽]階段。

而在國內(nei)，超大模型(xing)研發展異常迅速，2021年(nian)成(cheng)為中(zhong)國AI大模型(xing)的爆(bao)發年(nian)。

2021年(nian)，商湯發布(bu)了書生(sheng)（INTERN）大模型，擁有100億的參數量，這是(shi)一個相(xiang)當龐大的訓練工(gong)作。

在訓練過程中(zhong)，大概(gai)有10個以上的(de)監(jian)督(du)信號幫助模型(xing)，適配各種(zhong)不同(tong)的(de)視覺或者NLP任務(wu)，截至2021年中(zhong)，商湯已建成世(shi)界上最大的(de)計算(suan)器視覺模型(xing)，該(gai)模型(xing)擁有超(chao)過300億個參數；

同年4月，華(hua)為云聯(lian)合(he)循(xun)環智能發布盤古(gu)NLP超大規(gui)模(mo)預訓練語(yu)言模(mo)型，參數規(gui)模(mo)達1000億；

聯合北京大學發(fa)布盤古α超大規(gui)模(mo)預訓(xun)練模(mo)型(xing)，參數規(gui)模(mo)達(da)2000億(yi)。

阿里達摩院發(fa)布270億參(can)數的中(zhong)文(wen)預(yu)訓練語言(yan)模型PLUG，聯(lian)合清華(hua)大(da)學發(fa)布參(can)數規模達到1000億的中(zhong)文(wen)多模態預(yu)訓練模型M6；

7月(yue)，百度推(tui)出ERNIE3.0知識增強大(da)模型，參數規模達到百億；

10月，浪潮信息發布約2500億的超大規模預訓練模型[源1.0]；

12月，百度推出ERNIE3.0Titan模(mo)型(xing)，參數規模(mo)達2600億。

而達摩院的M6模型(xing)參數(shu)達到10萬(wan)億，將(jiang)大模型(xing)參數(shu)直接(jie)提升了一個量(liang)級。

2022年(nian)，基于清華大學、阿里達摩院(yuan)等研究成果(guo)以及(ji)超算基礎(chu)實現的[腦級人工(gong)智能模(mo)型]八卦爐（BAGUALU）完成建立。

其模(mo)型(xing)(xing)參數模(mo)型(xing)(xing)突破了174萬億個，完全可以與(yu)人腦(nao)中的突觸(chu)數量相媲美。

2021年12月，百度發布了全球首個知識增強千億(yi)級大模(mo)型——鵬城-百度·文(wen)心(xin)大模(mo)型，產業(ye)級知識增強[文(wen)心(xin)大模(mo)型]系(xi)列(lie)大模(mo)型也(ye)正式對(dui)外。

百度(du)文心大(da)模型正從技術自主創新和加速(su)產業應用兩方面，推動中國AI發展更進一步。

2022年11月，百度發布了文(wen)心大(da)模型的最新升級(ji)，包括新增11個大(da)模型，大(da)模型總量增至36個。

部(bu)分公(gong)司(si)中國公(gong)司(si)雖(sui)然目前(qian)還沒有(you)正式推出自身大模型(xing)產品，但是(shi)也在積極進行研發。

云(yun)從科技的(de)研究團隊高度認同[預(yu)訓(xun)練大模型(xing)+下游任(ren)務(wu)遷移(yi)]的(de)技術趨勢，從2020年開(kai)(kai)始，已(yi)經陸續(xu)在NLP、OCR、機器(qi)視覺、語音等多個領域(yu)開(kai)(kai)展預(yu)訓(xun)練大模型(xing)的(de)實踐。

以商湯科技(ji)的書生（INTERN）為例(li)，在分類、目標檢(jian)測、語義(yi)分割、深度估計四大(da)任務(wu)26個(ge)數據集上(shang)，基于同樣下游場景(jing)數據（10%）。

相較于同期OpenAI發布的最強(qiang)開源模型CLIP-R50x16，平(ping)均錯(cuo)誤率降低了(le)40.2%，47.3%，34.8%，9.4%。

“AI大模型”已經成創業熱點

實現從[手工作(zuo)坊]到[工廠(chang)模(mo)式]的轉變

在深度學習(xi)技術興起(qi)的(de)近10年(nian)間，AI模型基本上是針對特(te)定應用場景(jing)需求(qiu)進行訓(xun)練的(de)，即(ji)小模型，屬于傳(chuan)統的(de)定制化(hua)、作坊式(shi)的(de)模型開發方式(shi)。

這意味著(zhu)除了需(xu)(xu)要優秀的(de)產品經理準確確定需(xu)(xu)求之外，還需(xu)(xu)要AI研發人員扎實的(de)專(zhuan)業知識(shi)和協同合作(zuo)能力完成大量復雜的(de)工作(zuo)。

模型無法復用和積(ji)累，同(tong)樣導致了AI落(luo)地的高門檻(jian)、高成本與低效率。

而大模型(xing)通(tong)(tong)過從海(hai)量(liang)的(de)、多類型(xing)的(de)場景數據中學習(xi)，并總(zong)結(jie)不同(tong)場景、不同(tong)業務下(xia)的(de)通(tong)(tong)用能(neng)力，學習(xi)出(chu)一種特征和規則，成為具有泛化能(neng)力的(de)模型(xing)底座(zuo)。

由(you)此利用(yong)大模(mo)(mo)型的通用(yong)能(neng)力可以有(you)效(xiao)的應對多樣化(hua)、碎片化(hua)的AI應用(yong)需(xu)求，為實現規模(mo)(mo)推廣AI落(luo)地應用(yong)提供可能(neng)。

大模(mo)型相對于傳統AI模(mo)型開(kai)發模(mo)式在(zai)研(yan)發時擁有(you)更標準化的流(liu)程，在(zai)落地(di)時擁有(you)更強的通用性，可以泛化到多種應用場景；

并且大(da)模(mo)(mo)型(xing)(xing)的自監督學習能力相較于傳統的需要人(ren)工標注的模(mo)(mo)型(xing)(xing)訓練能夠顯(xian)著降低研發成本，共同使得大(da)模(mo)(mo)型(xing)(xing)對于AI產(chan)業具有重(zhong)要意(yi)義。

“AI大模型”已經成創業熱點

結尾(wei)

熱(re)潮已(yi)經襲來，有技術(shu)基礎的(de)企業在強勢突圍，沒有技術(shu)基礎的(de)企業準備發力，尚(shang)待進場。

而等熱潮退去，能否留在場(chang)上，還需看清自(zi)己的優勢和短板。

中國要有自己(ji)的通(tong)用自然語義大(da)模(mo)型，它需要有為全球通(tong)用人(ren)工智(zhi)能提供中國智(zhi)慧、中國價值體系和(he)中國方(fang)案的愿(yuan)景(jing)；

需(xu)(xu)要從語料庫選擇、模型建構與(yu)訓練、參(can)數(shu)調(diao)整的全過程前置規避風險(xian)和(he)法律(lv)、道德與(yu)倫理(li)問題，更需(xu)(xu)要的是定力和(he)耐心。

無論(lun)如何，它不(bu)能(neng)投(tou)機。

AI 模型參數

評論

還可輸入300個字

發布留言

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇