45872 “AI大模型”已經成創業熱點

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
“AI大模型”已經成創業熱點
AI芯天下 ·

方文三

2023/02/21
如果將AI比作電力,那么大模型則相當于發電機,能將智能在更大的規模和范圍普及。
本文來自于微信公眾號“AI芯天下”(ID:World_2078),作者:方文三,投融界經授權發布。

AI大模型已(yi)經成為創業(ye)熱點。

2012年,李(li)志飛選擇回(hui)國,在語音交互領(ling)域創(chuang)業,創(chuang)立(li)出門問問。

前商(shang)湯(tang)科(ke)技副總裁、通(tong)用智(zhi)能技術負責人閆俊杰已(yi)進軍多模態AI大模型領域(yu),于2021年11月(yue)成立人工智(zhi)能公司MiniMax。

MiniMax從(cong)底層做(zuo)起,形成了文(wen)本(ben)到視覺(jue)(texttovisual)、文(wen)本(ben)到語音(texttoaudio)、文(wen)本(ben)到文(wen)本(ben)(texttotext)三(san)大模(mo)態的基礎模(mo)型架構。

這可(ke)能是國(guo)內第(di)一(yi)家同時擁有3個模(mo)態大模(mo)型能力的(de)創(chuang)業公司(si)。

在(zai)toC方向(xiang),其首款(kuan)AI虛擬聊(liao)天社交軟件(jian)Glow推出(chu)四(si)個月已經積累數(shu)百(bai)萬用戶;在(zai)toB方向(xiang),MiniMax計劃在(zai)今年對外開放(fang)API。

Glow的基本玩法是在應(ying)用中創建虛擬AI機器人,可以(yi)根(gen)據(ju)用戶意愿賦(fu)予其性格,實(shi)現(xian)實(shi)時(shi)溝通、互動并建立情感連接。

“AI大模型”已經成創業熱點

助推AI應用走向(xiang)具體落地

如(ru)果將AI比作電(dian)(dian)力,那么大模(mo)型(xing)則相當于發電(dian)(dian)機,能(neng)將智能(neng)在更大的規模(mo)和范圍(wei)普及(ji)。

大模型的(de)智能(neng)能(neng)力在(zai)未來(lai)將成為一(yi)種公共基礎資源(yuan),像電(dian)力或自來(lai)水一(yi)樣隨(sui)取隨(sui)用(yong)。

每個智能(neng)終端、每個APP,每個智能(neng)服務平臺,都(dou)可以像接入電網一樣,接入由IT基礎(chu)設(she)施(shi)組成的智力網絡,讓AI算法與技術能(neng)夠更(geng)廣(guang)泛(fan)地應用于各(ge)行各(ge)業。

最底層是AI通用大模型,上面(mian)可(ke)以做(zuo)AIGC,比如說(shuo)Midjourney可(ke)以畫畫,Jasper可(ke)以寫文案等(deng);

也可以基于底(di)層模(mo)型做對(dui)話機器人,比如基于ChatGPT。

在美國,除了OpenAI和巨頭,還有另外(wai)三、四(si)家創(chuang)業公司也都(dou)(dou)在做(zuo)AI通用大(da)模型,都(dou)(dou)有大(da)幾億美金的投入。

首先(xian)它(ta)有超強的(de)語(yu)(yu)言能力,在學(xue)習語(yu)(yu)言的(de)過程(cheng)中,也(ye)學(xue)習了很多(duo)知識和邏輯(ji)。

模(mo)型學會了非常底層(ceng)的(de)(de)結(jie)構(gou)(gou)和機制(zhi)。萬物都是自然產生的(de)(de),語言(yan)也好(hao)(hao),生物結(jie)構(gou)(gou)也好(hao)(hao),它一定符合某種我(wo)們目前(qian)難以解(jie)釋的(de)(de)規律。

模(mo)型經(jing)過互聯網上所有的(de)數據訓練之后,它(ta)也獲得了某種屬(shu)于自己的(de)解讀方式。

現在的通用(yong)大模型,即使進行了微調后,依舊可以做(zuo)多個任務。

預訓練(lian)的核心是讓(rang)它(ta)有基礎的認知和邏輯(ji)能力,通過(guo)微(wei)調引導,讓(rang)它(ta)能夠在各項任務上處理得更(geng)好,知道(dao)怎(zen)么(me)使用(yong)已(yi)有的知識。

“AI大模型”已經成創業熱點

國內公司(si)與機(ji)構競相研發

AI大(da)模(mo)(mo)型(xing)先后經歷了(le)預(yu)訓(xun)練(lian)模(mo)(mo)型(xing)、大(da)規(gui)模(mo)(mo)預(yu)訓(xun)練(lian)模(mo)(mo)型(xing)、超大(da)規(gui)模(mo)(mo)預(yu)訓(xun)練(lian)模(mo)(mo)型(xing)三個階段,參數量實現了(le)從(cong)億級到百萬億級的突破。

國外的超(chao)大規模預訓練模型起步(bu)于(yu)2018年,并在2021年進(jin)入[軍備競賽]階段。

而在國內(nei),超大模型(xing)研發展異常迅速,2021年(nian)成(cheng)為中(zhong)國AI大模型(xing)的爆(bao)發年(nian)。

2021年(nian),商湯發布(bu)了書生(sheng)(INTERN)大模型,擁有100億的參數量,這是(shi)一個相(xiang)當龐大的訓練工(gong)作。

在訓練過程中(zhong),大概(gai)有10個以上的(de)監(jian)督(du)信號幫助模型(xing),適配各種(zhong)不同(tong)的(de)視覺或者NLP任務(wu),截至2021年中(zhong),商湯已建成世(shi)界上最大的(de)計算(suan)器視覺模型(xing),該(gai)模型(xing)擁有超(chao)過300億個參數;

同年4月,華(hua)為云聯(lian)合(he)循(xun)環智能發布盤古(gu)NLP超大規(gui)模(mo)預訓練語(yu)言模(mo)型,參數規(gui)模(mo)達1000億;

聯合北京大學發(fa)布盤古α超大規(gui)模(mo)預訓(xun)練模(mo)型(xing),參數規(gui)模(mo)達(da)2000億(yi)。

阿里達摩院發(fa)布270億參(can)數的中(zhong)文(wen)預(yu)訓練語言(yan)模型PLUG,聯(lian)合清華(hua)大(da)學發(fa)布參(can)數規模達到1000億的中(zhong)文(wen)多模態預(yu)訓練模型M6;

7月(yue),百度推(tui)出ERNIE3.0知識增強大(da)模型,參數規模達到百億;

10月,浪潮信息發布約2500億的超大規模預訓練模型[源1.0];

12月,百度推出ERNIE3.0Titan模(mo)型(xing),參數規模(mo)達2600億。

而達摩院的M6模型(xing)參數(shu)達到10萬(wan)億,將(jiang)大模型(xing)參數(shu)直接(jie)提升了一個量(liang)級。

2022年(nian),基于清華大學、阿里達摩院(yuan)等研究成果(guo)以及(ji)超算基礎(chu)實現的[腦級人工(gong)智能模(mo)型]八卦爐(BAGUALU)完成建立。

其模(mo)型(xing)(xing)參數模(mo)型(xing)(xing)突破了174萬億個,完全可以與(yu)人腦(nao)中的突觸(chu)數量相媲美。

2021年12月,百度發布了全球首個知識增強千億(yi)級大模(mo)型——鵬城-百度·文(wen)心(xin)大模(mo)型,產業(ye)級知識增強[文(wen)心(xin)大模(mo)型]系(xi)列(lie)大模(mo)型也(ye)正式對(dui)外。

百度(du)文心大(da)模型正從技術自主創新和加速(su)產業應用兩方面,推動中國AI發展更進一步。

2022年11月,百度發布了文(wen)心大(da)模型的最新升級(ji),包括新增11個大(da)模型,大(da)模型總量增至36個。

部(bu)分公(gong)司(si)中國公(gong)司(si)雖(sui)然目前(qian)還沒有(you)正式推出自身大模型(xing)產品,但是(shi)也在積極進行研發。

云(yun)從科技的(de)研究團隊高度認同[預(yu)訓(xun)練大模型(xing)+下游任(ren)務(wu)遷移(yi)]的(de)技術趨勢,從2020年開(kai)(kai)始,已(yi)經陸續(xu)在NLP、OCR、機器(qi)視覺、語音等多個領域(yu)開(kai)(kai)展預(yu)訓(xun)練大模型(xing)的(de)實踐。

以商湯科技(ji)的書生(INTERN)為例(li),在分類、目標檢(jian)測、語義(yi)分割、深度估計四大(da)任務(wu)26個(ge)數據集上(shang),基于同樣下游場景(jing)數據(10%)。

相較于同期OpenAI發布的最強(qiang)開源模型CLIP-R50x16,平(ping)均錯(cuo)誤率降低了(le)40.2%,47.3%,34.8%,9.4%。

“AI大模型”已經成創業熱點

實現從[手工作(zuo)坊]到[工廠(chang)模(mo)式]的轉變

在深度學習(xi)技術興起(qi)的(de)近10年(nian)間,AI模型基本上是針對特(te)定應用場景(jing)需求(qiu)進行訓(xun)練的(de),即(ji)小模型,屬于傳(chuan)統的(de)定制化(hua)、作坊式(shi)的(de)模型開發方式(shi)。

這意味著(zhu)除了需(xu)(xu)要優秀的(de)產品經理準確確定需(xu)(xu)求之外,還需(xu)(xu)要AI研發人員扎實的(de)專(zhuan)業知識(shi)和協同合作(zuo)能力完成大量復雜的(de)工作(zuo)。

模型無法復用和積(ji)累,同(tong)樣導致了AI落(luo)地的高門檻(jian)、高成本與低效率。

而大模型(xing)通(tong)(tong)過從海(hai)量(liang)的(de)、多類型(xing)的(de)場景數據中學習(xi),并總(zong)結(jie)不同(tong)場景、不同(tong)業務下(xia)的(de)通(tong)(tong)用能(neng)力,學習(xi)出(chu)一種特征和規則,成為具有泛化能(neng)力的(de)模型(xing)底座(zuo)。

由(you)此利用(yong)大模(mo)(mo)型的通用(yong)能(neng)力可以有(you)效(xiao)的應對多樣化(hua)、碎片化(hua)的AI應用(yong)需(xu)求,為實現規模(mo)(mo)推廣AI落(luo)地應用(yong)提供可能(neng)。

大模(mo)型相對于傳統AI模(mo)型開(kai)發模(mo)式在(zai)研(yan)發時擁有(you)更標準化的流(liu)程,在(zai)落地(di)時擁有(you)更強的通用性,可以泛化到多種應用場景;

并且大(da)模(mo)(mo)型(xing)(xing)的自監督學習能力相較于傳統的需要人(ren)工標注的模(mo)(mo)型(xing)(xing)訓練能夠顯(xian)著降低研發成本,共同使得大(da)模(mo)(mo)型(xing)(xing)對于AI產(chan)業具有重(zhong)要意(yi)義。

“AI大模型”已經成創業熱點

結尾(wei)

熱(re)潮已(yi)經襲來,有技術(shu)基礎的(de)企業在強勢突圍,沒有技術(shu)基礎的(de)企業準備發力,尚(shang)待進場。

而等熱潮退去,能否留在場(chang)上,還需看清自(zi)己的優勢和短板。

中國要有自己(ji)的通(tong)用自然語義大(da)模(mo)型,它需要有為全球通(tong)用人(ren)工智(zhi)能提供中國智(zhi)慧、中國價值體系和(he)中國方(fang)案的愿(yuan)景(jing);

需(xu)(xu)要從語料庫選擇、模型建構與(yu)訓練、參(can)數(shu)調(diao)整的全過程前置規避風險(xian)和(he)法律(lv)、道德與(yu)倫理(li)問題,更需(xu)(xu)要的是定力和(he)耐心。

無論(lun)如何,它不(bu)能(neng)投(tou)機。

AI 模型 參數
評論
還可輸入300個字
專欄介紹
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微信訂閱