50607 大模型“免費”送,廠商們圖什么?

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
大模型“免費”送,廠商們圖什么?
壹度Pro ·

辰樹

06/05
參照云計算價格戰的經驗,此番大模型價格戰或許可以吸引更多下游企業認真審視大模型,有望基于相關技術探索出更多良性的商業模式。
本文來自于微信公眾號“壹度Pro”(ID:yiducaijing2021),作者:辰樹,投融界經授權發布。

2024年618,傳統電商(shang)行業(ye)不再喧囂,但大(da)模型市場卻開啟了慘烈的(de)“價格(ge)戰(zhan)”,甚至部分企(qi)業(ye)直接(jie)免費送(song)大(da)模型服務。

5月15日,字節(jie)跳動宣布,豆包主力模型企業市場定價為0.0008元/千Tokens,0.8厘可處理1500多個漢(han)字,比行業便宜99.3%。

一周后,阿里云也對外宣布,通義(yi)千(qian)問GPT-4級主力模型Qwen-Long的API輸入價格(ge)降至0.0005元/千(qian)Tokens,直降97%。

阿里(li)云卷入“價格戰(zhan)”后(hou),百(bai)度、騰(teng)訊云、科(ke)大訊飛等企業也接連宣布自家的大模(mo)型降(jiang)價。其中百(bai)度甚至(zhi)宣布,兩款基礎模(mo)型可(ke)免費調用。

不(bu)可否認(ren)的是,隨著技術逐漸成(cheng)熟,大模型的成(cheng)本正不(bu)斷下探。為了盡(jin)快(kuai)俘(fu)獲更多企業客戶,拓寬市場影響(xiang)力(li),上游(you)算力(li)提供商確實需(xu)要盡(jin)力(li)降價。

然而需要(yao)注意的是,盡管(guan)大(da)模型(xing)(xing)成(cheng)本正(zheng)逐步下探,但目前大(da)部分企業的大(da)模型(xing)(xing)業務(wu)依然面(mian)臨(lin)算力、人力成(cheng)本高(gao)企的挑(tiao)戰,沒能盈利。在此背景下,上游算力提供商不斷降價,甚至免費送(song)大(da)模型(xing)(xing),顯得十(shi)分反(fan)常(chang)。

這種(zhong)非(fei)理性的價格戰,其實凸顯出了上游企業亟(ji)待通(tong)(tong)過讓利(li),打通(tong)(tong)大模型商業閉環的內在焦慮。

01

價格戰背后,大模型商業困局難解

2023年以來,隨著(zhu)ChatGPT爆火,諸多科技公司(si)都看到了AI大(da)(da)模(mo)型蘊含著(zhu)巨大(da)(da)的商業價值,因而(er)加碼相關業務。2024年3月,國(guo)家(jia)數(shu)據(ju)局局長(chang)劉烈宏(hong)透露,中國(guo)10億參數(shu)規模(mo)以上大(da)(da)模(mo)型數(shu)量已超100個。

大模型“免費”送,廠商們圖什么?

然而(er)隨(sui)著越來越多企業(ye)入局相關產業(ye),大模(mo)型商業(ye)模(mo)式不健全,成本高、落地難、下(xia)游企業(ye)持觀望態(tai)度等問(wen)題愈發凸(tu)顯。

由于需要(yao)采購(gou)高性能(neng)計(ji)算機,并且需要(yao)進行模型訓(xun)練(lian),大模型的(de)成本異常(chang)高昂。以OpenAI為(wei)(wei)例,其訓(xun)練(lian)GPT-4的(de)FLOPS約(yue)為(wei)(wei)2.15e25,一次訓(xun)練(lian)成本為(wei)(wei)6300萬(wan)美元。The Information報道,2022年,OpenAI虧損約(yue)為(wei)(wei)5.4億美元左(zuo)右(you),約(yue)擴大一倍(bei)。

目前,大部(bu)分企業都意識(shi)到了大模(mo)型的參(can)數越多,商業想象力越大,因(yin)而持續加碼模(mo)型訓練(lian)。不過問題也隨之(zhi)而來,那就是大模(mo)型僅僅問世(shi)兩(liang)年(nian)時間,下游創收手段(duan)十分有限。

整體而言,大(da)模(mo)型有兩種創(chuang)收(shou)模(mo)式,一是直接向用(yong)(yong)戶收(shou)取訂(ding)閱(yue)費,二是向開發者收(shou)取API調用(yong)(yong)費。比如,2023年初,OpenAI推出了會員訂(ding)閱(yue)服務ChatGPT Plus,費用(yong)(yong)為20美(mei)元/月,可使用(yong)(yong)基(ji)于GPT-4的(de)模(mo)型,并且提(ti)供更快的(de)響應時(shi)間(jian)、優先訪(fang)問等權限。

不過,據Reddot聯合創始人Pierre Herubel測算,即使以每月擁有100萬訂戶估計,ChatGPT Plus每年(nian)或(huo)只能為OpenAI帶來2.4億美元左右收入,很難幫助公司(si)扭虧為盈。

因此(ci),目前以OpenAI為代表企業(ye)的(de)(de)發(fa)力重點(dian),是(shi)向企業(ye)收取API調(diao)用費。參照云計算的(de)(de)經驗,外部(bu)的(de)(de)企業(ye)從(cong)零開(kai)始訓練(lian)大(da)語言模型非常困難,傾(qing)向于采(cai)購成熟(shu)的(de)(de)AI大(da)模型技術(shu),一旦(dan)這(zhe)些企業(ye)探索出具(ju)備(bei)想象力的(de)(de)商(shang)業(ye)模式,即(ji)可反哺上(shang)游算力提供商(shang),進而實現多方共贏。

對此,2023年11月(yue),百度創始人兼CEO李彥宏(hong)曾表示,不斷(duan)地重復開發基(ji)礎(chu)大(da)模(mo)(mo)型是對社(she)會(hui)資源的極大(da)浪費,“AI原(yuan)生時代,我們需(xu)要100萬量級的AI原(yuan)生應(ying)用,但是不需(xu)要100個大(da)模(mo)(mo)型。”

02

算力提供商作出表率,但B端企業仍持觀望態度

由于大(da)部分大(da)模型算力提供商都是(shi)平臺型企(qi)業(ye),推出大(da)模型技術(shu)后(hou),這些(xie)企(qi)業(ye)紛紛在內部試水相關技術(shu)的商業(ye)化,以圖給下游客(ke)戶做(zuo)出商業(ye)化表率(lv)。

比如,2023年(nian)阿里云峰會(hui)上(shang),時任(ren)阿里巴(ba)巴(ba)集(ji)團董事會(hui)主席兼(jian)CEO、阿里云智能(neng)集(ji)團CEO張(zhang)勇表示(shi):“阿里巴(ba)巴(ba)所有產品(pin)未來將接入‘通(tong)義千問’大(da)模型,進行全面改造。”

以釘(ding)(ding)釘(ding)(ding)為(wei)例,接入大模型后,其支持AI生(sheng)成(cheng)推(tui)廣文案、繪圖方式創建應用、視頻會議中生(sheng)成(cheng)摘要等(deng)功能。釘(ding)(ding)釘(ding)(ding)總裁葉軍認為(wei),大模型將(jiang)會讓(rang)釘(ding)(ding)釘(ding)(ding)的收(shou)入增長(chang)百分之幾(ji)十(shi)。

無獨(du)有(you)偶(ou),過(guo)去一(yi)段時(shi)間(jian),騰(teng)訊也積極探索AI技術(shu)的(de)(de)商業化應用。2023年財報(bao)中,騰(teng)訊對外表示:“廣告AI模型的(de)(de)改進顯著提(ti)升了精(jing)準投放的(de)(de)效果…… 這些發展(zhan)帶(dai)動(dong)了高質量的(de)(de)收入來源,推動(dong)毛利增長 23%。”

自有業(ye)務挖掘出AI的(de)商(shang)業(ye)價值后,上(shang)游算(suan)力提供商(shang)正致力于(yu)針(zhen)對垂(chui)直行(xing)業(ye)的(de)細分需求,提供定制大(da)模型能(neng)力。

比如,2023年(nian)6月,騰(teng)訊(xun)云(yun)宣布開啟“騰(teng)訊(xun)云(yun)行(xing)業大(da)模型生態(tai)計(ji)劃”,致力于推進(jin)大(da)模型在產業領(ling)域的創新和落地。據悉,騰(teng)訊(xun)云(yun)已為傳媒(mei)、文旅、政務(wu)等10余個行(xing)業提供了(le)超50個大(da)模型行(xing)業解決方案。

然而需要注意(yi)的是,平(ping)臺型(xing)(xing)企業大(da)多擁有(you)自研大(da)模(mo)型(xing)(xing)技術,無論(lun)是試(shi)錯(cuo)還是使(shi)用成(cheng)本都更低,往往只會對外宣傳商(shang)業路徑清晰(xi)的大(da)模(mo)型(xing)(xing)落地(di)案例。

反(fan)觀外(wai)部的(de)企(qi)業需要采購(gou)上(shang)游的(de)大模(mo)型技術,探索成本相對更高,并(bing)且(qie)商(shang)業模(mo)式(shi)不(bu)清晰(xi),很難擁有(you)足(zu)夠的(de)積極性。見實團隊披露的(de)《AI應用需求與付(fu)費意愿調研報告》顯示(shi),46.2%的(de)企(qi)業AI預算(suan)在1萬(wan)(wan)(wan)元以下,另有(you)22.2%和24%的(de)企(qi)業預算(suan)分別為1萬(wan)(wan)(wan)-5萬(wan)(wan)(wan)元以及5萬(wan)(wan)(wan)元-10萬(wan)(wan)(wan)元,這(zhe)些中腰部企(qi)業沒有(you)足(zu)夠的(de)預算(suan)探索AI。

此前,大部分(fen)主力模型產品的(de)API輸入價(jia)格不菲,比如,Qwen-Long為0.02元(yuan)(yuan)/千tokens,1萬(wan)元(yuan)(yuan)只可以購買(mai)5億個(ge)tokens。如果一(yi)個(ge)產品有500萬(wan)月活,1萬(wan)元(yuan)(yuan)的(de)預算,一(yi)個(ge)月平(ping)均只能供每個(ge)用(yong)(yong)戶使(shi)用(yong)(yong)100個(ge)tokens,顯然不夠。

03

成本雖屢屢下探,但算力提供商已急不可耐

顯而易見,當(dang)下(xia)限制(zhi)(zhi)大模型(xing)B端商(shang)業化(hua)落地的(de)主(zhu)要障礙(ai),就(jiu)是API成本(ben)過(guo)高,限制(zhi)(zhi)了B端企(qi)業探索(suo)相應的(de)商(shang)業閉環。因此,目前(qian)算(suan)力提供商(shang)的(de)發力方向,就(jiu)是致力于通過(guo)技術手段,壓(ya)低大模型(xing)的(de)成本(ben),降低B端企(qi)業的(de)使用(yong)成本(ben)。

開頭提到,字(zi)節跳動旗下(xia)豆包主(zhu)力(li)模型企業市場(chang)定(ding)價為(wei)0.0008元/千(qian)Tokens,比(bi)行(xing)業便(bian)宜99.3%。對(dui)此(ci),火山引(yin)擎總裁譚待表示:“豆包模型的超低定(ding)價,來源于我們(men)有(you)信心(xin)用技術手段優化成(cheng)本,而不(bu)是補貼或是打(da)價格戰爭奪(duo)市場(chang)份(fen)額(e)。”

無(wu)獨(du)有(you)偶,2024年5月6日,深度求索開源了第(di)二代(dai)MoE模(mo)型(xing)(xing)DeepSeek-V2,性能更(geng)強(qiang),訓(xun)練(lian)成本更(geng)低。據悉,DeepSeek可節省42.5%訓(xun)練(lian)成本,減少93.3%的KV緩存(cun),最大吞吐(tu)量提高5.76倍。整(zheng)體而言,DeepSeek-V2消耗的顯(xian)存(cun)(KV Cache)只有(you)同級別Dense模(mo)型(xing)(xing)的1/5-1/100。

不過,這并不意(yi)味著當(dang)下大模(mo)(mo)型(xing)行(xing)業(ye)的價格(ge)戰十分(fen)正常。2024年(nian)(nian)5月(yue),談(tan)及大模(mo)(mo)型(xing)的發(fa)展趨(qu)勢時(shi),零一(yi)萬(wan)物(wu)CEO李開(kai)復接受采訪時(shi)表示:“未(wei)來整(zheng)個行(xing)業(ye)的推理成本每年(nian)(nian)降(jiang)(jiang)低10倍是(shi)可以期待(dai)的,而且這個趨(qu)勢是(shi)必(bi)然的。”未(wei)來,大模(mo)(mo)型(xing)的成本將呈階梯(ti)狀(zhuang)下探,但目前(qian)大模(mo)(mo)型(xing)的價格(ge)卻斷崖式下探,甚至部分(fen)企業(ye)免費送,降(jiang)(jiang)價幅(fu)度遠超上游成本降(jiang)(jiang)幅(fu)。

上游算力(li)提供(gong)商之所(suo)以(yi)(yi)(yi)如此(ci)內卷(juan),很大程(cheng)度上都是希望俘獲更多的B端(duan)企業(ye)(ye)(ye),一方面(mian)實現規模(mo)(mo)效應,另(ling)一方面(mian),讓(rang)B端(duan)企業(ye)(ye)(ye)無負擔(dan)地探索良(liang)性的商業(ye)(ye)(ye)模(mo)(mo)式。對(dui)此(ci),譚待表示:“大的使用量(liang),才能打磨出好模(mo)(mo)型(xing),也(ye)能大幅降低模(mo)(mo)型(xing)推理的單位(wei)成本(ben)……大模(mo)(mo)型(xing)從以(yi)(yi)(yi)分(fen)計價(jia)到以(yi)(yi)(yi)厘計價(jia),將助力(li)企業(ye)(ye)(ye)以(yi)(yi)(yi)更低成本(ben)加速業(ye)(ye)(ye)務(wu)創新。”

盡管激(ji)烈的價格(ge)戰(zhan)之下,大模(mo)型(xing)已經(jing)進入“免費時代”,但其實大部分(fen)上游(you)算(suan)力提供商為了后續創(chuang)收,都(dou)留有(you)更為隱晦的收費手段。

目(mu)前,大部(bu)分大模型僅推(tui)(tui)理用的(de)token降價(jia),而訓練和(he)部(bu)署(shu)成本(ben)依然(ran)不低(di)。比(bi)如(ru),阿里(li)的(de)qwen-turbo 模型百萬個token推(tui)(tui)理只要2元(yuan),若是訓練,就需要30元(yuan),部(bu)署(shu)時(shi),每月需要2萬元(yuan)。

由此來看,大模型進(jin)入“免費時代”,很大程度上(shang)其實只是一個宣傳意(yi)義上(shang)的噱頭。如果下游企業想(xiang)要(yao)用上(shang)成(cheng)套大模型服(fu)務,那么不(bu)能(neng)不(bu)付出更高的使用成(cheng)本。

而之所以上游算力提供商僅(jin)僅(jin)降(jiang)低(di)推理用的(de)token成本,主(zhu)要是(shi)因為通(tong)過內(nei)部應用,其(qi)對于大模型(xing)的(de)商業價值(zhi)足夠自信(xin),希望降(jiang)價的(de)噱頭起到引(yin)流的(de)作用。

參照云計算價(jia)格(ge)戰的(de)(de)經(jing)驗,此番大模(mo)型價(jia)格(ge)戰或許可以吸引更多下游企業(ye)認真審視大模(mo)型,有望基于相關技術探索(suo)出更多良性的(de)(de)商業(ye)模(mo)式。

大模(mo)型(xing) AI 算力(li)
評論
還可輸入300個字
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微信(xin)訂閱