大模型“免费”送，厂商们图什么？

大模型“免費”送，廠商們圖什么？

壹度Pro ·

辰樹

06/05

參照云計算價格戰的經驗，此番大模型價格戰或許可以吸引更多下游企業認真審視大模型，有望基于相關技術探索出更多良性的商業模式。

本文來自于微信公眾號“壹度Pro”（ID：yiducaijing2021），作者：辰樹，投融界經授權發布。

2024年618，傳統電商(shang)行業(ye)不再喧囂，但大(da)模型市場卻開啟了慘烈的(de)“價格(ge)戰(zhan)”，甚至部分企(qi)業(ye)直接(jie)免費送(song)大(da)模型服務。

5月15日，字節(jie)跳動宣布，豆包主力模型企業市場定價為0.0008元/千Tokens，0.8厘可處理1500多個漢(han)字，比行業便宜99.3%。

一周后，阿里云也對外宣布，通義(yi)千(qian)問GPT-4級主力模型Qwen-Long的API輸入價格(ge)降至0.0005元/千(qian)Tokens，直降97%。

阿里(li)云卷入“價格戰(zhan)”后(hou)，百(bai)度、騰(teng)訊云、科(ke)大訊飛等企業也接連宣布自家的大模(mo)型降(jiang)價。其中百(bai)度甚至(zhi)宣布，兩款基礎模(mo)型可(ke)免費調用。

不(bu)可否認(ren)的是，隨著技術逐漸成(cheng)熟，大模型的成(cheng)本正不(bu)斷下探。為了盡(jin)快(kuai)俘(fu)獲更多企業客戶，拓寬市場影響(xiang)力(li)，上游(you)算力(li)提供商確實需(xu)要盡(jin)力(li)降價。

然而需要(yao)注意的是，盡管(guan)大(da)模型(xing)(xing)成(cheng)本正(zheng)逐步下探，但目前大(da)部分企業的大(da)模型(xing)(xing)業務(wu)依然面(mian)臨(lin)算力、人力成(cheng)本高(gao)企的挑(tiao)戰，沒能盈利。在此背景下，上游算力提供商不斷降價，甚至免費送(song)大(da)模型(xing)(xing)，顯得十(shi)分反(fan)常(chang)。

這種(zhong)非(fei)理性的價格戰，其實凸顯出了上游企業亟(ji)待通(tong)(tong)過讓利(li)，打通(tong)(tong)大模型商業閉環的內在焦慮。

價格戰背后，大模型商業困局難解

2023年以來，隨著(zhu)ChatGPT爆火，諸多科技公司(si)都看到了AI大(da)(da)模(mo)型蘊含著(zhu)巨大(da)(da)的商業價值，因而(er)加碼相關業務。2024年3月，國(guo)家(jia)數(shu)據(ju)局局長(chang)劉烈宏(hong)透露，中國(guo)10億參數(shu)規模(mo)以上大(da)(da)模(mo)型數(shu)量已超100個。

大模型“免費”送，廠商們圖什么？

然而(er)隨(sui)著越來越多企業(ye)入局相關產業(ye)，大模(mo)型商業(ye)模(mo)式不健全，成本高、落地難、下(xia)游企業(ye)持觀望態(tai)度等問(wen)題愈發凸(tu)顯。

由于需要(yao)采購(gou)高性能(neng)計(ji)算機，并且需要(yao)進行模型訓(xun)練(lian)，大模型的(de)成本異常(chang)高昂。以OpenAI為(wei)(wei)例，其訓(xun)練(lian)GPT-4的(de)FLOPS約(yue)為(wei)(wei)2.15e25，一次訓(xun)練(lian)成本為(wei)(wei)6300萬(wan)美元。The Information報道，2022年，OpenAI虧損約(yue)為(wei)(wei)5.4億美元左(zuo)右(you)，約(yue)擴大一倍(bei)。

目前，大部(bu)分企業都意識(shi)到了大模(mo)型的參(can)數越多，商業想象力越大，因(yin)而持續加碼模(mo)型訓練(lian)。不過問題也隨之(zhi)而來，那就是大模(mo)型僅僅問世(shi)兩(liang)年(nian)時間，下游創收手段(duan)十分有限。

整體而言，大(da)模(mo)型有兩種創(chuang)收(shou)模(mo)式，一是直接向用(yong)(yong)戶收(shou)取訂(ding)閱(yue)費，二是向開發者收(shou)取API調用(yong)(yong)費。比如，2023年初，OpenAI推出了會員訂(ding)閱(yue)服務ChatGPT Plus，費用(yong)(yong)為20美(mei)元/月，可使用(yong)(yong)基(ji)于GPT-4的(de)模(mo)型，并且提(ti)供更快的(de)響應時(shi)間(jian)、優先訪(fang)問等權限。

不過，據Reddot聯合創始人Pierre Herubel測算，即使以每月擁有100萬訂戶估計，ChatGPT Plus每年(nian)或(huo)只能為OpenAI帶來2.4億美元左右收入，很難幫助公司(si)扭虧為盈。

因此(ci)，目前以OpenAI為代表企業(ye)的(de)(de)發(fa)力重點(dian)，是(shi)向企業(ye)收取API調(diao)用費。參照云計算的(de)(de)經驗，外部(bu)的(de)(de)企業(ye)從(cong)零開(kai)始訓練(lian)大(da)語言模型非常困難，傾(qing)向于采(cai)購成熟(shu)的(de)(de)AI大(da)模型技術(shu)，一旦(dan)這(zhe)些企業(ye)探索出具(ju)備(bei)想象力的(de)(de)商(shang)業(ye)模式，即(ji)可反哺上(shang)游算力提供商(shang)，進而實現多方共贏。

對此，2023年11月(yue)，百度創始人兼CEO李彥宏(hong)曾表示，不斷(duan)地重復開發基(ji)礎(chu)大(da)模(mo)(mo)型是對社(she)會(hui)資源的極大(da)浪費，“AI原(yuan)生時代，我們需(xu)要100萬量級的AI原(yuan)生應(ying)用，但是不需(xu)要100個大(da)模(mo)(mo)型。”

算力提供商作出表率，但B端企業仍持觀望態度

由于大(da)部分大(da)模型算力提供商都是(shi)平臺型企(qi)業(ye)，推出大(da)模型技術(shu)后(hou)，這些(xie)企(qi)業(ye)紛紛在內部試水相關技術(shu)的商業(ye)化，以圖給下游客(ke)戶做(zuo)出商業(ye)化表率(lv)。

比如，2023年(nian)阿里云峰會(hui)上(shang)，時任(ren)阿里巴(ba)巴(ba)集(ji)團董事會(hui)主席兼(jian)CEO、阿里云智能(neng)集(ji)團CEO張(zhang)勇表示(shi)：“阿里巴(ba)巴(ba)所有產品(pin)未來將接入‘通(tong)義千問’大(da)模型，進行全面改造。”

以釘(ding)(ding)釘(ding)(ding)為(wei)例，接入大模型后，其支持AI生(sheng)成(cheng)推(tui)廣文案、繪圖方式創建應用、視頻會議中生(sheng)成(cheng)摘要等(deng)功能。釘(ding)(ding)釘(ding)(ding)總裁葉軍認為(wei)，大模型將(jiang)會讓(rang)釘(ding)(ding)釘(ding)(ding)的收(shou)入增長(chang)百分之幾(ji)十(shi)。

無獨(du)有(you)偶(ou)，過(guo)去一(yi)段時(shi)間(jian)，騰(teng)訊也積極探索AI技術(shu)的(de)(de)商業化應用。2023年財報(bao)中，騰(teng)訊對外表示：“廣告AI模型的(de)(de)改進顯著提(ti)升了精(jing)準投放的(de)(de)效果…… 這些發展(zhan)帶(dai)動(dong)了高質量的(de)(de)收入來源，推動(dong)毛利增長 23%。”

自有業(ye)務挖掘出AI的(de)商(shang)業(ye)價值后，上(shang)游算(suan)力提供商(shang)正致力于(yu)針(zhen)對垂(chui)直行(xing)業(ye)的(de)細分需求，提供定制大(da)模型能(neng)力。

比如，2023年(nian)6月，騰(teng)訊(xun)云(yun)宣布開啟“騰(teng)訊(xun)云(yun)行(xing)業大(da)模型生態(tai)計(ji)劃”，致力于推進(jin)大(da)模型在產業領(ling)域的創新和落地。據悉，騰(teng)訊(xun)云(yun)已為傳媒(mei)、文旅、政務(wu)等10余個行(xing)業提供了(le)超50個大(da)模型行(xing)業解決方案。

然而需要注意(yi)的是，平(ping)臺型(xing)(xing)企業大(da)多擁有(you)自研大(da)模(mo)型(xing)(xing)技術，無論(lun)是試(shi)錯(cuo)還是使(shi)用成(cheng)本都更低，往往只會對外宣傳商(shang)業路徑清晰(xi)的大(da)模(mo)型(xing)(xing)落地(di)案例。

反(fan)觀外(wai)部的(de)企(qi)業需要采購(gou)上(shang)游的(de)大模(mo)型技術，探索成本相對更高，并(bing)且(qie)商(shang)業模(mo)式(shi)不(bu)清晰(xi)，很難擁有(you)足(zu)夠的(de)積極性。見實團隊披露的(de)《AI應用需求與付(fu)費意愿調研報告》顯示(shi)，46.2%的(de)企(qi)業AI預算(suan)在1萬(wan)(wan)(wan)元以下，另有(you)22.2%和24%的(de)企(qi)業預算(suan)分別為1萬(wan)(wan)(wan)-5萬(wan)(wan)(wan)元以及5萬(wan)(wan)(wan)元-10萬(wan)(wan)(wan)元，這(zhe)些中腰部企(qi)業沒有(you)足(zu)夠的(de)預算(suan)探索AI。

此前，大部分(fen)主力模型產品的(de)API輸入價(jia)格不菲，比如，Qwen-Long為0.02元(yuan)(yuan)/千tokens，1萬(wan)元(yuan)(yuan)只可以購買(mai)5億個(ge)tokens。如果一(yi)個(ge)產品有500萬(wan)月活，1萬(wan)元(yuan)(yuan)的(de)預算，一(yi)個(ge)月平(ping)均只能供每個(ge)用(yong)(yong)戶使(shi)用(yong)(yong)100個(ge)tokens，顯然不夠。

成本雖屢屢下探，但算力提供商已急不可耐

顯而易見，當(dang)下(xia)限制(zhi)(zhi)大模型(xing)B端商(shang)業化(hua)落地的(de)主(zhu)要障礙(ai)，就(jiu)是API成本(ben)過(guo)高，限制(zhi)(zhi)了B端企(qi)業探索(suo)相應的(de)商(shang)業閉環。因此，目前(qian)算(suan)力提供商(shang)的(de)發力方向，就(jiu)是致力于通過(guo)技術手段，壓(ya)低大模型(xing)的(de)成本(ben)，降低B端企(qi)業的(de)使用(yong)成本(ben)。

開頭提到，字(zi)節跳動旗下(xia)豆包主(zhu)力(li)模型企業市場(chang)定(ding)價為(wei)0.0008元/千(qian)Tokens，比(bi)行(xing)業便(bian)宜99.3%。對(dui)此(ci)，火山引(yin)擎總裁譚待表示：“豆包模型的超低定(ding)價，來源于我們(men)有(you)信心(xin)用技術手段優化成(cheng)本，而不(bu)是補貼或是打(da)價格戰爭奪(duo)市場(chang)份(fen)額(e)。”

無(wu)獨(du)有(you)偶，2024年5月6日，深度求索開源了第(di)二代(dai)MoE模(mo)型(xing)(xing)DeepSeek-V2，性能更(geng)強(qiang)，訓(xun)練(lian)成本更(geng)低。據悉，DeepSeek可節省42.5%訓(xun)練(lian)成本，減少93.3%的KV緩存(cun)，最大吞吐(tu)量提高5.76倍。整(zheng)體而言，DeepSeek-V2消耗的顯(xian)存(cun)（KV Cache）只有(you)同級別Dense模(mo)型(xing)(xing)的1/5-1/100。

不過，這并不意(yi)味著當(dang)下大模(mo)(mo)型(xing)行(xing)業(ye)的價格(ge)戰十分(fen)正常。2024年(nian)(nian)5月(yue)，談(tan)及大模(mo)(mo)型(xing)的發(fa)展趨(qu)勢時(shi)，零一(yi)萬(wan)物(wu)CEO李開(kai)復接受采訪時(shi)表示：“未(wei)來整(zheng)個行(xing)業(ye)的推理成本每年(nian)(nian)降(jiang)(jiang)低10倍是(shi)可以期待(dai)的，而且這個趨(qu)勢是(shi)必(bi)然的。”未(wei)來，大模(mo)(mo)型(xing)的成本將呈階梯(ti)狀(zhuang)下探，但目前(qian)大模(mo)(mo)型(xing)的價格(ge)卻斷崖式下探，甚至部分(fen)企業(ye)免費送，降(jiang)(jiang)價幅(fu)度遠超上游成本降(jiang)(jiang)幅(fu)。

上游算力(li)提供(gong)商之所(suo)以(yi)(yi)(yi)如此(ci)內卷(juan)，很大程(cheng)度上都是希望俘獲更多的B端(duan)企業(ye)(ye)(ye)，一方面(mian)實現規模(mo)(mo)效應，另(ling)一方面(mian)，讓(rang)B端(duan)企業(ye)(ye)(ye)無負擔(dan)地探索良(liang)性的商業(ye)(ye)(ye)模(mo)(mo)式。對(dui)此(ci)，譚待表示：“大的使用量(liang)，才能打磨出好模(mo)(mo)型(xing)，也(ye)能大幅降低模(mo)(mo)型(xing)推理的單位(wei)成本(ben)……大模(mo)(mo)型(xing)從以(yi)(yi)(yi)分(fen)計價(jia)到以(yi)(yi)(yi)厘計價(jia)，將助力(li)企業(ye)(ye)(ye)以(yi)(yi)(yi)更低成本(ben)加速業(ye)(ye)(ye)務(wu)創新。”

盡管激(ji)烈的價格(ge)戰(zhan)之下，大模(mo)型(xing)已經(jing)進入“免費時代”，但其實大部分(fen)上游(you)算(suan)力提供商為了后續創(chuang)收，都(dou)留有(you)更為隱晦的收費手段。

目(mu)前，大部(bu)分大模型僅推(tui)(tui)理用的(de)token降價(jia)，而訓練和(he)部(bu)署(shu)成本(ben)依然(ran)不低(di)。比(bi)如(ru)，阿里(li)的(de)qwen-turbo 模型百萬個token推(tui)(tui)理只要2元(yuan)，若是訓練，就需要30元(yuan)，部(bu)署(shu)時(shi)，每月需要2萬元(yuan)。

由此來看，大模型進(jin)入“免費時代”，很大程度上(shang)其實只是一個宣傳意(yi)義上(shang)的噱頭。如果下游企業想(xiang)要(yao)用上(shang)成(cheng)套大模型服(fu)務，那么不(bu)能(neng)不(bu)付出更高的使用成(cheng)本。

而之所以上游算力提供商僅(jin)僅(jin)降(jiang)低(di)推理用的(de)token成本，主(zhu)要是(shi)因為通(tong)過內(nei)部應用，其(qi)對于大模型(xing)的(de)商業價值(zhi)足夠自信(xin)，希望降(jiang)價的(de)噱頭起到引(yin)流的(de)作用。

參照云計算價(jia)格(ge)戰的(de)(de)經(jing)驗，此番大模(mo)型價(jia)格(ge)戰或許可以吸引更多下游企業(ye)認真審視大模(mo)型，有望基于相關技術探索(suo)出更多良性的(de)(de)商業(ye)模(mo)式。

大模(mo)型(xing) AI 算力(li)

評論

還可輸入300個字

發布留言

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇