專題:DeepSeek開源周來(lái)了
一篇DeepSeek披露利潤(rùn)率的文章卻引來(lái)兩家科技創(chuàng)業(yè)公司創(chuàng)始人“大打出手”。
3月1日,風(fēng)頭正勁的國(guó)產(chǎn)AI公司深度求索(DeepSeek)官方賬號(hào)發(fā)布名為《DeepSeek-V3 / R1 推理系統(tǒng)概覽》,在文章最后透露,“如果所有 tokens 全部按照 DeepSeek R1 的定價(jià)計(jì)算,理論上一天的總收入為56.2027萬(wàn)美元,成本利潤(rùn)率 545%。當(dāng)然我們實(shí)際上沒(méi)有這么多收入,因?yàn)閂3的定價(jià)更低,同時(shí)收費(fèi)服務(wù)只占了一部分,另外夜間還會(huì)有折扣。”
這是DeepSeek官方首次公布成本利潤(rùn)率情況,此文一出,有網(wǎng)友在評(píng)論區(qū)@尤洋(編注:北京潞晨科技有限公司董事長(zhǎng))。
今年2月9日,尤洋曾在微博發(fā)文稱,“MaaS (Model as a Service,編注:模型即服務(wù),一種云計(jì)算服務(wù)模式)在中國(guó)短時(shí)間內(nèi)可能是最差的商業(yè)模式。阿里云/百度云/騰訊云等相互內(nèi)卷低價(jià)和免費(fèi),滿血版的DeepSeek R1每百萬(wàn)token官方也只能收到16元……如果滿血版的DeepSeek R1每日輸出1000億token,那么每月的機(jī)器成本是4.5億,虧損4億!用戶越多,虧損越多。現(xiàn)金流能撐住嗎?除非有免費(fèi)的機(jī)器,但沒(méi)有長(zhǎng)久免費(fèi)的午餐。”
2月28日,尤洋在回應(yīng)網(wǎng)友提問(wèn)“伯克利尤洋計(jì)算后認(rèn)為賣DeepSeek API (MaaS)月虧損4億,計(jì)算是否正確?離低成本有多遠(yuǎn)?”時(shí)再次強(qiáng)調(diào),“結(jié)論:這個(gè)東西按照2025年2月初的狀態(tài)不可能盈利。虧損來(lái)源:1. 測(cè)試速度和實(shí)際場(chǎng)景的差距。2. 機(jī)器利用率峰值和波谷的巨大差距。3. 機(jī)器的不穩(wěn)定性。”
DeepSeek成本和收益
在被多名網(wǎng)友@后,3月1日,尤洋發(fā)文稱,文章中的數(shù)據(jù)對(duì)計(jì)算MaaS成本沒(méi)有任何參考價(jià)值,把DeepSeek網(wǎng)頁(yè),APP和MaaS API的token數(shù)加在一起計(jì)算,“我春節(jié)期間用過(guò)幾次,問(wèn)一個(gè)問(wèn)題,然后說(shuō)繁忙,讓我稍后嘗試,我等了15分鐘或者一個(gè)小時(shí)。這本就不是一個(gè)合格的MaaS產(chǎn)品。”
3月1日下午,潞晨科技官微發(fā)文宣布將暫停DeepSeek API服務(wù),“潞晨云將在一周后停止提供DeepSeek API服務(wù),請(qǐng)盡快用完您的余額。如果沒(méi)用完,我們?nèi)~退款。”
不過(guò)尤洋在3月2日凌晨又重新編輯,并強(qiáng)調(diào)“DeepSeek出圈前,2025年1月2日我就在微博上說(shuō)過(guò)DeepSeek是中國(guó)最好的模型。我對(duì)DeepSeek沒(méi)有任何貶低。我最開始就是抨擊那些倒賣DeepSeek API去賠本賺吆喝的中小云廠商,然后吹噓自己推理快10倍。現(xiàn)在我被友商引導(dǎo)到跟DeepSeek去對(duì)立。我說(shuō)過(guò),DeepSeek是很好很好的模型。”
根據(jù)潞晨科技微信公號(hào),公司致力于解放AI生產(chǎn)力,通過(guò)高效多維并行、異構(gòu)內(nèi)存管理、大規(guī)模優(yōu)化庫(kù)、自適應(yīng)任務(wù)調(diào)度等自研技術(shù),打造面向大模型時(shí)代的通用深度學(xué)習(xí)系統(tǒng) Colossal-AI,高效促進(jìn)AI大模型落地應(yīng)用,助力企業(yè)低成本實(shí)現(xiàn)AI智能化產(chǎn)業(yè)升級(jí)。潞晨?jī)纱螽a(chǎn)品Video Ocean和潞晨云已累計(jì)服務(wù)用戶數(shù)超10萬(wàn),公司付費(fèi)客戶總數(shù)突破2476家,其中包括4家世界500強(qiáng)企業(yè)和10家上市公司。公司2024年?duì)I收達(dá)7700萬(wàn)元。預(yù)計(jì)至2025年?duì)I收達(dá)1.5億元,2026年預(yù)期增至3億元。2月12日,潞晨科技宣布完成最新一輪融資,北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)產(chǎn)業(yè)升級(jí)股權(quán)投資基金參與本輪投資。
不僅僅是尤洋,在前述DeepSeek文章下面,硅基流動(dòng)創(chuàng)始人袁進(jìn)輝回復(fù)寫道,“DeepSeek 官方披露大規(guī)模部署成本和收益,又一次顛覆了很多人認(rèn)知。現(xiàn)在很多供應(yīng)商還做不到這個(gè)水平,主要是V3/R1架構(gòu)和其它主流模型差別太大了,由大量小Expert 組成,導(dǎo)致瞄準(zhǔn)其它主流模型結(jié)構(gòu)開發(fā)的系統(tǒng)都不再有效,必須按照DeepSeek報(bào)告描述的方法才能達(dá)到最好的效率,而開發(fā)這樣的系統(tǒng)難度很高,需要時(shí)間,幸好這周DeepSeek五連發(fā)已經(jīng)把主要模塊開源出來(lái)了,降低了社區(qū)復(fù)現(xiàn)的難度。”
3月1日早間,尤洋再次發(fā)文稱,“本人昨天情緒太沖動(dòng),說(shuō)了一些讓人誤解deepseek infrastructure團(tuán)隊(duì)的話。deepseek infrastructure團(tuán)隊(duì)技術(shù)一流并給開源社區(qū)做出巨大貢獻(xiàn)。本人誠(chéng)摯道歉,已經(jīng)刪除不當(dāng)表述,感謝大家提醒!”
值得注意的是,在2月初,袁進(jìn)輝與尤洋兩人就DeepSeek成本問(wèn)題有過(guò)爭(zhēng)論,袁進(jìn)輝當(dāng)時(shí)在朋友圈發(fā)文認(rèn)為尤洋用了錯(cuò)誤的架構(gòu)進(jìn)行估計(jì),尤洋在微博寫道,“回復(fù)一下袁進(jìn)輝老師:我的測(cè)算已經(jīng)考慮了很多很多用戶把機(jī)器占滿,單用戶數(shù)字更難看。其實(shí)你就弄400臺(tái)機(jī)器,看看每日能否輸出1000億滿血DeepSeek R1 token,讓我看看。或者40臺(tái)機(jī)器能否輸出滿血400億DeepSeek R1 token。不能的話,都是巨虧。我們用事實(shí)說(shuō)話。”
這場(chǎng)原本還是圍繞DeepSeek成本的討論,在尤洋發(fā)出一篇名為《坑人的硅基流動(dòng)》而“畫風(fēng)大轉(zhuǎn)”,這篇已經(jīng)被刪除的文章提及,“這家公司疑似組織水軍在網(wǎng)上長(zhǎng)期黑我。今天DeepSeek有一篇文章指向我,他也在那里煽風(fēng)點(diǎn)火。”
袁進(jìn)輝隨后對(duì)尤洋的多點(diǎn)問(wèn)題進(jìn)行回應(yīng),并在文末直言硅基流動(dòng)被潞晨科技抄襲,只是為了給對(duì)方留個(gè)面子沒(méi)有公開。尤洋也在朋友圈回應(yīng)稱,“代碼都是潞晨CTO負(fù)責(zé)的,抄襲代碼事件后,璐晨CTO離職,加入了袁進(jìn)輝老師的公司。你說(shuō)可笑不可笑?”
3月2日下午,被提及的原潞晨科技CTO方佳瑞也回應(yīng)稱,尤洋公司被袁進(jìn)輝指出存在兩次公開抄襲事件,尤洋想把第一次抄襲甩鍋嫁禍于我,但鐵證如山,本人身正不怕影子斜。
硅基流動(dòng)官網(wǎng)顯示,公司致力于打造規(guī)模化、標(biāo)準(zhǔn)化、高效能的生成式AI計(jì)算基礎(chǔ)設(shè)施平臺(tái),提供模型云服務(wù)平臺(tái)SiliconCloud、大語(yǔ)言模型推理引擎SiliconLLM、高性能文生圖/視頻加速庫(kù)OneDiff等產(chǎn)品,助力企業(yè)和個(gè)人用戶高效、低成本部署AI模型。2月1日,硅基流動(dòng)宣布,大模型云服務(wù)平臺(tái) SiliconCloud首發(fā)上線基于華為云昇騰云服務(wù)的 DeepSeek-V3、DeepSeek-R1。
兩人在爭(zhēng)什么?
兩人這波爭(zhēng)論源于DeepSeek公布的“成本利潤(rùn)率545%”。首先來(lái)看這個(gè)數(shù)字是怎么計(jì)算出來(lái)的,文中提到,“假定 GPU 租賃成本為 2 美金/小時(shí),總成本為 $87072/天……理論上一天的總收入為 $562,027”,即545%的成本利潤(rùn)率僅僅是基于GPU的租賃成本。
尤洋在此后一篇解釋的文章中指出,“DeepSeek這篇文章的數(shù)據(jù)是建立在大量用戶把DeepSeek的APP和網(wǎng)頁(yè)完全超負(fù)荷占滿的情況下,不是一個(gè)常規(guī)的MaaS。阿里通義千問(wèn)也很好,Kimi Chat也很好,豆包也很好,我不確定DeepSeek對(duì)他們是否有不可逾越的技術(shù)壁壘。”
尤洋認(rèn)為,因?yàn)镸aaS是ToB的,延遲和穩(wěn)定性要求極高。要想留住客戶,不能有任何疏忽。要想每日穩(wěn)定輸出1000億token,需要準(zhǔn)備輸出5000億token理論能力的機(jī)器。因?yàn)榻拥腁PP越多,機(jī)器利用率就越不可預(yù)測(cè)。
“時(shí)刻掉線或者延遲超過(guò)15分鐘的MaaS哪個(gè)產(chǎn)品敢用?要不然為何各種大小云廠商全都要推出一體機(jī)嗎?因?yàn)橐惑w機(jī)是獨(dú)占的,是最穩(wěn)定的。”
尤洋認(rèn)為,MaaS是ToB的,是服務(wù)APP,最大的問(wèn)題是機(jī)器利用率的不確定性以及自己沒(méi)有模型壁壘而承受的低毛利負(fù)毛利價(jià)格戰(zhàn)。
袁進(jìn)輝在DeepSeek回復(fù)中也提到,現(xiàn)在很多供應(yīng)商還做不到這個(gè)水平,主要是V3/R1架構(gòu)和其它主流模型差別太大了,“必須按照DeepSeek報(bào)告描述的方法才能達(dá)到最好的效率,而開發(fā)這樣的系統(tǒng)難度很高,需要時(shí)間,幸好這周DeepSeek五連發(fā)已經(jīng)把主要模塊開源出來(lái)了,降低了社區(qū)復(fù)現(xiàn)的難度。”
在兩人討論最集中的知乎平臺(tái)上,有不少網(wǎng)友認(rèn)為尤洋和袁進(jìn)輝的說(shuō)法都有一定道理,袁進(jìn)輝點(diǎn)贊的一篇關(guān)于DeepSeek成本討論文章中寫道,“DeepSeek收入估計(jì)肯定是虛高非常多的。因?yàn)檫@是所有業(yè)務(wù)的綜合數(shù)據(jù),官方并沒(méi)有披露 API 的收費(fèi)業(yè)務(wù)占了多少,其次,這里的價(jià)格是按R1計(jì)算的,官方也沒(méi)有說(shuō)V3/R1在真實(shí)業(yè)務(wù)中的比例。但是,考慮到他們至少有將近 6 倍的利潤(rùn),如果 V3:R1 用量是 2:1,那么只要 API 業(yè)務(wù)是免費(fèi)用戶業(yè)務(wù)的六分之一,DeepSeek 就能收支平衡。”
值得注意的是,去年還在深度求索任職的羅福莉,在2024年5月曾在知乎發(fā)文提到,“大家不用擔(dān)心模型斷更,也不用擔(dān)心API漲價(jià)(目前就是大規(guī)模服務(wù)的價(jià)格,不虧本,利潤(rùn)率超50%)。”