
墨西哥支付方式:是什么?
訓(xùn)練靠后,推理向前,ASIC 敘事逐漸減弱,NV 的算力份額和領(lǐng)導(dǎo)者地位依然穩(wěn)固,市值將達(dá)到 4 萬億
以 o1 為起點,由于模型推理能力的增強(qiáng),以及軟件公司用 LLM 開發(fā)新產(chǎn)品或進(jìn)行自我改造的積極性提升,推理需求指數(shù)級增長讓今年下半年以來 CSP ASIC 顯著受益,CSP 離下游需要推理的客戶群體更近,Amazon、Google、微軟等大廠都在通過自有芯片研減少對 GPU 的依賴。
2025 年 Inference 作為硬件板塊的核心命題不會改變,考慮到整個算力市場需求比預(yù)期要更大,CSP ASIC 敘事會在明年逐漸走弱,而 NVDA 依靠 GB200 在 TCO/性能仍會在算力市場維持自身的領(lǐng)導(dǎo)者地位,相比之下 AMD 丟失的市場份額可能會更明顯。
O 系列開始,inference time compute 的思路讓 post training 的重要性提高了很多,可提升的空間和消耗的算力層面都可能比 pretrain 更重要。
在這個趨勢下,post-training 和 pre-training 的界線會越來越模糊,post-training 會消耗更大的算力、解鎖更多能力,pre-training 會漸進(jìn)式地用 RL 來漸近找到更好的 data recipe。類似從 AlphaGo 到 AlphaZero 那樣,模型能夠逐漸離開一部分人類數(shù)據(jù),用合成數(shù)據(jù)來得到更多數(shù)據(jù)分布外的高質(zhì)量數(shù)據(jù),解鎖更高天花板的智能。
改寫、編排現(xiàn)有的數(shù)據(jù)雖然能提升數(shù)據(jù)質(zhì)量,但不能提供增量數(shù)據(jù)和新知識。如何規(guī)模化地獲取合成數(shù)據(jù)是技術(shù)上重要的難點,也是我們期待的突破點。去年這個突破沒有實現(xiàn),我們預(yù)測今年能夠取得進(jìn)展,因為 pre train 的數(shù)據(jù)瓶頸今年愈發(fā)緊迫。
o3 驗證了 reasoning scaling law,但商業(yè)化落地遇到瓶頸
o3 在 ARC-AGI 和 Frontier Math 涌現(xiàn)式的能力突破定義了真正優(yōu)秀的推理能力,這讓我們對 o 系列的成長上限有更強(qiáng)的信心:o3 帶來了 reasoning scaling law,強(qiáng)推理能力正是解鎖 agent 最必要的能力。2025 年,模型每 3 個月就會實現(xiàn)過去 1 年的能力進(jìn)步。
但 o1 的商業(yè)化確定性和前幾代模型相比要更低,因為強(qiáng)推理并不是大眾用戶的需求,只有少數(shù)用戶對這樣的高生產(chǎn)力、復(fù)雜推理問題有需求。因此現(xiàn)在 ChatGPT 產(chǎn)品中 o1 的使用率也不到 5%。同時 o1 query 的定價也很貴,所以需要 200 美金甚至 2000 美金/月的價格來支持更大的 inference time compute 需求。
Chatbot 競爭翻篇,
開始全新 AI產(chǎn)品形態(tài)競爭
Chatbot 的競爭在 2024 年結(jié)束了,2025 年 各模型公司要在全新的產(chǎn)品形態(tài)上競賽。Chatbot 仍將是包容性最強(qiáng),用戶受眾最廣的前端交互,但 computer use、coding agent、artifacts 等更復(fù)雜,更跨軟件,更能捕捉用戶行為數(shù)據(jù)的交互會成為新的重點。
Memory 和 Online learning 問題在 25 年得到解決,LLM 更加主動和個性化
和推薦算法比,LLM 的缺陷是不能實時更新 weights,所以模型無法千人千面。Memory 是 AI labs 和 Agent 公司花了很多精力解決的問題,我們認(rèn)為 Memory 會在 2025 年有不錯的解決方案,onling learning 也能有一定突破,讓 LLM 和 Agent 真的做到更主動,更懂用戶。
多模態(tài)智能得到突破,visual reasoning 涌現(xiàn),用戶和 AI 交互可能性被拓寬,出現(xiàn)AI+IP 爆款
過去兩年多模態(tài)智能能力發(fā)展不如語言,但 2025 年多模態(tài)智能會得到更多投入。視覺推理和 Scaling Law 的涌現(xiàn)現(xiàn)象成為重要研究方向。尤其是 Google、Meta、Tesla 等大企業(yè),有海量視覺數(shù)據(jù),有處理視覺數(shù)據(jù)的完整 infra,也有更明確的多模態(tài)應(yīng)用場景,相比 AI labs 會更重視多模態(tài)的研究發(fā)展。
雖然我們在 2024 年的預(yù)測中提到類 Character.ai 賽道會收斂在今年得到驗證,但 Character.ai 代表的底層需求不變。經(jīng)典 IP 長盛不衰、Jellycat 的爆火本質(zhì)上是“陪伴”。AI 時代的 Her 不是 chatbot,更有可能從經(jīng)典 IP 嫁接而生:AI,尤其是多模態(tài)智能會讓人類和已有 IP 的互動變得更真實、絲滑,例如迪士尼、任天堂等相關(guān)公司也會利用多模態(tài)推動新應(yīng)用和經(jīng)典 IP 喚新。
ChatGPT 和 Perplexity 跑通廣告變現(xiàn)模式,廣告超越訂閱模式成為主流
因為面向生產(chǎn)力場景,LLM startups 一開始通過訂閱模式嘗試商業(yè)化,但訂閱的增長曲線有限:ChatGPT 的 MAU 預(yù)計已經(jīng)超過 5 億,年收入約 40 億美金,平均一個月活用戶只有~8 美元/年收入,而 Google、Meta 每個月活用戶 ARPU 都價值100美金起。訂閱無法支撐 AI 超級應(yīng)用,廣告還是主流商業(yè)化方向。
從去年下半年開始 perplexity 和 OpenAI 都已經(jīng)透露出試水廣告,通過問答的形式直連商品、服務(wù)搜索,進(jìn)一步有可能重組視頻、電商、工作、酒旅、住房等供應(yīng)鏈。
自動駕駛到達(dá)商業(yè)化拐點:Waymo 開始蠶食 Uber 市場份額,Waymo 可能會在 2025 年 IPO
Waymo 在 2024 年 8 月占 SF 網(wǎng)約車份額為 5%,到 11 月訂單金額市占率快速上升超過20%,且出現(xiàn)一定網(wǎng)絡(luò)效應(yīng),到 12月初 Waymo 在全美已經(jīng)實現(xiàn)了17.5 萬次/周的付費出行。隨著監(jiān)管放松 Waymo 的規(guī)模效應(yīng)還會加速。
AI 領(lǐng)域 M&A 活躍:AI 應(yīng)用、Coding 領(lǐng)域出現(xiàn)大的收購,中小 GPU 云會被整合
2025 年,AI 領(lǐng)域的投資并購會繼續(xù)活躍,不過主題從大廠收購 foundation model 公司轉(zhuǎn)變?yōu)橹写笮凸臼召?AI native 應(yīng)用,帶來 M&A 的有 4 個角度的因素:
? 硬件領(lǐng)域,2025 年 NV B 系列正式投入使用后,GPU 云領(lǐng)域的成本和價格競爭會進(jìn)一步加劇,很多中小 GPU 云會破產(chǎn),對于頭部公司而言是低價收購資產(chǎn)的好時機(jī);
? SaaS 領(lǐng)域過去圍繞 Vertial SaaS 的 buy-and-run 會在 vertical AI 上重演,尤其 Sales、HR、Legal、Healthcare 等垂直領(lǐng)域會出現(xiàn) AI start-ups 被大公司收購的情況;
??AI 搜索、AI Coding、視頻生成等領(lǐng)域作為 LLM 領(lǐng)域競爭的主線,大公司尤為重視,與此同時 Starups 估值增長過快,可能會先出現(xiàn)公司業(yè)務(wù)發(fā)展跟不上估值 hype,在這種情況下,big-techs 進(jìn)行收并購可能帶來 win-win ;
? 頭部 Startups 為強(qiáng)化自身競爭力圍繞技術(shù)棧、場景進(jìn)行收購。
電力短缺持續(xù),核電重啟是明確趨勢 ,有機(jī)會出現(xiàn) 10x 股公司
不僅美國本土,超大計算集群、再工業(yè)化帶來的電力短缺還在持續(xù),全球范圍內(nèi)電力需求到 2050 年會增加 ?1/3 到 3/4。核電的新建或重啟是全球范圍內(nèi)確定性趨勢,但供給端還沒有做好相關(guān)準(zhǔn)備,原料短缺、地緣政治的擾動等因素給整個產(chǎn)業(yè)鏈上的資產(chǎn)帶來價值稀缺性。
AI for science 發(fā)展迅速,各個科學(xué)領(lǐng)域有自己的 foundation model
生命科學(xué)、材料、氣象和工業(yè)仿真等各個科學(xué)領(lǐng)域已經(jīng)涌現(xiàn)出各自的 foundation model。與 LLM 不同,AI4S 領(lǐng)域不存在數(shù)據(jù)墻問題,在實踐中還可以通過第一性原理模擬生成無限的高質(zhì)量合成數(shù)據(jù),這一特性會讓 AI4S 各個領(lǐng)域的 foundation model 涌現(xiàn),且模型能力迭代速度極快。
AI 技術(shù)紅利大部分流入大公司,
Mega 9 強(qiáng)者恒強(qiáng)
Mega 9 公司掌握著 AI 的關(guān)鍵資產(chǎn):云、算力、分發(fā)渠道。任何企業(yè)、個人買單 AI 的價值,他們都有機(jī)會“收稅”。隨著 AI 在 2025 年真正走向 massive adoption ,這些公司可以持續(xù)躺在 AI 富礦上賺取收益。
美股 2025 Q1 業(yè)績后因為 AI 進(jìn)展緩慢大調(diào)整,但又會在年底前破新高
以 Agentforce 為代表的 SaaS 公司 AI 產(chǎn)品的表現(xiàn)推高了美股對于 AI 應(yīng)用層的 hype,雖然企業(yè)側(cè)投入和推廣 AI 產(chǎn)品相較于 1 年前更加激進(jìn),但作為投資者需要對企業(yè) AI 業(yè)務(wù)落地和盈利情況保持理性和警惕,一旦實際業(yè)績兌現(xiàn)略低于市場對 AI 故事的預(yù)期,就會出現(xiàn)大的回調(diào),我們預(yù)計 2025 H1 大概率會出現(xiàn)這一情況。到 2025H2,隨著 LLM 能力提升,尤其是 agent 在 tool use 和長距離復(fù)雜任務(wù)上的進(jìn)步,AI 會重新帶來股價新高,重演 2024 H2 的情況。
本文章轉(zhuǎn)載微信公眾號@海外獨角獸