?? 國內(nèi)大模型進入“百模大戰(zhàn)”,同樣1M tokens,不同廠商價差高達(dá)50倍!
?? 本報告從性能基準(zhǔn)、價格、上下文長度、場景適配四大維度,幫你快速鎖定最優(yōu)模型,少走彎路、少花冤枉錢。
| 模型 | 公司 | 架構(gòu) | 上下文 | 特點一句話 | 免費額度 |
|---|---|---|---|---|---|
| DeepSeek V3 | 深度求索 | MoE 671B | 128K | 輸入價最低,開源可私有 | 5M tokens |
| moonshot-v1-32k | 月之暗面 | Dense | 32K | 長文本冠軍,小說/論文神器 | 1M tokens |
| 通義千問-Max | 阿里云 | Dense | 128K | 數(shù)學(xué)+編程全球Top3 | 1M tokens |
| Doubao 1.5 pro 256k | 字節(jié)跳動 | MoE | 256K | 文檔識別+視覺推理雙優(yōu) | 50萬 tokens |
| ERNIE 4.0 | 百度 | 知識增強 | 128K | 中文問答+知識圖譜天花板 | N/A |
| hunyuan lite | 騰訊 | MoE | 250K | 輕量快,成本低 | 1萬 tokens |
| Spark Pro | 科大訊飛 | Dense | 128K | 金融/醫(yī)療長文檔專家 | 500萬 tokens |
| Baichuan4 Turbo | 百川智能 | Dense | 128K | 2卡4090可部署,私有化神器 | 贈金80元 |
| GLM-4-Plus | 智譜AI | Dense | 128K | 多模態(tài)+代碼+財務(wù)三棲 | 1億 tokens |
| Step-2-mini | 階躍星辰 | MFA | 32K | 延遲<100ms,代碼任務(wù)首選 | N/A |
?? 價格公式:總成本 = 輸入×單價 + 輸出×單價 – 緩存命中×折扣
?? 用下方「成本計算器」10秒得出真實賬單。
| 模型 | 輸入(緩存命中) | 輸入(未命中) | 輸出 | 緩存折扣 | 適用場景 |
|---|---|---|---|---|---|
| DeepSeek V3 | ¥0.5/1M | ¥2/1M | ¥8/1M | 75% | 高輸入低輸出(搜索/總結(jié)) |
| moonshot-v1-32k | ¥5/1M | ¥5/1M | ¥20/1M | 無 | 長文本生成(小說) |
| 通義千問-Max | ¥2.4/1M | ¥2.4/1M | ¥9.6/1M | 無 | 數(shù)學(xué)推理、代碼補全 |
| Doubao 1.5 pro 256k | ¥5/1M | ¥5/1M | ¥9/1M | 無 | 文檔OCR+視覺問答 |
| ERNIE 4.0 | ¥4/1M | ¥4/1M | ¥16/1M | 無 | 中文知識問答 |
| hunyuan lite | ¥5/1M | ¥5/1M | ¥15/1M | 無 | 輕量客服、聊天 |
| Spark Pro | ¥5-7/1M | ¥5-7/1M | ¥5-7/1M | 階梯折扣 | 金融/醫(yī)療長文檔 |
| Baichuan4 Turbo | ¥15/1M | ¥15/1M | ¥15/1M | 無 | 私有部署、代碼助手 |
| GLM-4-Plus | ¥50/1M | ¥50/1M | ¥50/1M | 無 | 多模態(tài)高端場景 |
| Step-2-mini | ¥1/1M | ¥1/1M | ¥2/1M | 無 | 低延遲代碼補全 |
?? 測試任務(wù):C-Eval(中文)、MATH、HumanEval、LongBench
?? 綜合得分(滿分100):
| 模型 | 中文推理 | 數(shù)學(xué) | 代碼 | 長文本 | 綜合 |
|---|---|---|---|---|---|
| 通義千問-Max | 88 | 92 | 90 | 85 | 88.8 |
| Doubao 1.5 pro | 85 | 89 | 88 | 90 | 88.0 |
| DeepSeek V3 | 84 | 87 | 89 | 82 | 85.5 |
| GLM-4-Plus | 86 | 85 | 87 | 88 | 86.5 |
| Step-2-mini | 80 | 83 | 94 | 78 | 83.8 |
如需復(fù)現(xiàn)基準(zhǔn),可用「代碼示例講解概念」一鍵生成評測腳本,自動拉取官方題庫并輸出得分對比。

想了解比較報告的深度內(nèi)容,點此查看完整報告
| 場景 | 首要推薦 | 備選 | 理由 |
|---|---|---|---|
| 高并發(fā)搜索 | DeepSeek V3 | Step-2-mini | 輸入價最低+緩存折扣 |
| 長文本小說 | moonshot-v1-32k | Doubao 256k | 32K-256K窗口,生成連貫 |
| 數(shù)學(xué)/代碼 | 通義千問-Max | Step-2-mini | 官方評測Top3 |
| 中文知識問答 | ERNIE 4.0 | Doubao 1.5 pro | 知識圖譜增強 |
| 金融/醫(yī)療長文檔 | Spark Pro | hunyuan lite | 128K+階梯折扣 |
| 私有部署 | Baichuan4 Turbo | DeepSeek V3 | 2×4090即可跑,開源 |
| 多模態(tài)高端 | GLM-4-Plus | Doubao 1.5 pro | 圖+文+代碼三棲 |
# pip install pandas
import pandas as pd
cost = {
"DeepSeek V3": {"in_hit": 0.5, "in_miss": 2, "out": 8, "cache_discount": 0.75},
"Step-2-mini": {"in_hit": 1, "in_miss": 1, "out": 2, "cache_discount": 0},
# 其余模型略,可自助添加
}
def calc(model, in_tokens, out_tokens, hit_rate=0.8):
c = cost[model]
in_cost = in_tokens * (hit_rate * c["in_hit"] + (1 - hit_rate) * c["in_miss"]) / 1e6
cache_save = in_tokens * hit_rate * c["in_hit"] * c["cache_discount"] / 1e6
out_cost = out_tokens * c["out"] / 1e6
return round(in_cost + out_cost - cache_save, 2)
print("10M in + 2M out, 80%緩存命中率:")
for m in cost:
print(m, calc(m, 10e6, 2e6, 0.8), "元")
跑一遍,10 秒出結(jié)果:DeepSeek V3 比 GLM-4-Plus 省 94% 成本!
?? 記住「三問」:
把答案套進本文表格,5 秒鎖定最優(yōu)模型;再用「API 交互代碼生成」一鍵生成帶重試、緩存、日志的完整調(diào)用代碼,直接上線!
?? 點此查看 50 頁高清 PDF 對比報告
?? 去控制臺自制模型比價報告