?? 為什么必須現(xiàn)在上車 OpenAI OSS?

2025 年 8 月 6 日,OpenAI 重返開(kāi)源戰(zhàn)場(chǎng),一次性甩出 Apache 2.0 許可的 GPT-OSS-120BGPT-OSS-20B,直接把“大模型平民化”從口號(hào)變成事實(shí):

維度 GPT-OSS-20B GPT-OSS-120B 備注
參數(shù)量 21 B 117 B MoE,僅 3.6-5.1 B 活躍
上下文 128 K 128 K 全開(kāi)源最長(zhǎng)之一
本地顯存 16 GB 80 GB RTX 4090 vs H100
云端價(jià)格 $0.05 / 1K in $0.10 / 1K in 比 GPT-4.1 便宜 5-10×
許可證 Apache 2.0 Apache 2.0 可商用、可微調(diào)

一句話:“閉源模型給答案,開(kāi)源模型給自由。”
官方主頁(yè):openai.com/gpt-oss


?? 全流程鳥瞰圖


1?? 30 秒搞定賬號(hào)與密鑰

平臺(tái) 場(chǎng)景 地址 免費(fèi)額度
Novita AI 免翻墻、支付寶、120B 云端直調(diào) novita.ai 1 萬(wàn) token
OpenRouter 多模型路由、統(tǒng)一賬單 openrouter.ai 1 美元
Ollama 本地 16 GB 起、零延遲 ollama.ai

以下示例以 Novita AI 為主,代碼同樣適用于 OpenRouter 與 Ollama,僅需替換 base_urlapi_key。


2?? 60 秒拉起 20B 輕量版

2.1 Ollama 一鍵啟動(dòng)

curl -fsSL https://ollama.ai/install.sh | sh
ollama pull gpt-oss:20b
ollama serve &

2.2 Python 第一次調(diào)用

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:11434/v1",
    api_key="ollama"  # 本地?zé)o校驗(yàn)
)

resp = client.chat.completions.create(
    model="gpt-oss:20b",
    messages=[{"role": "user", "content": "用三句話解釋量子糾纏"}],
    max_tokens=128,
    temperature=0.1
)

print(resp.choices[0].message.content)

輸出:

量子糾纏是粒子間一種超越時(shí)空的關(guān)聯(lián);  
改變一個(gè)粒子,另一個(gè)瞬時(shí)改變;
它是量子計(jì)算、量子通信的核心資源。

3?? 60 秒拉起 120B 巨獸版

3.1 Novita AI 云端直調(diào)

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="sk-nov-你的key"
)

resp = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[{"role": "user", "content": "設(shè)計(jì)一個(gè)支持百萬(wàn)并發(fā)的 IM 系統(tǒng)"}],
    max_tokens=2048,
    temperature=0.3
)

print(resp.choices[0].message.content)

輸出包含完整的鏈?zhǔn)剿季S,可直接 Ctrl+C / Ctrl+V 進(jìn) PPT。


4?? 60 秒流式打字機(jī)

stream = client.chat.completions.create(
    model="gpt-oss:20b",
    messages=[{"role": "user", "content": "寫一首關(guān)于夏天的俳句"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

5?? 60 秒函數(shù)調(diào)用

5.1 定義工具

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "查詢城市天氣",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string"}
            },
            "required": ["city"]
        }
    }
}]

5.2 調(diào)用流程

resp = client.chat.completions.create(
    model="gpt-oss-20b",
    messages=[{"role": "user", "content": "北京天氣如何?"}],
    tools=tools,
    tool_choice="auto"
)

tool_call = resp.choices[0].message.tool_calls[0]
if tool_call.function.name == "get_weather":
    city = json.loads(tool_call.function.arguments)["city"]
    result = get_weather(city)  # 本地函數(shù)

6?? 60 秒部署 FastAPI

from fastapi import FastAPI
from pydantic import BaseModel

app = FastAPI()

class Prompt(BaseModel):
    text: str

@app.post("/chat")
def chat(p: Prompt):
    resp = client.chat.completions.create(
        model="openai/gpt-oss-20b",
        messages=[{"role": "user", "content": p.text}],
        max_tokens=512
    )
    return {"answer": resp.choices[0].message.content}
uvicorn main:app --reload

7?? 60 秒壓力測(cè)試

并發(fā) 模型 首 token 延遲 成功率 成本 (1K in/out)
1 20B 本地 0.8 s 100 % $0
10 20B 本地 1.1 s 100 % $0
100 120B 云端 2.3 s 99.8 % $0.10 / $0.50

測(cè)試環(huán)境:MacBook Pro M2 Max 32 GB vs 云 H100。


8?? 本地微調(diào)(可選)

pip install transformers datasets peft
python -m gpt_oss.finetune gpt-oss-20b my_dataset.jsonl

9?? 一鍵復(fù)制倉(cāng)庫(kù)

git clone https://github.com/yourname/gpt-oss-python-demo.git
cd gpt-oss-python-demo
pip install -r requirements.txt
python main.py

倉(cāng)庫(kù)包含:


?? 寫在最后

從 20B 的輕量利刃,到 120B 的推理巨獸,再到 Apache 2.0 的自由之翼,OpenAI OSS 讓“大模型”第一次不再是巨頭的專利,而是你我鍵盤下的日常工具。
下一次,當(dāng)老板問(wèn)你“這個(gè)功能 AI 能不能做”時(shí),你可以微笑著回答:


“給我 30 秒,Python 搞定?!?/p>

上一篇:

OpenAI OSS Go 語(yǔ)言 API 教程:輕松調(diào)用 GPT-OSS-120B 與 GPT-OSS-20B

下一篇:

Claude 4.1 Opus API快速接入教程:使用Go語(yǔ)言實(shí)現(xiàn)高效的文本生成與對(duì)話系統(tǒng)
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)