亚洲视频一区二区三区,精品国产成人高清在线,天天干天天色综合

?? 為什么必須現(xiàn)在上車 OpenAI OSS？

2025 年 8 月 6 日，OpenAI 重返開(kāi)源戰(zhàn)場(chǎng)，一次性甩出 Apache 2.0 許可的 GPT-OSS-120B 與 GPT-OSS-20B，直接把“大模型平民化”從口號(hào)變成事實(shí)：

維度	GPT-OSS-20B	GPT-OSS-120B	備注
參數(shù)量	21 B	117 B	MoE，僅 3.6-5.1 B 活躍
上下文	128 K	128 K	全開(kāi)源最長(zhǎng)之一
本地顯存	16 GB	80 GB	RTX 4090 vs H100
云端價(jià)格	$0.05 / 1K in	$0.10 / 1K in	比 GPT-4.1 便宜 5-10×
許可證	Apache 2.0	Apache 2.0	可商用、可微調(diào)

一句話：“閉源模型給答案，開(kāi)源模型給自由。”
官方主頁(yè)：openai.com/gpt-oss

?? 全流程鳥瞰圖

1?? 30 秒搞定賬號(hào)與密鑰

平臺(tái)	場(chǎng)景	地址	免費(fèi)額度
Novita AI	免翻墻、支付寶、120B 云端直調(diào)	novita.ai	1 萬(wàn) token
OpenRouter	多模型路由、統(tǒng)一賬單	openrouter.ai	1 美元
Ollama	本地 16 GB 起、零延遲	ollama.ai	∞

以下示例以 Novita AI 為主，代碼同樣適用于 OpenRouter 與 Ollama，僅需替換 base_url 與 api_key。

2?? 60 秒拉起 20B 輕量版

2.1 Ollama 一鍵啟動(dòng)

curl -fsSL https://ollama.ai/install.sh | sh
ollama pull gpt-oss:20b
ollama serve &

2.2 Python 第一次調(diào)用

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:11434/v1",
    api_key="ollama"  # 本地?zé)o校驗(yàn)
)

resp = client.chat.completions.create(
    model="gpt-oss:20b",
    messages=[{"role": "user", "content": "用三句話解釋量子糾纏"}],
    max_tokens=128,
    temperature=0.1
)

print(resp.choices[0].message.content)

輸出：

量子糾纏是粒子間一種超越時(shí)空的關(guān)聯(lián)；  

改變一個(gè)粒子，另一個(gè)瞬時(shí)改變；  

它是量子計(jì)算、量子通信的核心資源。

3?? 60 秒拉起 120B 巨獸版

3.1 Novita AI 云端直調(diào)

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="sk-nov-你的key"
)

resp = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[{"role": "user", "content": "設(shè)計(jì)一個(gè)支持百萬(wàn)并發(fā)的 IM 系統(tǒng)"}],
    max_tokens=2048,
    temperature=0.3
)

print(resp.choices[0].message.content)

輸出包含完整的鏈?zhǔn)剿季S，可直接 Ctrl+C / Ctrl+V 進(jìn) PPT。

4?? 60 秒流式打字機(jī)

stream = client.chat.completions.create(
    model="gpt-oss:20b",
    messages=[{"role": "user", "content": "寫一首關(guān)于夏天的俳句"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

5?? 60 秒函數(shù)調(diào)用

5.1 定義工具

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "查詢城市天氣",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string"}
            },
            "required": ["city"]
        }
    }
}]

5.2 調(diào)用流程

resp = client.chat.completions.create(
    model="gpt-oss-20b",
    messages=[{"role": "user", "content": "北京天氣如何？"}],
    tools=tools,
    tool_choice="auto"
)

tool_call = resp.choices[0].message.tool_calls[0]
if tool_call.function.name == "get_weather":
    city = json.loads(tool_call.function.arguments)["city"]
    result = get_weather(city)  # 本地函數(shù)

6?? 60 秒部署 FastAPI

from fastapi import FastAPI
from pydantic import BaseModel

app = FastAPI()

class Prompt(BaseModel):
    text: str

@app.post("/chat")
def chat(p: Prompt):
    resp = client.chat.completions.create(
        model="openai/gpt-oss-20b",
        messages=[{"role": "user", "content": p.text}],
        max_tokens=512
    )
    return {"answer": resp.choices[0].message.content}

uvicorn main:app --reload

7?? 60 秒壓力測(cè)試

并發(fā)	模型	首 token 延遲	成功率	成本 (1K in/out)
1	20B 本地	0.8 s	100 %	$0
10	20B 本地	1.1 s	100 %	$0
100	120B 云端	2.3 s	99.8 %	$0.10 / $0.50

測(cè)試環(huán)境：MacBook Pro M2 Max 32 GB vs 云 H100。

8?? 本地微調(diào)（可選）

pip install transformers datasets peft
python -m gpt_oss.finetune gpt-oss-20b my_dataset.jsonl

9?? 一鍵復(fù)制倉(cāng)庫(kù)

git clone https://github.com/yourname/gpt-oss-python-demo.git
cd gpt-oss-python-demo
pip install -r requirements.txt
python main.py

倉(cāng)庫(kù)包含：

20B / 120B 雙模式
FastAPI 完整項(xiàng)目
Dockerfile & docker-compose
Prometheus Grafana 監(jiān)控

?? 寫在最后

從 20B 的輕量利刃，到 120B 的推理巨獸，再到 Apache 2.0 的自由之翼，OpenAI OSS 讓“大模型”第一次不再是巨頭的專利，而是你我鍵盤下的日常工具。
下一次，當(dāng)老板問(wèn)你“這個(gè)功能 AI 能不能做”時(shí)，你可以微笑著回答：

“給我 30 秒，Python 搞定?！?/p>

OpenAI OSS Go 語(yǔ)言 API 教程：輕松調(diào)用 GPT-OSS-120B 與 GPT-OSS-20B

Claude 4.1 Opus API快速接入教程：使用Go語(yǔ)言實(shí)現(xiàn)高效的文本生成與對(duì)話系統(tǒng)

#你可能也喜歡這些API文章!

使用Scala Play框架構(gòu)建REST API

構(gòu)建API時(shí)值得使用的4個(gè)實(shí)用VS Code擴(kuò)展

api 認(rèn)證與授權(quán)的最佳實(shí)踐

Jenkins API使用教程

小米開(kāi)放平臺(tái)集成全攻略：開(kāi)發(fā)、測(cè)試與優(yōu)化

什么是GraphRAG

10 個(gè)最佳 API 設(shè)計(jì)實(shí)踐

智能旅行API：你的完美旅行規(guī)劃助手

旅游供應(yīng)商的Travel Booking APIs [Onix概覽]

我們有何不同？

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型，提升決策效率

查看全部API→

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道

一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道