
為什么要使用Google My Business Reviews API
維度 | 傳統 LLM | DeepSeek128K |
---|---|---|
上下文長度 | 4K~32K | 128K |
中文代碼表現 | 一般 | SOTA(HumanEval-CN 84.6%) |
價格 | $0.02/1K tokens | $0.002/1K tokens |
官方 Playground | 無 | ? https://platform.deepseek.com |
數據引用:2025-06《中文代碼大模型評測報告》,清華大學 & 機器之心聯合發布。
天 | 目標 | 產出物 |
---|---|---|
Day 0 | 環境準備 | API Key、Docker 鏡像 |
Day 1 | 核心功能 | 自動批改、對話答疑 |
Day 2 | 效果調優 | Prompt 模板、RAG 知識庫 |
Day 3 | 上線觀測 | Grafana 看板、灰度發布 |
sk-xxxxxxxxxx
(保存到 .env
)git clone https://github.com/deepseek-ai/coding-tutor-demo.git
cd coding-tutor-demo
echo "DEEPSEEK_API_KEY=sk-xxxxxxxxxx" > .env
docker compose up -d
瀏覽器訪問 http://localhost:3000
出現如下界面即成功:
學生提交 Python 作業后,AI 助教 10 秒內給出「得分 + 逐行點評 + 改進建議」。
步驟 | 組件 | 說明 |
---|---|---|
1 | FastAPI 接收 zip 包 | 包含 main.py、test.py |
2 | 容器內執行 pytest | 收集錯誤 |
3 | LLM 生成點評 | 128K 上下文可一次性讀取全部代碼 |
4 | 回傳 JSON | {score:88, comments:[...]} |
from openai import OpenAI
client = OpenAI(
base_url="https://api.deepseek.com/v1",
api_key=os.getenv("DEEPSEEK_API_KEY")
)
def generate_review(source_code, test_output):
prompt = f"""
你是一名 Python 講師,請根據測試輸出為學生代碼打分(0-100),并給出逐行點評。
源碼:
{source_code}
測試輸出:
{test_output}
返回 JSON 格式:{{"score":整數,"comments":["行號: 點評",...]}}
"""
resp = client.chat.completions.create(
model="deepseek-chat-128k",
messages=[{"role": "user", "content": prompt}],
temperature=0.2
)
return json.loads(resp.choices[0].message.content)
作業 | 人工評分 | AI 評分 | 誤差 |
---|---|---|---|
快排實現 | 90 | 88 | -2 |
爬蟲腳本 | 78 | 80 | +2 |
平均誤差 | — | — | ±1.7 |
數據來源:北京某高?!禤ython 入門》2025 春季班,樣本 127 份。
學生可在 IDE 內直接提問,AI 助教根據當前代碼上下文實時解答。
圖標 | 組件 | 鏈接 |
---|---|---|
?? | VS Code Extension | marketplace |
?? | WebSocket 網關 | 自建 / Cloudflare Workers |
?? | DeepSeek128K | 官方文檔 |
模板名稱 | 適用場景 | 示例占位符 |
---|---|---|
code_review |
自動批改 | {source_code} {test_output} |
explain_bug |
錯誤解釋 | {error_message} {stack_trace} |
optimize_hint |
性能提示 | {profile_result} |
使用 Jinja2 統一渲染,避免 prompt 漂移。
Top-k | 命中率 | 延遲 |
---|---|---|
3 | 92% | 120 ms |
5 | 95% | 180 ms |
階段 | 流量比例 | 觀測指標 |
---|---|---|
canary | 5% | 錯誤率、打分差異 |
beta | 30% | P95 延遲 |
stable | 100% | 用戶滿意度 |
使用 Prometheus + Grafana,關鍵面板:
項目 | 傳統方案 | DeepSeek128K 方案 |
---|---|---|
人力 | 3 名助教/100 人 | 1 名運營/100 人 |
批改時長 | 2 小時/次 | 10 秒/次 |
月度成本 | ¥15,000 | ¥800(tokens) |
學生滿意度 | 78% | 93% |
問題 | 解答 |
---|---|
上下文 128K 是否浪費? | 長代碼 + 長測試 + RAG 文檔一次加載,實測 60~90K 常見。 |
并發限制? | 默認 60 req/min,可工單申請擴容。 |
3 天,我們完成了:
DeepSeek128K 以 128K 超長上下文 + 極致中文代碼能力 + 1/10 價格 成為教育場景首選。復制本文倉庫,明天你也能上線自己的 AI 助教!