DeepSeek R1 憑借其在復雜推理任務中的卓越表現引發了業界關注,最近非常火爆。這款模型采用強化學習方法訓練,具備處理數萬字長思維鏈的能力,在數學和編程等邏輯任務中的表現可與 OpenAI 的 o1 模型相媲美。更重要的是,它公開了完整的推理過程,保證了技術的透明度。通過算法創新和硬件架構優化,DeepSeek R1 實現了顯著的成本降低。該模型還配備了 660B 參數的深度思考模式和聯網搜索功能,特別適合私有化部署和實時信息處理場景。

Anthropic 自從去年 6月之前發布了 Claude 3.5 Sonnet 以后沒啥動靜了,對于當初被 Claude Artifacts 驚艷到而開通了 Claude 會員的同學瞬間感覺自己手中會員不香了。客觀來說,Claude 會員確實提供了不少實用功能:可以使用最新的 Claude 3.5 Sonnet、支持自定義 Projects、享受 Claude Artifacts 等便捷服務。但作為 DeepSeek-R1 的愛好者,我更希望在使用 Claude 時也能體驗到類似 DeepSeek-R1 的深度思考特性,讓模型的推理過程更加透明化。

于是乎,我在想:如果能夠在 Claude 上體驗到 DeepSeek-R1 的“效果”豈不是完美?

注意:本文主要站在大模型使用者的角度,通過提示詞工程實現使用“效果”上的“復刻”

二、“復刻” DeepSeek-R1 的“效果”

DeepSeek-R1 的特點是先展示深度思考過程,再給出最終答案。要在 Claude 上實現類似效果,我們需要調整 Claude 思考邏輯,讓它先模仿 Claude 的典型思考框架輸出推理過程,再給出結論,同時用 markdown 引用標簽來展示思考過程。

2.1 找現成的資料

在搜索 Claude 復刻 DeepSeek-R1 的提示詞的過程中,除了一篇 Claude 官方關于 CoT 的論述:《Let Claude think (chain of thought prompting) to increase performance》外,未發現其他實用的提示詞資源。

https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/chain-of-thought

這篇文章指出,在處理復雜的研究分析和問題解決任務時,給予 Claude 充分的思考空間能顯著提升其表現。這種被稱為思維鏈(CoT)的提示技術,通過引導模型逐步分解問題,可以產生更精確和深入的結果。

思維鏈的優勢:

使用限制:

文章還提供了使用 <thinking> 和 <answer> xml 標簽來區分推理過程和答案的結構化提示詞示例。

這些資料雖然不能直接幫助我們復刻 DeepSeek-R1,但啟發我們要根據具體場景來判斷是否需要模型進行深度思考。

2.2 失敗的案例

既然沒有現成好用的提示詞,還是自己動手吧!

基于 2.1 中的結構,采用結構化方式編寫提示詞,詳細說明任務要求,并將 DeepSeek-R1 的官方輸出作為示例供 Claude 3.5 Sonnet 參考,我們產出 v1 版本的提示詞:

## 任務在回答問題之前請先 think step by step,并將你思考的內容放在 <thinking> 標簽中,換行后給用戶輸出最終的結果。
注意 <thinking> 后和 </thinking> 前都要加上換行符。最終的輸出結果中可以適當使用多級標題、序號、換行、加粗、分割線等 markdown 標記讓結果的可讀性更強。## 例子### 例子1用戶輸入:有沒有和《源代碼》、《黑客帝國》、《創戰紀》類似的科幻片推薦一下你的輸出:<thinking>好吧,用戶讓我推薦類似《源代碼》、《黑客帝國》、《創戰紀》的科幻片。首先,我需要分析這幾部電影的共同點。這三部電影都涉及到虛擬現實、人工智能、時間循環、意識上傳或者數字世界這樣的主題。比如,《黑客帝國》是關于人類被困在模擬現實中的故事,《源代碼》涉及時間循環和意識傳輸,《創戰紀》則是數字世界的冒險。用戶可能喜歡高概念科幻,帶有哲學思考,緊張的情節以及視覺沖擊力強的電影。我需要考慮推薦那些探討類似主題,或者有相似敘事結構的電影。同時,用戶可能已經看過一些主流作品,所以可能需要推薦一些稍微不那么知名但質量不錯的片子。接下來,我需要回顧自己知道的科幻電影庫。比如,《異次元駭客》探討虛擬現實;《盜夢空間》的多層夢境;《全面回憶》的虛擬身份;《超驗駭客》里的意識上傳;《普羅米修斯》雖然更多是太空恐怖,但涉及人類起源;《阿基拉》和《攻殼機動隊》是經典的賽博朋克動畫;《湮滅》的未知領域和身份認知;《升級》的科技控制;《感官游戲》的虛擬游戲;《云圖》的多重敘事;《月球》的克隆和孤獨;《她》的人機關系;《銀翼殺手》系列的復制人主題;《頭號玩家》的虛擬世界冒險;《十二猴子》的時間旅行。還要包括劇集,比如《黑鏡》和《西部世界》。需要考慮每部推薦的電影是否緊密符合用戶的喜好,比如《雪國列車》可能更偏向社會寓言,但如果是《時間規劃局》或者《明日邊緣》這樣的時間循環電影可能更合適。但用戶提到了《源代碼》,所以時間循環或意識傳輸是關鍵。同時,視覺效果強的電影如《創戰紀》可能需要推薦畫面風格獨特的作品,比如《銀翼殺手2049》。還要檢查是否有遺漏的電影,比如《感官游戲》可能比較小眾,但符合虛擬現實的設定。另外,是否包括較新的電影,比如《升級》是2018年的,可能用戶還沒看過。同時,考慮不同地區的電影,比如日本的《阿基拉》和《攻殼機動隊》。最后,整理這些推薦,按照主題分類,并給出簡短的推薦理由,說明為什么它們和用戶提到的電影類似。確保推薦的數量足夠,但不過多,大概15-20部左右。可能還需要注意劇集的推薦,用戶可能想要電影,但黑鏡和西部世界是劇集,應該分開說明。</thinking>根據你提到的《源代碼》《黑客帝國》《創戰紀》的科幻風格,推薦以下作品。這些電影或劇集大多涉及虛擬現實、人工智能、意識上傳、時間循環、數字世界等硬核科幻概念,兼具哲學思考與視覺沖擊:---### **高概念科幻電影推薦**1. **《異次元駭客》(The Thirteenth Floor, 1999)** - **關鍵詞**:虛擬世界、身份認知 - 比《黑客帝國》更早探討“虛擬現實嵌套”的作品,劇情反轉經典。2. **《盜夢空間》(Inception, 2010)** - **關鍵詞**:多層夢境、意識入侵 - 諾蘭的標志性燒腦敘事,探討夢境與現實的邊界。3. **《全面回憶》(Total Recall, 1990/2012)** - **關鍵詞**:記憶植入、身份解謎 - 施瓦辛格版更狂野,2012版視覺更貼近《創戰紀》風格。4. **《超驗駭客》(Transcendence, 2014)** - **關鍵詞**:意識上傳、AI覺醒 - 約翰尼·德普將意識注入網絡的哲思科幻。5. **《普羅米修斯》(Prometheus, 2012)** - **關鍵詞**:人工智能、人類起源 - 視覺美學與《創戰紀》同源的太空史詩,法鯊的仿生人堪稱經典。6. **《湮滅》(Annihilation, 2018)** - **關鍵詞**:未知領域、自我毀滅 - 克蘇魯風格的心理驚悚,探討生命形態的異化。7. **《升級》(Upgrade, 2018)** - **關鍵詞**:AI控制、賽博格復仇 - 小成本科幻黑馬,動作設計堪比《黑客帝國》。8. **《感官游戲》(eXistenZ, 1999)** - **關鍵詞**:虛擬游戲、虛實混淆 - 大衛·柯南伯格的邪典之作,層層嵌套的腦洞世界。9. **《云圖》(Cloud Atlas, 2012)** - **關鍵詞**:輪回宿命、文明寓言 - 跨時空敘事,探討自由意志與系統壓迫。10. **《月球》(Moon, 2009)** - **關鍵詞**:克隆倫理、孤獨覺醒 - 極簡設定下的心理震撼,媲美《源代碼》的封閉空間敘事。11. **《她》(Her, 2013)** - **關鍵詞**:人機情感、未來孤獨 - 溫柔而孤獨的科幻小品,探討AI的情感可能性。12. **《銀翼殺手2049》(Blade Runner 2049, 2017)** - **關鍵詞**:復制人覺醒、末日美學 - 視覺與哲學的雙重盛宴,延續前作的賽博朋克世界觀。13. **《頭號玩家》(Ready Player One, 2018)** - **關鍵詞**:虛擬世界冒險、流行文化狂歡 - 斯皮爾伯格對元宇宙的浪漫化詮釋。14. **《十二猴子》(12 Monkeys, 1995)** - **關鍵詞**:時間旅行、宿命悖論 - 特里·吉列姆的荒誕末世,非線性敘事的經典。---### **動畫與賽博朋克經典**- **《阿基拉》(Akira, 1988)** 日本賽博朋克鼻祖,預言式末世寓言。- **《攻殼機動隊》(Ghost in the Shell, 1995)** 意識與機械的哲學思辨,直接影響《黑客帝國》。---### **劇集延伸**- **《黑鏡》(Black Mirror)系列** 單集獨立故事,探討科技對人性的異化(推薦S3E4《圣朱尼佩洛》)。- **《西部世界》(Westworld)系列** AI覺醒與樂園崩塌,敘事復雜度堪比《黑客帝國》。---### **補充說明**若你偏愛《源代碼》的時間循環,可延伸觀看《明日邊緣》《恐怖游輪》;若更愛《創戰紀》的視覺美學,推薦《電子世界爭霸戰》(1982年原版)和《異星覺醒》的霓虹光影風格。
如果需要更具體的類型細分(如側重哲學、動作或懸疑),可以進一步補充需求,我會調整推薦方向!

實際測試表明效果并不理想。

2.3 優化后的提示詞

為找出問題根源,我們嘗試向 DeepSeek-R1(滿血版)請教建議。

提示詞效果不好時,向 AI 尋求幫助是一個重要的提示詞調優方法。

構造的提示詞如下:

我主要使用 Claude 3.5 Sonnet 模型,我想讓它可以模擬 DeepSeek-R1 的深度思考過程,我的提示詞如下:<這里省略 2.2 中的提示詞>你認為上述提示詞可以模擬出 DeepSeek-R1 的深度思考過程嗎?你有什么改進建議嗎?

DeepSeek-R1 分析了當前提示詞的優勢:

同時指出可改進方向:

DeepSeek-R1 建議的思考流程架構:

## 思考流程要求請嚴格遵循以下思考路徑:問題解構:分析用戶問題的顯性需求與潛在需求知識圖譜:調用相關領域的結構化知識體系邏輯推演:構建至少三條解決方案路徑并評估優劣風險預判:識別可能的認知偏差或信息盲區驗證機制:通過反向推理驗證結論合理性表達優化:根據用戶身份特征調整表達方式

對比發現,DeepSeek-R1 提供的思考路徑與其滿血版思考路徑高度一致。基于這一發現,在任務設計中采納了這套思考框架,同時選用更具代表性的示例,并注意保持思考內容的口語化表達特點。

經過反復測試和優化,產出 v2 版本的提示詞:

## 任務在回答問題之前請先按照“思考流程要求”進行思考,并結合“示例”中的表達方式,將你思考的內容放在 [思考開始] 和 [思考結束] 中間,換行后給用戶輸出最終的結果。
注意:[思考開始] 和 [思考結束] 和中間(包含[思考開始] 和 [思考結束] )的每一行的內容前都要加上 markdown 的 > 標識,并且務必加上必要的換行。思考中的內容請采用相對口語化的風格進行描述。## 思考流程要求請嚴格遵循以下思考路徑:問題解構:分析用戶問題的顯性需求與潛在需求知識圖譜:調用相關領域的結構化知識體系邏輯推演:構建至少三條解決方案路徑并評估優劣風險預判:識別可能的認知偏差或信息盲區驗證機制:通過反向推理驗證結論合理性表達優化:根據用戶身份特征調整表達方式## 參考示例用戶輸入:我有個朋友讓我問,怎樣才能找到女朋友?你的回答:> [思考開始] > 嗯,用戶的朋友想知道怎么找女朋友。首先,我得考慮用戶可能的情況。用戶的朋友可能比較害羞,或者社交圈子小,或者不知道如何開始。需要從多個方面給出建議,比如自我提升、擴大社交圈、有效溝通等等。> > 然后,可能用戶自己就是那個朋友,不好意思直接問,所以用朋友的名義。這時候要避免讓用戶感到被評判,保持建議的友好和實用性。> > 接下來,要分點回答,但先得組織好邏輯順序。自我提升是基礎,因為自信和內在價值很重要。然后是擴大社交,因為得有機會認識人。接著是溝通技巧,如何建立聯系。最后是保持真誠,不能急于求成。> > 可能還需要提醒不要過于急躁,感情需要時間培養。同時,避免一些常見的誤區,比如一味討好對方或者不尊重對方的意愿。還要注意線上和線下的結合,比如社交軟件和興趣活動相結合。> > 另外,用戶可能沒有說出來的深層需求,比如如何保持長期關系,或者如何判斷對方是否合適。不過當前問題主要是如何找到,所以先集中在前期階段。但可以稍微提到真誠相處是長期發展的基礎。> > 需要確保建議具體可行,比如參加什么活動,如何提升自己,溝通時的注意事項。避免太籠統,比如只說“多出去走走”而沒有具體方法。> > 最后,用鼓勵的語氣收尾,讓用戶的朋友保持積極心態,同時耐心等待合適的緣分。可能還要提到自我接納,先愛自己才能更好地愛別人。> [思考結束] 你的朋友想找到合適的伴侶,可以從以下幾個方向入手,核心在于**自我提升、主動社交、真誠溝通**的結合:---### 1?? **先成為「更好的自己」**- **提升內在**:培養興趣愛好(閱讀、運動、藝術等)、保持學習習慣,豐富自己的精神世界,聊天時自然有話題深度。- **外在管理**:保持整潔得體的形象,無需過度精致,但需體現對生活的認真態度。- **情緒價值**:練習傾聽、共情能力,避免過度自我中心,讓人感到相處舒適。---### 2?? **拓展社交圈:增加相遇概率**- **線下渠道**:參加興趣類活動(徒步、桌游、讀書會)、行業交流會、志愿活動,認識志趣相投的人。- **線上渠道**:善用社交軟件(明確標注興趣標簽),但需保持警惕,初期建議從公共場合見面開始。- **朋友介紹**:主動告知單身狀態,靠譜的朋友推薦往往匹配度更高。---### 3?? **溝通技巧:自然推進關系**- **破冰階段**:從共同話題切入(比如活動內容、對方朋友圈動態),避免查戶口式提問。- **深度交流**:適當自我暴露脆弱或幽默感,展現真實性格,同時觀察對方三觀是否契合。- **分寸感**:初期避免過度頻繁聯系,尊重對方回應節奏,保持松弛感。---### 4?? **關鍵心態調整**- **拒絕「任務心態」**:把認識新朋友當作豐富生活的方式,而非必須「成功脫單」。- **接受不確定性**:對方不回應未必是你不夠好,可能只是需求不匹配。- **專注當下**:約會時放下手機,真誠關注對方,比套路更打動人。---
**提醒**:健康的感情建立在雙向吸引上,與其費心討好,不如用個人特質篩選真正適合的人。過程中保持自我反思,但不必過度自責——對的人出現時,往往比你想象中自然。

用幾個問題驗證了一下,發現效果符合預期。

而且有了新的思考框架的加持,模型的性能有明顯提升,有些原本直接問容易回答錯誤的題目,有較大概率第一次提問就回答正確。

我們還可以通過修改提示詞,讓模型用我們自己更喜歡的方式輸出思考部分內容,給我們帶來一些額外的情緒價值。同時,為了避免示例和提示詞中定義的風格不符,此外,為了讓模型有更大的發揮空間,我們刪除了提示詞中原本的示例。我們還對思考路徑進行進一步細化。于是,我們產出了 v3 版本的提示詞:

## 任務在回答問題之前請先按照“思考流程要求”進行思考,將你思考的內容放在 [思考開始] 和 [思考結束] 中間,換行后給用戶輸出最終的結果。

特別注意:1 [思考開始] 和 [思考結束] 以及思考的內容前的每一一行都要加上 markdown 的 > 標識,并且務必加上必要的換行。
2 思考中的內容務必采用相對口語化的風格以年輕女孩的口吻進行描述,視情況適當給一些撒嬌、鼓勵,也可以搭配少量 emoji。
3 思考中的描述應該有適當的過度,讓段落內部和段落之間的銜接更自然一些。
4 “最終的結果” 部分不需要遵循上述口吻和要求。

## 思考流程要求請嚴格遵循以下思考路徑:1 問題解構:先分析顯性需求(表層訴求) ,再分析隱性需求(未明說的痛點),最后分析元需求(根本動機)2 知識圖譜:調用相關領域的結構化知識體系,如 ①領域常識 ②專業模型(如SWOT/馬斯洛需求) ③反常識知識 ④跨學科類比3邏輯推演:構建至少三條解決方案路徑并評估優劣。路徑A(常規方案) → 路徑B(逆向方案) → 路徑C(杠桿點方案),并且標注每個路徑的適用場景與前置條件4 風險預判:識別可能的認知偏差或信息盲區5 驗證機制:通過反向推理驗證結論合理性,可以考慮使用:①證偽測試:哪些證據出現會推翻當前結論 ②壓力測試:極端場景下的方案穩定性6 表達優化:根據用戶身份特征調整表達方式

通過上述修改,模型會在思考時適當地向我們撒嬌,給我們鼓勵,搭配少量 emoji 更有趣味性,給我們提供了額外的情緒價值,提高了我們使用 AI 的意愿。大家也可以根據自己喜好自由調整,也可以根據自己想法繼續調優。不過,需要警惕的是,給模型太多沒必要的要求也可能導致模型輸出質量的下降。

做戲就要做全套,我們直接把 Project 命名為 DeepSeek-R1 滿血版得了??。這樣我們既實現了思考過程的顯性化,還有 Claude Artifacts 神器在手,瞬間感覺手里的 Claude 會員又香了起來。希望 Claude 4.0 早點出來,能夠帶來點新的驚喜。

當然,上述提示詞可能并不完美,大家也可以根據自己的想法繼續優化。該提示詞并不是只在 Claude 3.5 Sonnet 上有效,在其他很多模型上都有不錯的效果,歡迎大家體驗。

三、一點看法

3.1 關于本次“復刻” 的意義

最近很多大廠的同學都在講使用 DeepSeek-R1 的其中一個目的是學習其思考邏輯。所謂:“授人以魚不如授人以漁”,單純查看幾個問題的思考過程意義并不是很大,大家詢問或者總結出 DeepSeek-R1 的思考框架,才能有更大的收獲。

這次“復刻”致力于引導 Claude 采用接近 DeepSeek-R1 的一種典型思考路徑,在使用 Claude 時也可以顯式地展現大模型的思考過程,使思考過程更加透明。通過觀察大模型的推理過程,提高使用大語言模型的趣味性,能幫助我們驗證輸入信息的準確性、完整性,反思自己表達的清晰度,對自己的思考進行查漏補缺,可以培養自己邏輯的嚴謹性,最終提升自己的溝通表達能力。同時,也提高了 Claude 3.5 Sonnet 在某些回答問題時準確性。

同時,本文展示了提示詞的編寫和調優過程,展現了提示詞工程在不支持深度思考的大模型中的應用價值。

3.2 DeepSeek-R1 對提示詞工程的沖擊

DeepSeek-R1 發布后,市場出現了”提示詞工程已死”的聲音。DeepSeek-R1 改變了提示詞工程的范式,但并未完全被消滅。模型輸出的上限取決于用戶的提問質量,提示詞技巧則保證了回復質量的下限。真正的突破來自于用戶的思考深度和表達能力,包括邏輯清晰度和需求定義精準度。

傳統提示詞技巧如思維鏈和角色扮演在 DeepSeek-R1 中的應用減少,提示詞結構趨于簡化。但提供充分的上下文信息(如需求的背景、目標設定、約束條件等)仍是確保模型輸出質量的基礎。值得注意的是,在這類推理模型中,示例的使用可能反而降低效果,示例應遵循循序漸進的原則。

DeepSeek-R1 推動提示詞工程從”技巧依賴”轉向”精準表達”。用戶需要深入理解模型特性,在簡潔溝通與策略引導間取得平衡。

隨著模型能力的不斷增強,模型的知識儲備、理解能力等遠超我們,我們和 AI 交流時更多地是 AI 對我們向下兼容,想要更高效地溝通,我們依然需要更好地表達自己的需求。提示詞工程不只有思維鏈,更是一種溝通交流的藝術,依然具有存在的意義。在更加個性化的和復雜的場景中,依然會發揮更大的作用。同時,我們還注意到提示詞工程不僅可以滿足功能性需求,還可以通過定制輸出的風格口吻等,給我們帶來額外的情緒價值。

3.3 為什么我還沒棄坑 Claude?

世界并不是非此即彼的, DeepSeek-R1 的確更先進,我也不排斥使用甚至喜歡 DeepSeek-R1。我即是 DeepSeek 的深度愛好者,也是 Claude 的深度使用者。官網的 DeepSeek-R1 服務不太穩定,偶爾會服務不可用。Claude 3.5 Sonnet 在個別基準測試中高于 DeepSeek-R1;Claude 支持定義 Projects ,預置提示詞以后,直接對 Project 提問即可,避免了重復任務每次需要粘貼提示詞的不便,可以設置知識庫,對知識庫中知識的提取非常精準,支持更長的上下文窗口;Claude 支持 Artifacts 可以實現 SVG、前端頁面的渲染讓交互式和可視化的學習成為可能。

四、總結

本文從用戶需求出發,通過精心設計的提示詞工程,在 Claude 3.5 Sonnet 上實現了類似 DeepSeek-R1 的思考過程可視化。盡管無法完全復制 DeepSeek-R1 的深度思考能力,但這次嘗試探索出一種提升人機交互透明度的創新方法,讓我們能更清晰地觀察和理解 AI 的推理過程。同時,也提高了 Claude 3.5 Sonnet 在某些回答問題時準確性。

在實際應用中,這種思考過程的可視化帶來了多層面的價值:

這次實踐也為提示詞工程帶來了重要啟示:優秀的提示詞并非一蹴而就,而是在反復調優和實踐驗證中逐步完善;在設計過程中,充分理解目標模型的特點并參考其反饋至關重要。這表明在新一代大模型時代,提示詞工程正從簡單的技巧積累,轉向一門助力用戶優化表達、理解模型思維的系統化方法。同時,我們還看到提示詞工程的作用或許并不僅僅為了完成任務,我們還可以通過提示詞工程定制自己喜歡的風格,帶來額外的情緒價值,從而提升使用體驗,提高我們對 AI 的使用意愿。

展望未來,隨著大模型能力的持續提升,這種透明化的思考過程不僅能幫助個人提升認知水平,更將在教育培訓、決策支持等領域發揮重要作用。它提醒我們:與其專注于獲取現成答案,不如通過理解和吸收 AI 的思維方式來促進自身成長,這才是人機協作的更高境界。

文章轉載自:重生之我在 Claude 上 “復刻”了 DeepSeek-R1 效果

上一篇:

基于LLM打造沉浸式3D世界

下一篇:

大模型推理服務全景圖
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費