【入門科普】關於Deepseek你肯定會關心的3個基本問題

更新于：2025-03-26 09:25:10

是什麼，超越ChatGPT登頂蘋果App Store排行榜？

是什麼，讓英偉達股價暴跌近20%？

是什麼，讓OpenAI一邊忍不住誇讚一邊又無中生有地污衊其盜竊？

是什麼，讓中國人春節前後歡騰不已而美國人叫苦不迭？

答案是——Deepseek的橫空出世。

相信春節前後有在關注科技圈的朋友們，都會被關於Deepseek的報導、體驗、分析等內容一遍遍地刷屏。這些內容，有從個人體驗切入感歎Deepseek的強大，有從技術層面入手詳細拆解背後的突破，也有從政治、經濟、國際關係等層面剖析中美兩國關係的變化。但我在春節期間回家與親朋戚友交流發現，他們其實也有刷到相關的內容，但大多表示看不懂，或者不太清楚這款產品對於他們的日常使用有什麼影響？基於此，結合本人這些天來的資訊搜集和個人體驗，我打算撰寫這篇科普文章，希望從普通人的視角來切入，回答普通人對於Deepseek需要知道的內容。

01 Deepseek是什麼

簡單來說，Deepseek是由杭州深度求索公司所自研的一款通用生成式AI產品。深度求索公司在2023年7月17日正式成立，在短時間內，Deepseek發佈了多個重要模型，比如Deepseek Coder、Deepseek LLM、Deepseek-V2、Deepseek-V3。2025年1月15日，搭載Deepseek-V3模型的APP上架，快速登頂蘋果App Store排行榜。2025年1月20日，引起關注的Deepseek-R1模型發佈並同步開源。

看到這裡，也許你會發出疑問：在此之前，國內已經有多款AI產品先後發佈，也號稱取得良好的效果。那為什麼這次Deepseek的發佈，如此大的關注呢？來，我們接著往下。

02 為什麼Deepseek的發佈，會引起如此大的關注

Deepseek近期引發全球關注的原因，總結起來有以下4點：

1）模型的表現卓越：根據Deepseek官方和其他行業人士測試的結果，Deepseek-R1模型在數學、代碼、自然語言推理等任務上，性能比肩 OpenAI o1 正式版，部分測試甚至超越了OpenAI的模型。而且，Deepseek針對中文語境和特定行業需求進行了精心優化，“更適合中國寶寶體質”。

2）模型的訓練方式足夠創新突破：Deepseek-R1 通過獨立自研的方式，在對模型訓練方式、架構等進行了多項優化改進，從而大幅提升了訓練效率。而且，Deepseek團隊將他們的探索過程一一記錄在論文當中，幫助業界指明方向。

3）模型的全面開源：Deepseek-R1模型完全開源，在遵循MIT License的規則下，為全球開發者敞開了自由使用、修改和進一步開發的大門。這種開放性極大地促進了AI領域的技術交流與創新，為整個行業的發展提供了強大助力。而這樣的開源精神，曾經是OpenAI所宣導的（OpenAI的Open正是此意）。

4）模型的使用成本低：如果不想部署開源模型，Deepseek也提供了價格很低的API。這意味著普通開發者和企業可以在不承擔過高費用的前提下，輕鬆地將Deepseek的強大功能整合到自己的應用程式或業務流程中。相信隨著越來越多的落地場景探索，AI技術在應用層面會取得更大的突破。

綜上所述，從國際關係視角來看，Deepseek是我國打破美國算力晶元封鎖的有力動作，某種層面也給了其他行業極大的信心（任何年代，信心都是比黃金還要珍貴的事物）；從技術視角來看，Deepseek使用了很低的算力成本，就達到了OpenAI-O1模型的水準，為後續的技術反覆運算指明瞭方向，而且它還對外開源了；從應用視角來看，Deepseek相當於讓每一位消費者都可以使用到第一梯隊的AI產品，實現“技術平權”。

或許，你不負責技術實現，也不關心國家大事，但Deepseek的問世，也意味著我們使用AI的方式也有了變化，這就跟我們密切相關了。接下來，我們來看看，對於普通人而言，Deepseek發佈后，使用AI的方式有哪些改變。

03 Deepseek發佈后，我們使用AI的方式有哪些變化

我們先來看看，在Deepseek發佈之前（或者說是OpenAI-o1發佈之前），在普羅大眾層面傳播的AI使用方式是怎樣的。以下是我在微信搜索“提示詞”的一些典型文章截圖。

這些提示詞教學，無一不是在強調提示詞的框架性。但從Deepseek-R1發佈的那一刻起，這些文章的內容就已經不再適用了。關於這一點的原因，我在我自己的AI課程里也有介紹，倒不是說這些內容是錯誤的，而是它們其實是屬於提示詞工程（Prompt Engineering）範疇的內容。各類專業框架，實質上是給AI生成過程提供嚴謹、完整的參考資訊和思考鏈路，從而追求極致的生成品質。但是，Deepseek-R1以及之前的OpenAI-O1，都是推理型模型，自帶思維鏈的能力。對於沒有經過深度鑽研提示詞工程的普羅大眾而言，盲目套用這些框架，只會干擾AI的思考結果，得不償失。就好比手動檔的汽車，需要駕駛員自己判斷何時切換檔位，為此也有各路老司機總結的一些判斷準則。但是，盲目將這些判斷套用到自動檔上，顯然是適得其反。

所謂思維鏈（CoT，Chain-of-Thought），就是讓模型在給出答案前進行逐步的思考與推理，並將這一過程顯式呈現，彷彿是人類將複雜的思考路徑拆解展示。例如在解決多步數學問題或複雜邏輯推理時，模型按照邏輯順序逐步分析，先理解問題，再尋找關鍵條件，逐步推導直至得出結論。這種方式不僅增強了模型的可解釋性，使人們能夠清晰瞭解答案的由來，同時也提升了解決複雜問題的能力。

那麼，在自帶思維鏈的Deepseek面前，我們使用AI方式，應該如何改變？比之“改變”，我認為準確的說法是“回歸”，也就是回歸到平常的自然語言上。用大白話解答就是三個字——

說——人——話——

展開來講就是，忘掉以往學習軟體那一套“指令式交互”，而是回歸到完成任務本身。也就是我們把AI看成是一名“無所不知、非常聰明、聽懂人話、剛進公司”的實習生，然後想想，如果你跟這樣一名實習生交代任務，你會怎麼交代？是不是要把任務講清楚，然後要提供足夠的參考資訊，盡可能明確各類要求，必要的時候還可以提供一些參考例子？

是的，跟AI下達指令時，不要再去糾結這樣說“正不正確”，而是關注這樣說“齊不齊全”。只要資訊給得足夠齊全，Deepseek會自己拆解問題逐步思考給出回答。

至於具體的使用Prompt的技巧，這足夠單獨成文了。限於篇幅，我們在這裡就不展開，如果大家比較感興趣，可以給在下多多點讚，我在後續安排上。這裡，我就給大家展示一個我自己使用Deepseek的例子，就是讓AI依據詞牌寫詞（補充一下，我很喜歡用給AI出寫古代詩詞，基本上能很好地看出是套了ChatGPT還是自己訓練，前者對中文的理解沒有這麼透徹）。

我的Prompt如下：

你要參考水調歌頭的詞牌，以當前人工智慧的發展為主題，寫一首歌，我希望你告訴我你主要參考了哪些作者的作品，參考了哪些內容。

是不是感覺這段Prompt平平無奇，甚至有些簡陋。是的，我是故意為之，當時也是想看看Deepseek的思維鏈表現。來，我們再來看看Deepseek的思考過程（內容較多，我就直接截圖）。

看完後我直呼好傢伙，Deepseek展示了它的完整思考過程。首先挑選它認為合適的參考作品，然後確定主題內容，押韻韻腳和用詞的選擇，最後還會檢查是否符合格律要求。這簡直就跟人類在思考創作一闕詞作的過程一模一樣。

不過，我還有後招，按我以前的經驗，AI大概率是處理不好中文的押韻問題的（我曾經為此跟ChatGPT及多款AI來回拉扯了幾輪都沒有達成）。大家注意看下，“秋”和“浮”是不押韻的，當時我心裡想，“哈哈，還不讓我抓住你的小瓣子”。於是，我就在對話里指出，“上面的作品，秋和浮，不押韻”。

然而，結果證明是我膚淺了。來，我們來看下Deepseek對此的回應。

原來是我低估了，Deepseek指出，它參考了《詞林正韻》，“流”和“浮”這兩個字在古代的讀音是押韻的，“浮”字的宋代實際讀音近「fəu」（這點我作為一名廣東人還是能理解的，實際上這兩個字在粵語里的確還是押韻的）。而且，它還補充說，“蘇轼原詞「天」「年」「寒」「間」同樣存在古今音變問題”，這多少是有點傲嬌了哈哈。不過，它最後還是按照要求進行了調整。

之後，我在多輪對話中，陸續還提了“我希望就以現代普通話為標準就行”、“最後兩句的結尾都是同一個字“舟”，可否避免？”等要求。這是我和Deepseek的最後一輪對話。

我雖已練就與AI對話的能力，但在與Deepseek對話的過程中，我依然有一種“驚喜感”，一種“你太會了”的感受。可以說，Deepseek代表著人類在AI領域的探索又前進了一步。我之前曾有總結“AI生成結果再豐富再優質，最終的判斷與選擇權在消費者。只有消費者的認知水平足夠高，才能辨別AI結果的優與劣。”這既是對AI沒有判斷立場的補充，又彷彿是人類的挽尊。

最後總結一下，我們在面對類似Deepseek這樣自帶思維鏈的推理型AI模型，在實際對話的過程中，不必關注Prompt的框架性，而是要“說人話”，也就是使用自然語言來表達清楚我們的任務。重點關注提供的資訊，對於完成任務而言是否有説明，是否足夠齊全。至於過程中的問題拆解，就儘管交給AI即可。

作者：產品經理崇生，公眾號：崇生的黑板報

本文由 @產品經理崇生原創發佈於人人都是產品經理。未經作者許可，禁止轉載

題圖來自 unsplash，基於CC0協定