是什麼,超越ChatGPT登頂蘋果App Store排行榜?
是什麼,讓英偉達股價暴跌近20%?
是什麼,讓OpenAI一邊忍不住誇讚一邊又無中生有地污衊其盜竊?
是什麼,讓中國人春節前後歡騰不已而美國人叫苦不迭?
答案是——Deepseek的橫空出世。
相信春節前後有在關注科技圈的朋友們,都會被關於Deepseek的報導、體驗、分析等內容一遍遍地刷屏。這些內容,有從個人體驗切入感歎Deepseek的強大,有從技術層面入手詳細拆解背後的突破,也有從政治、經濟、國際關係等層面剖析中美兩國關係的變化。但我在春節期間回家與親朋戚友交流發現,他們其實也有刷到相關的內容,但大多表示看不懂,或者不太清楚這款產品對於他們的日常使用有什麼影響?基於此,結合本人這些天來的資訊搜集和個人體驗,我打算撰寫這篇科普文章,希望從普通人的視角來切入,回答普通人對於Deepseek需要知道的內容。
簡單來說,Deepseek是由杭州深度求索公司所自研的一款通用生成式AI產品。深度求索公司在2023年7月17日正式成立,在短時間內,Deepseek發佈了多個重要模型,比如Deepseek Coder、Deepseek LLM、Deepseek-V2、Deepseek-V3。2025年1月15日,搭載Deepseek-V3模型的APP上架,快速登頂蘋果App Store排行榜。2025年1月20日,引起關注的Deepseek-R1模型發佈並同步開源。
看到這裡,也許你會發出疑問:在此之前,國內已經有多款AI產品先後發佈,也號稱取得良好的效果。那為什麼這次Deepseek的發佈,如此大的關注呢?來,我們接著往下。
Deepseek近期引發全球關注的原因,總結起來有以下4點:
1)模型的表現卓越:根據Deepseek官方和其他行業人士測試的結果,Deepseek-R1模型在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版,部分測試甚至超越了OpenAI的模型。而且,Deepseek針對中文語境和特定行業需求進行了精心優化,“更適合中國寶寶體質”。
2)模型的訓練方式足夠創新突破:Deepseek-R1 通過獨立自研的方式,在對模型訓練方式、架構等進行了多項優化改進,從而大幅提升了訓練效率。而且,Deepseek團隊將他們的探索過程一一記錄在論文當中,幫助業界指明方向。
3)模型的全面開源:Deepseek-R1模型完全開源,在遵循MIT License的規則下,為全球開發者敞開了自由使用、修改和進一步開發的大門。這種開放性極大地促進了AI領域的技術交流與創新,為整個行業的發展提供了強大助力。而這樣的開源精神,曾經是OpenAI所宣導的(OpenAI的Open正是此意)。
4)模型的使用成本低:如果不想部署開源模型,Deepseek也提供了價格很低的API。這意味著普通開發者和企業可以在不承擔過高費用的前提下,輕鬆地將Deepseek的強大功能整合到自己的應用程式或業務流程中。相信隨著越來越多的落地場景探索,AI技術在應用層面會取得更大的突破。
綜上所述,從國際關係視角來看,Deepseek是我國打破美國算力晶元封鎖的有力動作,某種層面也給了其他行業極大的信心(任何年代,信心都是比黃金還要珍貴的事物);從技術視角來看,Deepseek使用了很低的算力成本,就達到了OpenAI-O1模型的水準,為後續的技術反覆運算指明瞭方向,而且它還對外開源了;從應用視角來看,Deepseek相當於讓每一位消費者都可以使用到第一梯隊的AI產品,實現“技術平權”。
或許,你不負責技術實現,也不關心國家大事,但Deepseek的問世,也意味著我們使用AI的方式也有了變化,這就跟我們密切相關了。接下來,我們來看看,對於普通人而言,Deepseek發佈后,使用AI的方式有哪些改變。
我們先來看看,在Deepseek發佈之前(或者說是OpenAI-o1發佈之前),在普羅大眾層面傳播的AI使用方式是怎樣的。以下是我在微信搜索“提示詞”的一些典型文章截圖。
這些提示詞教學,無一不是在強調提示詞的框架性。但從Deepseek-R1發佈的那一刻起,這些文章的內容就已經不再適用了。關於這一點的原因,我在我自己的AI課程里也有介紹,倒不是說這些內容是錯誤的,而是它們其實是屬於提示詞工程(Prompt Engineering)範疇的內容。各類專業框架,實質上是給AI生成過程提供嚴謹、完整的參考資訊和思考鏈路,從而追求極致的生成品質。但是,Deepseek-R1以及之前的OpenAI-O1,都是推理型模型,自帶思維鏈的能力。對於沒有經過深度鑽研提示詞工程的普羅大眾而言,盲目套用這些框架,只會干擾AI的思考結果,得不償失。就好比手動檔的汽車,需要駕駛員自己判斷何時切換檔位,為此也有各路老司機總結的一些判斷準則。但是,盲目將這些判斷套用到自動檔上,顯然是適得其反。
所謂思維鏈(CoT,Chain-of-Thought),就是讓模型在給出答案前進行逐步的思考與推理,並將這一過程顯式呈現,彷彿是人類將複雜的思考路徑拆解展示。例如在解決多步數學問題或複雜邏輯推理時,模型按照邏輯順序逐步分析,先理解問題,再尋找關鍵條件,逐步推導直至得出結論。這種方式不僅增強了模型的可解釋性,使人們能夠清晰瞭解答案的由來,同時也提升了解決複雜問題的能力。
那麼,在自帶思維鏈的Deepseek面前,我們使用AI方式,應該如何改變?比之“改變”,我認為準確的說法是“回歸”,也就是回歸到平常的自然語言上。用大白話解答就是三個字——
說——人——話——
展開來講就是,忘掉以往學習軟體那一套“指令式交互”,而是回歸到完成任務本身。也就是我們把AI看成是一名“無所不知、非常聰明、聽懂人話、剛進公司”的實習生,然後想想,如果你跟這樣一名實習生交代任務,你會怎麼交代?是不是要把任務講清楚,然後要提供足夠的參考資訊,盡可能明確各類要求,必要的時候還可以提供一些參考例子?
是的,跟AI下達指令時,不要再去糾結這樣說“正不正確”,而是關注這樣說“齊不齊全”。只要資訊給得足夠齊全,Deepseek會自己拆解問題逐步思考給出回答。
至於具體的使用Prompt的技巧,這足夠單獨成文了。限於篇幅,我們在這裡就不展開,如果大家比較感興趣,可以給在下多多點讚,我在後續安排上。這裡,我就給大家展示一個我自己使用Deepseek的例子,就是讓AI依據詞牌寫詞(補充一下,我很喜歡用給AI出寫古代詩詞,基本上能很好地看出是套了ChatGPT還是自己訓練,前者對中文的理解沒有這麼透徹)。
我的Prompt如下:
你要參考水調歌頭的詞牌,以當前人工智慧的發展為主題,寫一首歌,我希望你告訴我你主要參考了哪些作者的作品,參考了哪些內容。
是不是感覺這段Prompt平平無奇,甚至有些簡陋。是的,我是故意為之,當時也是想看看Deepseek的思維鏈表現。來,我們再來看看Deepseek的思考過程(內容較多,我就直接截圖)。
看完後我直呼好傢伙,Deepseek展示了它的完整思考過程。首先挑選它認為合適的參考作品,然後確定主題內容,押韻韻腳和用詞的選擇,最後還會檢查是否符合格律要求。這簡直就跟人類在思考創作一闕詞作的過程一模一樣。
不過,我還有後招,按我以前的經驗,AI大概率是處理不好中文的押韻問題的(我曾經為此跟ChatGPT及多款AI來回拉扯了幾輪都沒有達成)。大家注意看下,“秋”和“浮”是不押韻的,當時我心裡想,“哈哈,還不讓我抓住你的小瓣子”。於是,我就在對話里指出,“上面的作品,秋和浮,不押韻”。
然而,結果證明是我膚淺了。來,我們來看下Deepseek對此的回應。
原來是我低估了,Deepseek指出,它參考了《詞林正韻》,“流”和“浮”這兩個字在古代的讀音是押韻的,“浮”字的宋代實際讀音近「fəu」(這點我作為一名廣東人還是能理解的,實際上這兩個字在粵語里的確還是押韻的)。而且,它還補充說,“蘇轼原詞「天」「年」「寒」「間」同樣存在古今音變問題”,這多少是有點傲嬌了哈哈。不過,它最後還是按照要求進行了調整。
之後,我在多輪對話中,陸續還提了“我希望就以現代普通話為標準就行”、“最後兩句的結尾都是同一個字“舟”,可否避免?”等要求。這是我和Deepseek的最後一輪對話。
我雖已練就與AI對話的能力,但在與Deepseek對話的過程中,我依然有一種“驚喜感”,一種“你太會了”的感受。可以說,Deepseek代表著人類在AI領域的探索又前進了一步。我之前曾有總結“AI生成結果再豐富再優質,最終的判斷與選擇權在消費者。只有消費者的認知水平足夠高,才能辨別AI結果的優與劣。”這既是對AI沒有判斷立場的補充,又彷彿是人類的挽尊。
最後總結一下,我們在面對類似Deepseek這樣自帶思維鏈的推理型AI模型,在實際對話的過程中,不必關注Prompt的框架性,而是要“說人話”,也就是使用自然語言來表達清楚我們的任務。重點關注提供的資訊,對於完成任務而言是否有説明,是否足夠齊全。至於過程中的問題拆解,就儘管交給AI即可。
作者:產品經理崇生,公眾號:崇生的黑板報
本文由 @產品經理崇生 原創發佈於人人都是產品經理。未經作者許可,禁止轉載
題圖來自 unsplash,基於CC0協定