來源:數位開物
作者:人工智慧學家
3月26日,微軟CEO Satya Nadella在韓國的微軟AI巡迴活動中發表演講。他指出,Scaling Law 的力量體現在三個根本性的突破上,分別是用戶體驗(更自然的多模態交互)、推理與規劃能力(可以將其與長期記憶和上下文相結合),這將引領我們進入一個極其豐富的 AI Agent 世界。
演講中,Satya Nadella介紹了微軟的多項Agent新產品及服務。微軟推出2款推理AI Agent,Researcher 能深度分析內外部數據以生成研究報告,Analyst 能像數據科學家一樣從複雜數據中快速提取洞察與可視化結果。
Copilot Studio通過集成推理模型,支援用戶構建具備複雜推理能力的定製化AI Agent。
即將推出的Swe Agent(軟體工程Agent)通過自動化軟體工程任務(如處理代碼審查)來提升開發者生產力。此外,還將 AI Agent 應用到了整個安全領域,並開放生態系統以整合第三方Agent。
同時,微軟大力推廣Copilot PC平臺,Copilot PC作為新的計算平臺,具備強大的本地NPU算力,支援混合AI應用,開創新的交互體驗。
以下是本次演講實錄,經數位開物團隊編譯整理
非常榮幸能再次來到韓國首爾,並參加此次 AI 巡迴活動。每當經歷這種十年一遇的平臺轉型時,來到韓國總是令人興奮。我親身見證了從用戶端-伺服器、Web、移動和雲計算,到如今 AI 的演進歷程。
我認為,尤其在這樣的場合,理解我們共同乘勢而上的這股力量及其威力是至關重要的。談及AI,多數人會提到Scaling Law。令人難以置信的是,這些Scaling Law在經驗層面持續得到驗證。
如同摩爾定律,它們似乎是能長期有效的經驗性觀察結果。Scaling Law仍在延續,隨著深度學習革命,特別是Transformer的出現,將摩爾定律的18個月週期縮短為每六個月翻一番。在此基礎上,我們現在又有了“測試時計算Scaling Law”(test-time compute scaling law),這是技術革命中典型的S型曲線疊加現象。這種測試時計算建立在預訓練Scaling Law之上,使得能力每三個月就翻一番。
正是測試時計算與預訓練Scaling Law的結合,在某種意義上真正創造了這樣的局面:在需求具有彈性的地方,更多的供應隨之而來。這就是人們所說的“傑文斯悖論” (Jevons paradox) ——效率提升反而可能導致總體消耗增加。接下來,我認為關鍵在於優化“性能/美元/瓦特”(performance per dollar per watt),這才是衡量任何國家、公司產出或附加值的真正標準。看到這一切的發生令人振奮。
可以說這些Scaling Law的力量體現在三個根本性突破上:首先是用戶體驗層的突破,我們生活中與計算交互的方式將變得更加自然、多模態(無論是通過語音、文本還是視頻進行輸入輸出)並且根本上是圍繞語言進行的。因此,這將徹底改變所有的計算介面。
然後,體驗會變得更加豐富,因為你現在擁有了推理和規劃的能力,並且可以將其與長期記憶和上下文相結合。
正是這三點,使我們能夠構建日益豐富的 AI 系統或智能系統,我相信我們將在各處看到它們的身影。所以,對我們而言,這將引領我們進入一個極其豐富的 AI Agent 世界。你將擁有能在個人、組織或團隊乃至端到端業務流程的上下文中發揮作用的 AI Agent。這正是得益於 AI 的強大力量而誕生的 AI Agent 網路。
對微軟而言,我們始終回歸到“賦能地球上的每一個人和每一個組織,幫助他們取得更大成就”這一簡單而意義深遠的使命。我們希望駕馭AI的力量,最終賦能每一個人和每一個組織,讓他們能夠利用AI在各自的國家、社區、行業和公司里做有意義的事情。
這一切始於普通消費者。無論是娛樂、購物、商業、新聞資訊還是搜索研究,所有這些場景都將因AI而改變。我們期待自身及整個生態系統在消費領域的創新。同樣,對於組織而言,AI正在改變根本性的員工體驗、客戶服務、業務流程乃至核心創新。無論身處哪個行業,都能利用AI加速創新進程。
為實現這些轉型目標,我們正在構建三個平臺。微軟的核心是一家平臺與合作夥伴公司,我們總是思考如何構建技術,讓其他人能基於這些平台創造更多技術。
首先是Copilot平台,可以將其想像成AI層的用戶介面(UI)層。我們希望將AI融入並成為日常體驗的一部分,就像今天的操作系統、瀏覽器和應用程式。目標是將AI帶入這些現有介面,並最終讓操作系統、瀏覽器、應用程式在某種意義上“隱身”。這種面向AI的UI層將帶來變革。多模態體驗正被引入Copilot,徹底改變我們與計算的交互方式。
例如,我已將Copilot設置到iPhone的操作按鈕上,通勤聽播客時會通過Copilot與轉錄文本對話。在PC上,語音瀏覽器常開,Copilot Vision甚至能看到螢幕內容,輔助完成工作,這已超越了經典的瀏覽器體驗,更像是一種Copilot體驗。
在工作中,我們將Copilot引入常用應用程式。一個例子是醫生使用Copilot為腫瘤委員會會議做準備:查閱報告、制定議程、在Teams會議中專注討論(AI負責記錄高保真筆記),會後利用筆記在Word中整理,並創建PowerPoint教學演示文稿。這個簡單的工作流利用了Teams、Word等工具,並通過Copilot處理關鍵事務。
更進一步,我們發現出現了新的工作產物和工作流程。例如,我使用Copilot頁面收集資訊。在進行聊天會話時收集資訊,整理到頁面中,多個聊天會話和頁面間存在多對多關係。這些頁面預設是協作式的,我與AI一起“思考”,同時與同事實時協作。這種讓你能夠以全新方式與AI及同事協作的頁面概念,我認為是一種我們所有人都在逐漸適應的新型工作流程。
Copilot的潛力不止於此,Copilot Studio允許用戶輕鬆構建AI Agent。未來,人們將與自己的Copilot以及成千上萬個AI Agent協同工作。構建AI Agent應該像創建文檔或電子表格一樣簡單。在Copilot Studio中,通過提示和指令,賦予其知識(如SharePoint網站、Dynamics CRM資料庫),就能構建一個可從Copilot調用的特定領域AI Agent(如現場服務Agent)。
當然,這一切的基礎是數據資產。公司內部的通信與協作資料庫(如Microsoft 365底層數據)蘊含著巨大價值,直到現在都未被充分利用。而現在,你可以連同所有其他企業數據(ERP、CRM、分析數據倉庫等)以及網路數據一起挖掘這些數據的價值。
通過Dataverse、Power BI、Fabric等工具,將世界知識與迄今分散在多個資訊孤島中的所有組織知識彙聚到一起,為你的LLM或智慧層以及Copilot層提供支撐基礎,從而讓你能夠從過去多年投資的所有事物中獲得更大的價值。這就是數據平台的意義所在。
Copilot系統已產生巨大影響,帶來了生產力和經濟增長。在微軟內部,客戶支援速度提升12倍,營銷轉化率提高超20%,銷售人員業績實現兩位數增長,IT人力資源自助服務請求分流率提高35%。在韓國,各行各業的客戶(遊戲、零售、製造等)也正利用這項技術驅動切實的投資回報(ROI)和顯著的生產力增長。例如,GS Retail 使用 Microsoft 365 Copilot 驅動一線員工體驗,並構建了銷售AI Agent。
今天,我們激動地宣佈推出一系列“推理AI Agent”或稱“思考AI Agent”,這將開啟Copilot內部新一輪創新浪潮。
首先是Researcher。它運用推理模型,不僅處理網路資訊,更能處理整個豐富的企業數據(如Microsoft Graph、ERP、供應鏈、CRM等)。想像一下,創建一份高保真的項目報告、市場研究報告或毛利率改進計劃時,Researcher能整合所有來源的資訊,執行“思維鏈”推理,構建一份完整的研究報告。
其次是Analyst。我們對其進行了優化,使其能像熟練的數據科學家一樣思考。它可以處理任意複雜的數據集(例如,包含數千行和多標籤頁的原始客戶收入數據),理解數據內容,執行Python代碼來解答問題,並在幾分鐘內從原始數據中獲得洞察,生成視覺化圖表。用戶可以隨時查看其“思維鏈”和運行的Python代碼,驗證其思考和處理方式。
此外,我們將這些推理整合到Copilot Studio中,用戶可以構建自己的推理軌跡,進行“思維鏈”和強化學習訓練,定製滿足特定業務需求的AI Agent。
(此處演示環節展示了Researcher如何根據提示進行澄清、制定計劃、跨工作數據和網路進行推理,生成詳細報告;以及Analyst如何處理複雜數據集,通過Python代碼進行分析並生成可視化結果。)
這些新Agent的意義非凡。最初我們為員工配備辦公軟體,促進了知識工作的普及。然後我們提供了Copilot,讓人們能提問並獲得答案。現在,請想像一下,如果我們每個人在工作時,都有一位研究員、一位分析師、一位數據科學家隨時待命,幫助我們完成知識工作,那我們能做到什麼程度。我認為這將徹底改變我們任何人在工作中所能達到的廣度和深度,而且我認為這將產生極其深遠的影響。
Copilot是AI的使用者介面層,而支撐它的是Copilot和AI技術堆疊,這是我們在Azure中逐層構建的體系。Azure被視為世界的電腦,在韓國,我們設有兩個區域(韓國中部和南部),並不斷擴展規模,引入最尖端的技術和基礎設施。
構建AI基礎設施需從系統角度出發,實現規模、性能和成本的最佳化。這包括合作夥伴(Nvidia、AMD)和自研(Maya)的晶片創新,它們是龐大計算集群的重要組成部分。
AI工作負載也需要傳統計算和存儲資源,特別是推理任務,需要存儲和計算資源緊密配合。我們正在將從數據中心到晶元,再到網路、存儲系統,以及其上運行的所有軟體,都視為一個整體的系統問題來考量,並以一體化的系統設計思路來著手解決。
基礎設施之上是數據資產層。將數據彙聚到靠近智慧層的地方至關重要。我們確保使用者可以引入所有類型的數據:雲原生操作型資料庫(如支撐ChatGPT的Cosmos DB)、事務型資料庫(PostgreSQL及其他SQL資產)、分析能力平臺(Fabric)。同時支援引入Databricks、Snowflake甚至Oracle的數據。這樣就能在智慧層旁邊構建完整的數據版圖,支援各種應用開發。
在此之上,我們在Foundry中構建頂級的AI應用平臺。它解決了應用開發者重複構建評估(evals)或可觀察性(observability)系統的痛點,並能輕鬆訪問超過1800種模型(小型、前沿、開源、閉源)。Foundry的角色,本質上就像是Web伺服器或IIS對於Web應用構建的意義一樣,Foundry就是AI應用構建的基石。
擁有基礎設施、數據和應用伺服器後,還需要世界級的工具。微軟近50年前以工具公司起家,至今仍在VS Code、GitHub及GitHub Copilot上不斷創新。在韓國,GitHub發展勢頭強勁,用戶數增長近20%,達到225萬,並持續高速增長。我們將繼續創新,例如即將推出的Swe agent(軟體工程Agent)。
如同Researcher和Analyst改變知識工作模式,我認為Swe agent將是開發者生產力領域的下一個重大變革點。開發者可以直接將一個PR(Pull Request)分配給Copilot(Swe agent),它會展示其計劃和規格說明,執行跨多個文件的代碼庫更新,並將修改後的PR發回審批。擁有Swe agent的理念將帶來顛覆性的變革。
目前,在南韓有大量客戶和合作夥伴正基於這個技術堆疊進行創新。我與多位企業家和公司代表交流,他們正在開展出色的工作:
· Galaxy公司:利用Sora等多模態能力為K-pop藝人創作視頻,並探索利用AI重現甚至超越個體生命長度的記憶。
· Q CELLS公司:重新定義能源管理,涵蓋能源交易、電網管理及整個能源供應鏈和價值鏈。
· LG公司:研發的機器人不僅具備與人共情的情商(EQ),還能控制家電,擔當智慧家居中樞。
· C-GENE公司:構建平臺,讓全球科學家能創造更好的診斷方法。他們結合圖譜檢索增強生成(Graph RAG)技術和高性能計算(HPC),將LLM與基因資訊、相關文獻關聯,尋找診斷方法。
· Amorepacific公司:開發聊天機器人,重新定義美容顧問的角色和體驗。
Amorepacific的案例完美體現了構建AI解決方案的平臺化方法的精髓。他們使用OneLake來彙集所有數據,將合適的數據載入並準備好在Fabric中使用,然後在Foundry之上利用這些數據,最終構建出他們的AI應用程式。這種使用統一技術棧支援多個AI應用的方法,是未來公司可以採取的高效模式。很高興看到一個組織能夠通過平臺化方法實現其價值。
除了雲端的豐富創新,同等水平的創新也將在邊緣發生。Copilot PC現在擁有算力超過40 TOPS的NPU。看到如此強大的計算能力真是太棒了。這意味著隨著推理模型效率的提升,我們將能夠在邊緣設備上直接運行功能非常強大的模型,實現真正的混合AI能力。
新一代AI應用程式正在誕生,它們是真正的混合型應用,同時利用雲端和用戶端(本地)的能力,融合成統一的體驗。例如照片編輯或未來的“記憶”應用,都可以利用Copilot PC這樣的新平台來構建功能極其豐富的應用程式。新的交互方式,如Recall(回顧)、click to do(點擊執行)、generative fill(生成式填充)、super resolution(超解析度),正成為與應用程式和計算機互動的新途徑。
這是本地處理能力、AI以及雲端能力結合起來所能釋放的力量。而且我認為,對於應用程式開發者來說,能夠同時利用雲平臺和用戶端平臺這兩個平臺進行創新,這簡直是妙不可言。
所有這三個平臺(Copilot、AI Stack、Copilot PC)都必須建立在信任的基礎之上。計算能力要在我們生活中扮演更重要角色,我們必須從根本上信任它們。這意味著需要對可信賴AI採取有原則的方法,包括我們的安全未來倡議、隱私原則和AI安全原則。
我們不僅提出原則,更將其轉化為實實在在的創新。在AI安全方面,我們發佈了如“基準性API”(groundedness API)等功能,用於評估模型和應用的可靠性,將幻覺問題視為一個可解決的工程挑戰。在隱私和安全方面,我們持續創新機密計算技術。
我們已將AI Agent應用到安全領域,推出安全Agent協助處理網路釣魚攻擊、提供威脅情報、確保條件訪問執行和發出數據保護警報。這不僅僅是微軟的Agent,我們開放了我們的安全Copilot生態系統,以整合由眾多第三方開發的各種Agent。這再次印證了我們的平臺化方法。安全是一項團隊運動,並非任何一家公司能獨自完成,而是需要我們所有人共同努力,彙聚所有的創新力量。因此,我們非常激動能引入AI Agent來幫助應對我們在網路和網路安全方面面臨的日益嚴峻的風險。
除了AI,我們也在開拓新領域,持續推動系統架構發展。量子計算正在興起並取得切實進展。幾個月前,我們公佈了在Majorana 1方面的基礎物理學突破,這是20年研究的成果,確認了Majorana zero modes 的物理存在,我們相信這是構建實用規模量子計算所必需的物理學突破。Azure Quantum不僅包括我們自研的量子計算,也涵蓋其他公司的量子計算,同時提供Q#程式設計語言和糾錯技術,構成完整的系統架構。
如果說AI是自然的模擬器,能在計算化學、生物學等領域縮小搜索空間,那麼量子電腦就是自然的模擬器。因此,當你將這兩者結合起來……今天我們擁有HPC+AI。明天我們將擁有Quantum+AI。我認為這兩者的結合能夠改變科學發現的進程,並以前所未有的速度加速它。所以我們對此感到非常興奮。
歸根結底,我們是一家科技公司,但根本動力源於我們的使命:賦能全球每一個人、每一個組織。這項使命始於每一個國家、每一個社區。每年回到韓國,親眼見證韓國企業家、企業、公共部門的創新成果,看到健康、教育的改善和本地創造的價值,至關重要。沒有你們的參與和創造,所有技術本身將毫無意義。
在此背景下,我們為能與KT合作感到自豪。我們將共同確保帶來更高水準的能力,這些能力將在本地基於我們的平台構建,旨在賦能韓國經濟的其他領域。我們也非常高興能圍繞這些平臺,建立起人們對這項技術的更高層次的信任。與KT的合作是一份莫大的榮幸,我們期待這一夥伴關係在未來蓬勃發展。
同時,我們深知,共同面臨的最重要任務之一是確保AI相關技能得到廣泛普及。這關乎韓國的人力資本和AI能力,兩者的結合,我相信,將共同創造一個能夠長遠繁榮的經濟。
在這方面,我們再次與KT合作,共同推出一項覆蓋全國的AI技能培養計劃,讓所有在校大學生都有機會獲得AI領域的微學位。我們非常非常激動能真正確保在全國範圍內普及這些技能,使大家能夠充分利用所有這些創新成果,並為韓國乃至全世界創造更多的創新。