IT之家 4 月 1 日消息,亞馬遜於當地時間週一正式發佈了其通用人工智慧智能體(AI agent) ——Nova Act。該智慧體具備操控網路瀏覽器並自主執行簡單網路任務的能力。與此同時,亞馬遜還推出了配套的 Nova Act 軟體開發工具包(SDK),旨在幫助開發者利用 Nova Act 構建智慧體應用原型。
據IT之家瞭解,Nova Act 由亞馬遜新近在三藩市成立的 AGI(通用人工智慧)實驗室研發,該技術未來也將為備受期待的生成式 AI 增強版語音助手 Alexa + 提供關鍵功能支援。不過,亞馬遜方面表示,今日起開放的版本為“研究預覽版”,功能尚待完善。
開發者可以通過新設立的專屬網站 nova.amazon.com 獲取 Nova Act 工具包,該網站同時也是亞馬遜展示其旗下各類 Nova 基礎模型的平臺。
Nova Act 的推出標誌著亞馬遜正式加入 AI 智慧體技術的競爭行列,意在憑藉自研的通用 AI 智慧體技術,與 OpenAI 的 Operator 和 Anthropic 的 Computer Use 等產品展開競爭。當前,多家領先科技公司普遍認為,能夠代替使用者瀏覽網頁、執行任務的 AI 智慧體將極大提升現有 AI 聊天機器人的實用性。儘管亞馬遜並非首家開發此類技術的公司,但憑藉其龐大的 Alexa 用戶基礎,Nova Act 未來可能擁有最廣泛的應用潛力。
亞馬遜介紹稱,開發者使用 Nova Act SDK,將能夠為使用者自動化處理一些基礎性網路操作,例如從餐飲品牌 Sweetgreen 訂購沙拉或是在線上預訂餐廳晚餐。該工具包提供了一系列工具,使 AI 智慧體能夠瀏覽網頁、填寫表單、在日曆上選擇日期等。
在性能方面,亞馬遜聲稱,在公司內部的多項測試中,Nova Act 的表現優於來自 OpenAI 和 Anthropic 的同類智慧體。以衡量 AI 智慧體與螢幕文本交互能力的 ScreenSpot Web Text 測試為例,Nova Act 得分高達 94%,超過了 OpenAI 的 CUA(88%)和 Anthropic 的 Claude 3.7 Sonnet(90%)。然而值得注意的是,亞馬遜並未公佈 Nova Act 在如 WebVoyager 等行業更常用的智慧體評估基準上的測試結果。
Nova Act 是亞馬遜上述 AGI 實驗室對外發佈的首個公開產品。該實驗室由前 OpenAI 研究員 David Luan 和 Pieter Abbeel 共同領導。這兩位專家在去年被亞馬遜聘用以主導其 AI 智慧體研發工作之前,分別創立了 AI 初創公司 Adept 和 Covariant。
對於一個以 AGI 為目標的實驗室為何會開發訂購沙拉的 AI 智慧體,Luan 在接受 TechCrunch 採訪時解釋道,他將智慧體視為構建超智慧 AI 系統的關鍵一步。他將 AGI 定義為“一個能夠説明你在電腦上完成人類所能做的任何事情的 AI 系統”。Luan 還表示,其團隊設計的 Nova Act SDK 旨在可靠地自動化執行簡短、簡單的任務,並為開發者提供了精確定義何時需要人類介入智慧體工作流程的工具。他希望藉此幫助開發者創建更可靠的智慧體應用,即使這些應用不一定是完全自主運行的。
目前,來自 OpenAI、谷歌和 Anthropic 等公司的早期 AI 智慧體普遍面臨跨不同領域應用時可靠性不足的重大挑戰。根據 TechCrunch 等媒體的測試,這些系統往往運行緩慢,難以長時間獨立工作,且容易犯下人類通常不會犯的錯誤。亞馬遜是否已經找到了克服這些難題的有效方法,還是其 Nova Act 智慧體也將受困於同樣的缺陷,市場將拭目以待。