IT之家 3 月 10 日消息,Rokid Glasses AR 眼鏡於去年 11 月發佈,搭載阿裡通義 AI,售價 2499 元。
Rokid 今日宣佈,在如今 AI 大模型井噴的當下,只搭載一個 AI 大模型顯然是不能滿足用戶對於 AI 的需求,所以 Rokid Glasses 再次進化。
截至目前,除通義千問外,Rokid Glasses 也集成了 DeepSeek、豆包、智譜清言、納米搜索等多個大模型。Rokid Glasses 將這些大模型分類管理,分為基礎模型、視覺模型、搜索模型等。
基礎大模型負責整體 AI 能力,如對話,問答和調用產品功能等;視覺大模型負責處理視覺資訊,如識別物體等;資訊大模型負責搜索當下最新資訊對所回答的問題進行資訊整合與歸納。IT之家附分類圖如下:
每種模型都有自己的專長。Rokid Glasses 會根據不同的場景將使用者請求智慧分發給不同的模型處理。比如通義的風格是嚴謹客觀,表現為專業的助理秘書的形象,豆包的風格更輕鬆俏皮,像一個好朋友,用戶可以在 App 端選擇自己偏好的大模型。
此外,Rokid Glasses 支援使用者自定義配置自己的私有模型,可以通過 OpenAI 標準的 API 調用自己的私有大模型,滿足更多科研和專業領域的需求。
多個大模型協同工作意味著 Rokid Glasses 的 AI 擴展性高,可根據用戶場景和需求靈活配置不同大模型,同時也意味著對其系統的資訊分發邏輯和意圖分發演算法要求更為嚴格。
在實際使用中,眼鏡接收到的信息種類是多樣且複雜的,如何保證快速準確地解讀資訊並給出反饋是研發團隊首先要攻克的問題。一般 AI 智慧眼鏡會把所有獲取到的資訊全部丟給雲端大模型,讓大模型自己判斷,這種模式下大模型往往需要更多時間識別並做出回應,導致用戶體驗不佳,回應時間很長。
而 Rokid 在端側集成自研的意圖分類模型,可以在 2 毫秒內完成對意圖的分類,再將請求分發給不同的模型。