AI 時代,人機交互即將消失?——機遇篇(系列 2/3)
更新于:2025-03-26 02:43:26

隨著人工智慧技術的飛速發展,人機交互正在經歷深刻的變革。從早期的機械交互到圖形用戶介面的普及,再到如今語音交互和多模態交互的興起,每一次技術進步都極大地改變了我們與機器的互動方式。本文將回顧人機交互的發展歷程,探討在AI時代下,人機交互面臨的機遇與挑戰,以及未來可能的發展方向。

我們真的能像與人對話那樣,與機器自然交流嗎?幾年前,大多數人可能都會認為這隻存在於科幻電影或小說,那今天呢?

正如上一篇,我們發現 AI 的加速發展讓人機關係發生了明顯的轉折。那麼接下來還會如何延展?人機交互和設計會讓這場對話迎來什麼樣的新機遇?

我們將在這一次重返人機交互歷史的片場,在那些關鍵片段中發掘到其中的意義。最後,準備就緒,重新想像屬於未來交互設計的每一秒種。

01 我該怎麼和機器交流?

HMI:人與機械的試探期

圖左:珍妮紡紗機(Spinning Jenny, 1764)

圖右:早期打字機

轉動曲柄工作,停下休息——和1764年珍妮紡紗機的對話就是這麼簡單,但這已經足夠奠定早期人機交互的基調了。隨後打字機的出現讓人機對話更有表現力——也就是將抽象符號引入人機交互。這種“按鍵-符號”對應的交互方式影響至今,比如眼前的這篇文章就是這麼敲出來的。

1946年的費城,一台龐然大物佔據了賓夕法尼亞大學的一間房間。這就是 ENIAC——人類歷史上第一台電腦,它的誕生顯然非常振奮人心,雖然“對話”過程很讓人頭疼。

工程師們站在滿牆的物理開關和龐雜的跳線前,輸入一串數據需要打幾疊厚厚的卡片,再焦急地等待幾十分鐘才能知道運行情況。一個錯誤就白白浪費一頓飯的時光,全部重來,這種非常複雜的交互導致人和計算機的交流也完全不同步。雖然整體的交互設計單一,抱怨也從未停止,但不得不承認,它以機械而生硬的方式拉開了人與機械交互(Human-Machine Interaction, HMI)時代的序幕。

當然這時候人機交互理論還在混沌之中,遠遠沒有成型。這很正常,畢竟誰能想到短短幾十年後,我們只要指尖輕輕一點一滑,就能輕鬆完成當年需要無數個房間的計算機才能做到的事情?

第一台電腦,ENIAC(1946)。用於專家領域,多為計算機工程化或軍事化應用,使用打孔卡片和命令行介面。操作複雜且交互方式單一,無成型的人機交互理論

HCI 的奇點時刻:和電腦握手

人和計算機的交流要怎麼樣才能同步?20世紀60年代開啟了一個重要的里程碑。

1963年,一名麻省理工的博士生在論文答辯時製作了一段影片。影片內容中躍動的各種三維圖形,伴隨著幽默風趣的談吐,他對自己的傑作 Sketchpad 做了絲絲入扣的講解。但是在歡樂的笑聲中,大家似乎發現了這個東西的與眾不同之處——他將顯示幕前晦澀難懂的字元命令行幻化為了易於理解的圖形。

以前如果要用電腦畫一把椅子,95%的時間需要靠對數學以及三維空間的高度理解,再用代碼一行一行敲出來,不停調試。那 Sketchpad 呢?很簡單,只要用雷射筆在螢幕上畫就是了。可能這位博士生當時也沒想到,如此自然的交互方式和圖形用戶介面(GUI)的雛形,竟然衍生了後續的各種圖形介面,還有接下來一個影響至今的發明。

Sketchpad(1963),由斯凱克設計實驗室的 Ivan Sutherland 開發標誌著圖形使用者介面的萌芽

道格拉斯·恩格爾巴特在一個計算機圖形學的會議上時,一直在思考一個問題:“應該要怎麼提高交互效率?”

他和他的團隊試了各種輸入設備,包括雷射筆、操縱桿、用腳、用膝蓋、用頭操作的設備,無所不用其極。最後發現還是放在桌子上的那個木頭小方塊最好用:這個小方塊有兩個輪子,一個橫向旋轉,一個縱向旋轉。

計算機通過追蹤這兩個輪子的橫豎位置和旋轉角度,精準地同步移動螢幕上的游標。這個連著一條電線的小方塊就以半開玩笑的方式命名為了“滑鼠”,不過為什麼叫滑鼠?好像沒人記得,大家只知道它離未來似乎近了一點點。

我們不再需要通過輸入一連串的晦澀命令行完成任務,只用通過滑鼠移一下,點一點,複雜的操作被簡化為直觀的點擊,這種飛躍式的人機交互方式直接甩開過去幾條街。

“最有效的解決方案往往是最簡單的。”

—— 來源:道格拉斯·恩格爾巴特

滑鼠的原型(1965),美國斯坦福研究所的Douglas Engelbart發明

此時,時代的浪潮也快速地從以機械中心的交互設計,轉向為以計算機為中心的人機介面研究,也就是人與電腦的交互(Human-Computer Interaction, HCI)

但是圖形用戶介面的故事還沒有結束。1973年,施樂派克研究中心進一步孵化出了圖形介面的“完整性”。圖示、桌面、功能表等等概念雨後春筍般湧現,某種程度上是圖形介面歷史上最成功的隱喻之一。我們不用學習新概念,依靠已有的經驗就能立刻識別出來。這種顯而易見的對應關係,讓人與技術之間的距離更加靠近了。

當然,研究員們在這時候可能並沒有意識到,這一發明的威力直接引領了範式轉換。這些發明連實驗室都沒走出去,憑什麼發生天翻地覆的改變?別急,很快就會來了。

“變革性的創新需要時間和耐心,創新只有在技術、消費者和商業模式都準備就緒時才會發生。”

—— 來源:《情境交互設計》(2018)

施樂派克研究中心(Xerox PARC)在電腦 Alto 展示了最早的圖形用戶介面(Graphical User Interface, GUI)

個人計算的黃金時代,少不了人機交互

1979年,史蒂夫·賈伯斯在施樂派克研究中心看到了圖形用戶介面后,視野完全被打開。生動形象的圖示井然有序地排列,資料夾、功能表……這一切都彷彿充滿了生命力。賈伯斯意識到,這不僅是技術的突破,更是一場關於人與機器互動方式的革命。回到蘋果公司後,他和工程師團隊拚命規劃如何將這些魔法融入蘋果電腦中:

“那是一個具有劃時代意義的時刻。我記得在看到圖形用戶介面后的十分鐘內,就知道總有一天所有電腦都會以這種方式運行。一旦你看到它,就會發現它是如此顯而易見,不用什麼智慧就能理解,它太清晰明瞭了。”

—— 來源:史蒂夫·賈伯斯

20世紀80年代,蘋果公司橫空出世,圖形用戶介面和滑鼠整合入 Lisa 和 Macintosh,開啟了個人計算機的黃金時代。

想刪除一個檔?輕輕移動滑鼠,把文件優雅地拖到“垃圾桶”圖示處即可。複雜的鍵盤命令和專用鍵被點擊操作、下拉功能表、複製粘貼取代,這種符合人類自然認知的交互方式不需要解釋。用戶體驗成為設計的核心,複雜的操作變得簡單直觀,基於圖形使用者介面的交互設計迅速風靡全球。而此時,HCI 也恰好在學術界作為一門正式的獨立學科有了自己的一畝三分地,成為理解和優化人類與計算機互動的關鍵。

圖左:蘋果公司的 Lisa 和 Macintosh(1983, 1984)。引入圖形用戶介面和滑鼠,基於 GUI 的交互設計廣泛普及

圖右:ACM 成立了專門特別興趣小組 SIGCHI,HCI 作為一門獨立學科正式確立

交互設計的北極星在哪?

但是事情遠遠沒有那麼順利。20世紀90年代開始,相比於命令行時代,圖形介面的元素數量和種類大量增加,圖形、聲音和文本等多媒體結合的多模態交互,讓交互設計也隨之陷入了混沌之中。

每個人理解的垃圾桶、桌面、資料夾都不一樣,每個人都有心中最喜歡的交互方式,交互設計的標準在哪裡?用戶體驗誰又能說了算? 認知科學家唐納德·諾曼在90年代初加入蘋果公司時,擔任使用者體驗架構師,提出了“用戶體驗”。他也是第一個將用戶體驗 (User Experience, UX)納入職稱的人,諾曼出版的《The Design of Everyday Things》,至今仍然是用戶體驗設計的主要參考資料。

“我發明這個詞是因為我認為人機介面和可用性太狹隘了:我想涵蓋關於人們體驗的所有方面,包括工業設計、介面、物理交互和手工產品。”

—— 來源:唐納德·諾曼

Donald Norman 在接受採訪時對於用戶體驗概念的解釋

在時空的另一端,1989年,雅各·尼爾森在丹麥技術大學教授第一門用戶介面課程。顯然,面對學生練習,第一門課程並沒有成熟的評分標準,那要用什麼方式才能有效評估學生的可用性問題呢?尼爾森和另一位教授絞盡腦汁總結各自的經驗,提出一種由10種啟發式方法組成的評分標準,順利對付了這門課程,還順手整理成論文發表了。

意外的是引用的人非常多。他們意識到大家對於標準的需求很強烈,但很明顯現在這種方法並沒有那麼科學。

5年後,尼爾森發現這個評估方式的受歡迎程度仍然高居第二,僅次於用戶測試。如果繼續這麼發展下去可能會害了真正的用戶體驗,於是他基於11個專業UX設計師在價值數百萬美元的重大專案中產生的設計缺陷,分析了包含249個可用性問題的資料庫,再翻遍各種 HCI 文獻后,精心提煉出了我們所熟知的“十大通用可用性原則”

Jakob Nielsen 分析了兩百多個可用性問題后,1993年提煉出十項通用性原則,進一步完善了 HCI 理論體系

從基礎的認知心理學,到具體的交互設計模式;從使用者研究方法論,到可用性測試的標準流程。逐漸完善的 HCI 理論體系正在讓我們用更科學的方式,來思考”為什麼用戶覺得麻煩”等等每天都在面臨的交互問題,人與機器之間的交互也正在以科學的方式打磨得更加順滑。

當然,解決方式或評估標準常常是基於當下的技術或設計範式來制定的,但是計劃遠遠趕不上變化。這些理論是否能持續適應時代的進步和動蕩,又應該怎麼做才能及時調整和改善?比如即將面臨的大考驗:互聯網時代。

02 人與電腦的自然連接

互聯網時代:一場信息聯結的狂歡

當1989年互聯網誕生后,七大洲八大洋之間的距離瞬間被拉近,這種全球化的感受使我們前所未有地開始同時生活在物理和虛擬空間中。資訊一窩蜂地從一條條網線中亂竄出來,我們獲取和傳播資訊的方式被重新改寫了。

簡單來說,一切事情都在互聯網中重新出生了一次。

1995年,斯坦福大學的一位研究生拉裡·佩奇陷入了一個問題:如何衡量一個網頁的價值?傳統的搜尋引擎只能依靠關鍵詞頻率來判斷信息的相關性。但佩奇意識到,連結,才是獲取關聯知識的關鍵。

互聯網是一個巨大的有機生命體,每個網頁都是細胞,而連結就是細胞間傳遞信息的神經網路。佩奇的 PageRank 演算法就是這個複雜生態中的指南針——被更多高品質網頁連結的頁面,權重和可信度就越高,如此高效的方法也由此演化為了谷歌搜索的雛形。

一個白色背景的瀏覽器視窗,一個搜索框,輸入想要的內容,輕輕點擊滑鼠,全球知識瞬間鋪開在你的眼前。我們不妨想像一下,在互聯網之前,查找一個資訊可能需要耗費數小時在圖書館翻閱書籍。這一時刻,人類獲取知識的半徑在瞬間被無限放大,而這種人機交互的革命,本質上重構了人類思考、學習和信息獲取的方式。

谷歌搜索的第一個網站(1997)

Facebook、Twitter、Youtube……利用了互聯網優勢重新連接世界的例子還有很多很多。人們在電腦前不厭其煩地點擊內容,敲打鍵盤分享自己今天的奇聞趣事,簡單直觀的交互方式讓分享和創作越來越方便,不同地區的文化在網線間來回穿梭時,煩惱和不便也由此產生:“為什麼沒有一個能移動的電腦,能讓我隨時隨地上網分享?”

是的,你也許猜到了,手機。

電腦濃縮成了一個小長方盒子,精緻小巧的螢幕和九宮格鍵盤比以前方便太多了。我可以隨時隨地登錄社交軟體分享剛才遇到的奇葩事,通過網路搜索眼前的疑惑,還能簡單打打遊戲。當然,這些功能機一次只能運行一個簡單任務,迷你的物理鍵盤也經常讓大拇指互相打架,有限的屏幕和處理速度讓每個手機應用都被強制”減肥”到只有最基礎的功能。但是因為它相比之下足夠方便,也習慣了。

圖左:諾基亞N95(2006),採用九宮格的鍵盤佈局

圖右:黑莓8700(2006),採用完整的 QWERTY 鍵盤佈局

雖然後面手機屏幕越來越大,也推出了全鍵盤的手機,但上面的問題仍然難以避免。習慣不代表永遠滿足,我們都清楚,慾望和追求是永遠不會停止的,我們不僅希望得到想要的東西,還希望想要的東西越來越多,越來越好。更大的螢幕,更沉浸的體驗,更方便的手機尺寸,能有電腦端大部分功能的手機應用……這些慾望,如何才能轉化為觸動心靈的最佳實踐?

真正的主角:以使用者為中心的交互設計

2007年,在舊金山的舞臺上,賈伯斯從牛仔褲口袋裡掏出了一塊看似普通的黑色玻璃,一個改變世界的瞬間來臨。

密密麻麻的按鍵消失了,但又無處不在?iPhone 將大量的按鍵進化成了一塊光滑的玻璃觸控屏。鍵盤需要的時候出現,不需要的時候消失,讓你專注沉浸地流覽。

“我們生來就擁有終極的指點設備——我們的手指,iPhone 利用它們創造了自滑鼠問世以來最具革命性的用戶介面。”

—— 來源:史蒂夫·賈伯斯(2007)

谷歌地圖在 iPhone 上通過捏合手勢縮放世界的比例,輕快流暢的感覺比在電腦使用時更直觀順手。點擊打開應用,滑動切換、拖拽移動檔……神奇的手勢交互取代了呆板的物理按鈕,物理空間的動畫反饋產生了真實的“重量感”,複雜的指令幻化成指尖的舞動,自然到彷彿與生俱來的動作,讓人不禁感歎:“交互就應該是這樣!”。

第一代 iPhone 發佈會(2007) 蘋果公司在將多點觸控技術帶到了第一代 iPhone

觸摸時代重塑了人機交互方式,直到現在仍然令人驚歎。實際上,iPhone 並沒有發明觸摸這個動作,它只是讓這個行為找到了最恰當的應用場景,技術也本應該是人類行為的自然延伸。眼鏡也並不是為了炫耀工藝,而是為了將世界的每一絲細節還給視力模糊的人。它所反映的的設計哲學,恰好是以使用者為中心的交互設計迅速發展的時期。

這遠不僅是技術的堆疊,而是一次對人類行為和需求的深刻理解和回應。

“我們必須根據人類的行為設計,而不是我們自以為的人類行為。”

—— 來源:唐納德·諾曼

移動互聯網爆發:HCI 的躍進潮

移動互聯網時代的爆發將“用戶體驗”推上神壇,基於現實的隱喻巧妙地融合到介面交互中,人們驚訝地發現原來手指可以如此萬能。但是理論和意識很多時候會先於實踐,在發展初期,移動端應用的交互方式基本是電腦端的精簡移植,大家知道要考慮這些與生俱來的特性,但還不知道怎麼做,除了一位設計師。

阿薩·拉斯金在用谷歌搜索內容時,對谷歌的分頁設計感到各種麻煩。僅僅為了找到一條資訊而不停地點擊下一頁,再流覽大量頁面,交互效率太低了。要怎麼樣才能讓用戶獲取資訊更加流暢?

在各種嘗試中,拉斯金想到了一個方法:越往下滾動載入越多內容會怎麼樣?這個看似簡單的“無限下滑”交互就像一份標準答案,各大社交應用爭相採用,微博、抖音、小紅書……這種交互方式靈活運用了觸摸的特性,只要輕輕往下滾動,內容就像瀑布流一樣無止盡地出現,意外地重塑了人們獲取資訊的心理預期。

“好的設計是讓使用者無需思考如何使用產品。”

—— 來源:唐納德·諾曼

當然,這隻是冰山一角,下拉刷新、掃一掃等等交互方式都在移動互聯網時代嶄露頭角,HCI 在為了滿足各種各樣使用者的需求和願望,隨之迅速成長。人們在互聯網這片虛擬田野中進行著一個個社會學實驗,介面的易用性、資訊的可視化及互動的即時反饋變得從未如此被需要。

但是僅僅是視覺和觸覺,又怎麼能滿足人們無窮盡的場景和需求呢?2010 年,蘋果應用商店上架了一款神奇的應用——Siri。 它有一個與眾不同的點,能通過自然語言處理和機器學習演算法,像個人助手一樣通過對話的交互方式理解其中的上下文,完成安排約會、發送簡訊等基礎任務。

短短兩個月後,蘋果公司就捕捉到了它的潛力,Siri 公司被隨之收購。2011年 iPhone 4S 的發佈會上,Siri 出現了。但這次不再是作為推薦應用榜單中的一員,而是直接集成到系統中,極大程度進化了我們與設備交互的方式

儘管當時推出時面臨著識別率低下,對語義的理解和真人大相徑庭等各種挑戰,但是這種直觀、多模態的交互方式融入到生活之中,標誌著 HCI 發展的一個重要里程碑。

Siri:蘋果的智慧語音助手,將對話的交互方式融入日常生活,標誌著 HCI 發展的一個重要里程碑

以簡馭繁:交互設計之道

每段歷史都有自己的高光時刻,但沒有一段是獨立存在的。從最早的物理開關、到如今的觸摸和語音交互……人機交互的歷史追求,本質就是在不斷讓機器更易於使用、更高效、更人性化,也就是說:

人與機器的交互門檻不斷降低,交互場景不斷泛化,交互層級不斷升級。

HCI 帶來的益處不言而喻。但隨著應用快速增長、功能指數型增加、資訊龐雜,而且在可見的未來,這個趨勢只增不減。面對這樣的挑戰,還能像從前一樣遊刃有餘嗎?

人機交互變革的樂章悄然響起

手機系統和應用帶來了很多很方便快捷的功能,滿足各種使用者的需求。你能同時在一個螢幕展示兩個視窗,也能長按圖片隨意拖拽到別的應用中。但是當功能堆疊越來越多,大量增加的資訊和功能讓設計越來越複雜和臃腫,每次想找個具體的快捷功能時,都得在這個”儲物間”裡不停翻找,試半天還不一定成功,人們明顯比以前感受到更多的困惑和迷失。

圖形用戶介面為主交互方式對我們來說更直觀易用,但如果我們要從20個又臭又長的文件中複製粘貼想要的段落,你需要打開第一個檔,滾動查找,選中文字,複製,打開目標文件,粘貼,打開第二個檔,然後繼續重複剛才的行為19次。即便讓 AI 來完成這個任務,它也是即時讀取螢幕的同時重複剛才的操作,圖形介面的存在反而限制了操作效率

但是不用圖形用戶介面就能解決嗎?也會有問題。現在的智慧語音助手支持語音、觸摸、鍵盤等等多種輸入方式,聽著很美好。但當我們在各種公共的喧囂環境時,語音辨識的準確度有限,也不會自動根據情境切換到更適合的交互方式,往往難以自動根據使用者情境的變化而改變

高複雜度、有限的適應性、過度依賴圖形介面……生成式 AI 與人形機器人等技術的井噴式發展,讓人與機器的關係發生了翻天覆地的變化。

HCI 圍繞的是與計算機(Computer)之間的交互,面對這些日益智慧的機器顯得越來越無力,對多感官的輸入和更複雜的場景也變得捉襟見肘,HCI 面臨著空前的挑戰。

當然,挑戰也代表著機遇的開始。無論時代怎麼變化,一些核心的使命也不曾改變。

“我們處理這些問題的集體能力並沒有像複雜性增加那樣迅速提高。我能想到的最好的事情,就是努力説明提高人類處理複雜問題的能力。”

—— 來源:《關鍵設計報告》

在後 HCI 時代應該怎麼做?我們是時候該重新調整步伐,進行“人機共舞”的下一個樂章了。

預告

當機器擁有了智慧,它成為了什麼,又有什麼特性?未來我們還是和純電腦交互嗎?如果不是,那意味著什麼……

下一篇迎來了本系列的最後一段樂章。我們將從多個維度剖析交互的發展趨勢,將這些星點連接起來。面對深度整合了智慧的“智慧體(Agent)”,我們將如何與之交互,在這其中的思考又是什麼,這些挑戰和機遇,能更加完整地幫助我們描繪出未來交互設計可能的“新生”。

書目

Moggridge, Bill. “Designing interactions.” (2007).

Mourtzis, Dimitris, John Angelopoulos, and Nikos Panopoulos. “The future of the human–machine interface (HMI) in society 5.0.” Future Internet 15.5 (2023): 162.

圖源:來自 Unsplash 與網路公開資料,若涉及版權請聯繫修改

本文由 @HAI Design 原創發佈於人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基於CC0協定

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供資訊存儲空間服務