有了AI這把新“鋤頭”,科研能否“再開荒”
更新于:2025-04-11 03:30:45

本文轉自:中國科學報

■本報見習記者 趙宇彤 記者 趙廣立

AI for Science(AI4S,人工智慧用於科學研究),是一個“AI與科學家孰強”的命題嗎?

“我們不要問AI能做什麼,而是要問AI能做什麼現行方法不能做的事情。”近日,在中國科學院計算技術研究所(以下簡稱計算所)主辦的“2025年計算所AI4S研討會”上,中國科學院院士陳潤生指出,科學家需要怎樣的AI、AI如何解決新問題,應當是關注的重點。

在圓桌討論環節,陳潤生和計算所研究員陳熙霖、中國科學技術大學教授羅毅、中國科學院上海藥物研究所研究員朱維良、中國科學院分子細胞科學卓越創新中心研究員陳洛南、微軟研究院科學智慧中心全球合夥人秦濤,圍繞“AI賦能科學”展開了討論。

科研迎來“再開荒”?

“AI擅長消化數據,計算能力強、反應速度快,只要有足夠的算力就能處理大量數據。”秦濤表示,從計算層面看,AI4S確實引發了科研範式的變革。

多年來,在“維數災難”的困境中,對於如何處理多尺度問題(多變數函數),科學家總是有心無力。這極大阻礙了科研發現的步伐。20世紀50年代終於迎來一道曙光——AI的誕生把一些科學問題轉化為演算法問題,不僅能高精度解決大量傳統科學計算無法解決的難題,還能高效處理海量數據。

從蒸汽機的轟鳴到AI的曙光初現,生產工具的變革直接提高了生產力水準。“AI能夠加速計算,當計算能力足夠強、速度足夠快時,也許能將科學領域中‘不可能的事情’變為可能。”秦濤說。

然而,AI能否實現科研的“再開荒”,科學家並不樂觀。

“AI製藥不是一個新概念。自電腦誕生以來,科學家就開始了藥物分子設計的嘗試。”在朱維良看來,AI確實在某些方面極大提高了新藥研發效率,但目前尚未出現藥物設計的範式突破。“要使用AI,還需進行數據的積累和清洗。”他說,對生物製藥而言,AI4S還處於“全面爆發前的積累時期”。

陳洛南則認為,在高維、因果關係較弱的複雜系統中,AI能通過“黑箱”發現可預測的結果。在生命科學領域,傳統基礎科學理論無法處理、解讀複雜高維的數據,AI則提供了全新視角。

陳洛南道出許多科學家的心中所想——AI似乎可以用來深入挖掘複雜數據之間的聯繫。“現在數據多、規律少,我們就利用‘黑箱’發現新規律,基於新規律產生新數據,進行一輪再發現。這就像一種迴圈。”

這與美國科學哲學家湯瑪斯·庫恩在《科學革命的結構》一書中的觀點如出一轍:科學史本質上是迴圈的,每個新的科學發現都帶來了一種感知世界的新範式,每個範式都經歷著與“發明、解決問題、危機和崩潰”相同的生命週期。

讓人頭痛的“幻覺”和令人興奮的“湧現”,正是AI的一體兩面。那麼,AI如何解決科學問題,又該解決哪些科學問題?

AI和科學家如何“雙向奔赴”

科學界流傳著這樣一個說法:隨著相對論、量子科學被揭示,科學進步的腳步正在放緩。但人們深信,在科學的廣袤土壤中,仍有深埋的寶藏等待挖掘。

不斷發展的AI會是“天選之子”嗎?拿著這把“熱得發燙”的新“鋤頭”,科學家依舊有不少疑惑和期待。

在陳洛南看來,具有萬能近似定理的AI能處理各種複雜的函數關係,輔助進行科學研究和應用。“AI擅長預測,卻不擅長找科學規律,目前的深度學習仍然是靜態表徵,而解讀規律需要動態表徵。”基於多年生物資訊學研究,陳洛南提出,如果未來AI能用動態表徵解讀高維數據,在科研中也許有更好的表現。

羅毅也提出了對AI的期待。“跨尺度是科學研究中最難的問題,我們現在有多尺度計算,但在跨尺度科研方面沒有突破,因為從原理上就不可行。未來如果能實現跨尺度科學研究,才是AI對科學研究的最大賦能。”

朱維良表示:“希望深度學習能發現那些已經積累了大量數據但尚未從中獲得發現的新知識。在挖掘數據的同時,AI能不能利用深度學習對諸如求解生物大分子薛定諤方程這樣的第一性原理問題進行類比?這個課題對政治經濟、人類社會的影響將不可估量。”

從探索未知到求取新知、從解決具體問題到探討第一性原理,AI與科學研究碰撞的火花,正在點燃更多期待,同時還伴隨著一些冷思考。

“計算是等價的,任何可以被圖靈機類比或執行的問題都是可計算的,只是快與慢的問題。”陳熙霖說,“AI只是提供了讓科學家思考更快、層級更多的工具。”

陳熙霖打了個比方:“我們這些做計算機研究的人就像足球比賽的中場(隊員),既不是前鋒也不是守門員,偶爾跑到前場踢進一球,就自以為能進球了。其實我們還是中場,必須承認分工、找準定位,為其他學科提供更快、更強的工具和方法。”

秦濤認為,AI確實能幫科學家破解讓傳統方法“束手無策的難題”,但這類問題可能100年後才會產生經濟或社會價值。“我們希望科學家能及時反饋當前亟須處理的問題,並藉助AI及時解決。”

用好才能“好用”

近年來AI4S備受關注,幾位科學家認為,要讓AI更好為科研賦能,還得解決一些關鍵問題。

AI4S被視作科學研究的“第五範式”,“數據密集”是不可或缺的標籤。秦濤觀察到,當前海量數據的來源已不再局限於互聯網或科學實驗,AI合成數據也是重要來源之一。“AI生成的數據存在同質化、低質化風險。”他認為,在合成數據問題上,科學家和AI需要密切配合,否則可能適得其反。

“科學實驗的優勢恰恰在於,一些客觀存在的物理規律能説明AI生成高品質的新數據。”秦濤說,這就需要“黑箱”與“白箱”相互配合,“‘黑箱’立足於AI視角,‘白箱’則包含許多科學知識,依託AI強大的數據處理能力,二者的無間結合有望加速科學新發現”。

朱維良認為,AI是效能工具,科研工作者現在只有用好AI,將來AI才能在各個方面“好用”。

“關於AI有什麼用,每個人都有自己的看法,但當下更應當討論頂層設計的問題。”陳潤生直言,AI實際上是對人類智慧的集成,要真正在科學研究中用好AI,統籌管理和頂層設計非常重要。

“大家都承認AI是很好的工具,也是進行創新研究的動力,但我們的底層基礎科學能否支撐AI4S體系?當傳統理論被AI打破後,我們該做哪些準備?”陳潤生指出,這些問題都需要在頂層設計層面進行巨集觀、仔細的考量。他同時表示,現在AI4S充滿喧囂,能否用AI解決真正的科學問題很關鍵。

對此,陳熙霖認為,AI4S的發展確實需要適當規劃,但因為其不確定性較大,所以不能只有唯一方案。

“此外,在什麼尺度上進行AI4S研究值得關注。在平臺化、有序化推進AI4S的同時,也要做好分工。”陳熙霖認為,人機協同、人智協同,才是AI賦能科學研究的最佳模式。

百年木棉花開滿枝
百年木棉花開滿枝
2025-03-28 20:03:58