AI 提出的科學假設未必可行，人類依然略勝一籌？

2025-11-22 05:32:55 [城南海] 来源：甘言美语网

AI 快速滲透現代人生活各層面，從語音助理、新藥研發到自動駕駛，幾乎無所不能。科學領域，AI 則能幫助處理巨量數據、加速發現，甚至提出科學假設。然而，AI 點子能像人類有突破與創新性嗎？最近《Science》期刊報導提及比較人類與 AI 想的科學假設，結果顯示 AI 可驗證性明顯不足。如何結合 AI 效率與人類洞察力，將是科學發展的關鍵。

為了比較 AI 與人類「假設對決」，史丹佛大學收集大量資料，並讓基於大語言模型（LLM）AI 找尋潛在規律並產生新假設，人類則提出另一組假說。所有假設都去辨識化，由實驗室 43 位研究員盲測以確保客觀性。顯示人類假設通常更具體、更貼近問題核心，驗證成功率也較高。AI 雖產生數量龐大但缺乏嚴謹可驗證性，有的表面看似合理，卻很難驗證。

人類更能跳脫框架

實驗結果顯示，人類假說有較高比例實驗證實有效。AI 產生假說時，傾向提出顯而易見、已有文獻支持，或邏輯合理但缺乏創意的觀點。人類更能跳脫框架，提出更大膽反直覺假設，正是突破性發現的起點。

這不代表 AI 對科學研究毫無用處。相反的，研究員認為 AI 扮演重要輔助角色。因 AI 就像永不疲倦的「文獻檢索專家」與「數據分析師」，迅速篩選數百萬篇論文，辨識人類忽略的微小關聯，並整合供科學家參考。科學家可發揮獨特創造力與判斷力，提出更高品質、更具價值的假設。

研究顯示 AI 仍處於發展初期，尤其需要創造性思維的領域。大型語言模型雖能模仿人類寫作風格，但原理仍是基於統計學與機率，故難產生有突破性、真正「新知」。此外，這項研究也提醒人們，AI 應用需謹慎與專業評估，過度依賴 AI ，可能導致科學研究陷入「重複循環」迴圈，無法真正創新。

人類直覺的優勢

人類提出假設時，除了基於數據資料，更包括對科學領域的理解、直覺與經驗，自然語言處理（NLP）領域，AI 產生假設乍看似乎比人類更有創意，但實測後，AI 平均創新性評分從 5.4 降至 3.4 分，很多看似新穎的想法實測時就站不住腳；人類假設則從 4.6 分降至 4.0 分，突顯人類假設可行性及解讀結果的優勢。

然而，AI 與人類創新性差距將逐漸縮小。技術更進步後，AI 將來仍可能負擔產生大部分科學假設，而人類執行無法自動化的步驟。但如果人類淪為「實驗機器」，是否喪失探索科學的樂趣？理想狀態可能是「人機協作」模式，AI 負責搜尋與初步產生假說，人類掌握最終決定、驗證與創新等判斷。這樣分工或許可重塑科學研究生態，讓人類將心力投注在真正無法取代的創造與洞見。

The Ideation–Execution Gap: Execution Outcomes of LLM-Generated versus Human Research Ideas
AI-generated scientific hypotheses lag human ones when put to the test

（首圖來源：shutterstock）

文章看完覺得有幫助，何不給我們一個鼓勵

請我們喝杯咖啡