AI 快速滲透現代人生活各層面,從語音助理、新藥研發到自動駕駛,幾乎無所不能。科學領域,AI 則能幫助處理巨量數據、加速發現,甚至提出科學假設。然而,AI 點子能像人類有突破與創新性嗎?最近《Science》期刊報導提及比較人類與 AI 想的科學假設,結果顯示 AI 可驗證性明顯不足。如何結合 AI 效率與人類洞察力,將是科學發展的關鍵。
為了比較 AI 與人類「假設對決」,史丹佛大學收集大量資料,並讓基於大語言模型(LLM)AI 找尋潛在規律並產生新假設,人類則提出另一組假說。所有假設都去辨識化,由實驗室 43 位研究員盲測以確保客觀性。顯示人類假設通常更具體、更貼近問題核心,驗證成功率也較高。AI 雖產生數量龐大但缺乏嚴謹可驗證性,有的表面看似合理,卻很難驗證。
實驗結果顯示,人類假說有較高比例實驗證實有效。AI 產生假說時,傾向提出顯而易見、已有文獻支持,或邏輯合理但缺乏創意的觀點。人類更能跳脫框架,提出更大膽反直覺假設,正是突破性發現的起點。
這不代表 AI 對科學研究毫無用處。相反的,研究員認為 AI 扮演重要輔助角色。因 AI 就像永不疲倦的「文獻檢索專家」與「數據分析師」,迅速篩選數百萬篇論文,辨識人類忽略的微小關聯,並整合供科學家參考。科學家可發揮獨特創造力與判斷力,提出更高品質、更具價值的假設。
研究顯示 AI 仍處於發展初期,尤其需要創造性思維的領域。大型語言模型雖能模仿人類寫作風格,但原理仍是基於統計學與機率,故難產生有突破性、真正「新知」。此外,這項研究也提醒人們,AI 應用需謹慎與專業評估,過度依賴 AI ,可能導致科學研究陷入「重複循環」迴圈,無法真正創新。
人類提出假設時,除了基於數據資料,更包括對科學領域的理解、直覺與經驗,自然語言處理(NLP)領域,AI 產生假設乍看似乎比人類更有創意,但實測後,AI 平均創新性評分從 5.4 降至 3.4 分,很多看似新穎的想法實測時就站不住腳;人類假設則從 4.6 分降至 4.0 分,突顯人類假設可行性及解讀結果的優勢。
然而,AI 與人類創新性差距將逐漸縮小。技術更進步後,AI 將來仍可能負擔產生大部分科學假設,而人類執行無法自動化的步驟。但如果人類淪為「實驗機器」,是否喪失探索科學的樂趣?理想狀態可能是「人機協作」模式,AI 負責搜尋與初步產生假說,人類掌握最終決定、驗證與創新等判斷。這樣分工或許可重塑科學研究生態,讓人類將心力投注在真正無法取代的創造與洞見。
(首圖來源:shutterstock)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:姜东元)
” 重新再出发的毕胜,这一次能走出这个怪圈吗?document.writeln('关注创业、电商、站长,扫描A5创业网微信二维码,定期抽大奖。...[详细]
业内认为,现实有力地驳斥了毕胜,他的观点也随之应者寥寥。...[详细]
”document.writeln('关注创业、电商、站长,扫描A5创业网微信二维码,定期抽大奖。...[详细]
2011年,乐淘积极扩张,成立了多家分支机构,在大量广告和活动费用的支持下,销售额猛增,但仅仅半年后,就陷入巨亏。...[详细]
具体筛选的标准是什么?是否有经过评论用户的同意?后续还会有哪些动作,为此,新榜专访网易云音乐,了解到这次刷屏营销背后的细节。...[详细]
用户下载一个APP,处理一下在微博、朋友圈等社交媒体上发的照片,就可以通过银行支付APP的人脸识别验证。...[详细]
从2012年到2014年,永安行的估值从2亿到9亿,涨了三倍以上,不过PE水平一直在12倍左右,估值增长的原因是利润的快速增长。...[详细]全球快资讯:国家统计局:5月份生产原煤3.9亿吨 同比增长4.2%
但创业小黑知道,创业中最重要的可能是系统的方法论,创意,只是一万步工作中的第一步。...[详细]
另外,在无印良品超市,一些日本食品的外包装上都被贴着产地为日本的中文标签,但是揭开中文标签后,却露出了这些产品的真实产地为东京都,也就是曾经的核污染区。...[详细]
但这个远不是其他领域创业打鸡血拼宏愿谈理想就能成,开发人工智能是一个庞大的系统工程,它不会是一个突然出现的风口,更是一个长时间的经济技术、科研发展水平的缓慢沉淀与推动的过程。...[详细]