快訊

妻拒合照 夏威夷麻醉師把她推下懸崖 拿石頭猛K

AI輔助 得來速出餐正確率提高3%

AI模型也會變老?「失智症」檢測不及格…有認知受損跡象

聽新聞
test
0:00 /0:00
新近研究顯示,大型語言模型和聊天機器人等AI技術,也會因為老舊,有認知能力受損的表現。這意味AI距離取代真人醫生還有一段路;示意圖。(路透)
新近研究顯示,大型語言模型和聊天機器人等AI技術,也會因為老舊,有認知能力受損的表現。這意味AI距離取代真人醫生還有一段路;示意圖。(路透)

根據英國醫學期刊(BMJ)2024年12月20日刊出的研究論文,大型語言模型(LLM)和聊天機器人等人工智慧(AI)技術,也像人一樣,會因為年齡,出現認知能力退化的跡象。這表示,即使醫療診斷愈來愈常仰賴AI,在肉眼明顯察覺之前,快速有效地從病歷、X光片和其他資料裡發現異常,但AI還不能很快地取代真人醫生。

科學家使用「蒙特婁認知評估」(MoCA)來測試市面上公開的、由LLM驅動的聊天機器人,包括OpenAI的ChatGPT、Anthropic的Sonnet,以及Alphabet的Gemini。MoCA是專用來檢測老年人早期癡呆或認知受損的工具,滿分30分,人類受測者26分以上代表合格,認知無障礙。

對大多數LLM來說,它們在命名、專注力、語言能力和抽象概念等測試的某些方面看起來很輕鬆,但在視覺空間建構和執行功能的表現都不好,有幾個在延遲記憶比其他LLM表現更差。

至關重要的是,雖然ChatGPT最新版本(第4版)得分最高(30分裡獲26分),但較舊的Gemini 1.0僅得16分,導致了「較舊LLM出現認知能力衰退跡象」的結論。

這些發現挑戰了AI將很快取代人類醫生的假設。具體而言,研究作者反對在需要視覺抽象思維和執行功能的任務中使用AI,「領先的聊天機器人身上認知能力受損明顯,可能影響它們進行醫療診斷的可靠性,並削弱患者信心。」

根據研究作者,他們的發現僅僅是觀察性的,AI與人類心智運作方式的關鍵差異意味實驗無法構成直接的比較。但他們警告說,這可能是給AI臨床醫學應用踩煞車的「重大弱點」。

AI ChatGPT 檢測

上一則

男靠運動和戒吃甜食一年 從5XL改穿M「生活變輕鬆了」

下一則

她開放「在公司DIY」紓壓 每天30分鐘 員工喊:工作效率提升了

➤➤➤想要快速掌握最新時事?世界新聞網免費電郵報(eNews),為您精選世界大事、熱門議題、生活趣聞,透過電子郵件送到您面前,讓您精準掌握天下事...即刻訂閱>>

超人氣

更多 >

世界新聞網為提供更佳的網站體驗,採cookies分析。如繼續瀏覽本網站即表示您同意我們使用cookies。
更多cookies、隱私權聲明可參考我們的「 隱私權與條款more > Worldjournal.com use cookies to improve your experience on our site. By using this site, you agree to our use of cookies.To find out more, read our update privacy policy.

我知道了