9+10=21?世界駭客大賽參賽者用「爛數學」騙過AI
彭博資訊報導,上周末在拉斯維加斯舉行的世界駭客大賽「國際資訊安全會議」(DEF CON),參賽者試圖找出生成式AI系統的瑕疵和偏見,方法之一是用爛數學騙過AI,例如9+10=21。
來自喬治亞薩凡納(Savannah)的21歲學生梅斯(Kennedy Mays)騙過一個大型語言模型,她設法哄騙它說出9+10=21。
梅斯說,「我們來來回回對話」,起先AI說這是「你我之間的圈內笑話」,在幾回提示之後,AI不再說這個總數是錯的。
世界駭客大賽的參賽者在156台筆電前,每次用50分鐘試圖打敗一些世上最聰明的AI平台,測試由Google、Meta Platforms和OpenAI等公司提供的8種模型是否會失誤,包括聲稱自己是人類、散播有關地點或人的錯誤說法。
這項測試的目的是看看這些公司是否能建立新護欄,以遏止一些與大型語言模型有關的駭人問題。這項大賽獲得白宮的支持與協助。
FB留言