AI考高考成績如何？這個中國大模型「考生」贏過GPT-4o

上海人工智慧實驗室旗下機構公布首個由人工智慧（AI）大模型高考全卷評測結果，阿里巴巴的通義千問2-72B總得分排名第一，略高於第二名OpenAI的GPT-4o。（圖／取自新浪科技）

中國高考（大學入學考試）6月初已結束，各地近日將陸續公布考試成績。搶在這之前，上海人工智慧實驗室旗下機構近日公布首個由人工智慧（AI）大模型答卷的評測結果。在7個來自中國海內外大模型進行語文、數學、英語三科全卷能力測試下，阿里巴巴的通義千問2-72B總得分排名第一，略高於第二名OpenAI的GPT-4o。此外，閱卷老師也剖析了AI與人類考生答題上的差異。

上海第一財經報導，在前不久高考結束後，上海人工智慧實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考語文、數學、英語全卷能力測試，這項首個大模型高考全卷評測結果於19日公布。

在三科加起來滿分為420分（語文、數學滿分150分；英文滿分120分）的前提下，此次高考測試結果顯示，大模型的語文、英文考試程度普遍不錯，但數學都不及格，最高分也只有75分。

從排名看，阿里通義千問2-72B排名第一，為303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智慧實驗室的書生·浦語2.0排名第三，三個大模型的得分率都超過70%。

第四至六名則為阿里通義千問2-57B、零一萬物Yi-1.5-34B、智譜GLM4-9B。來自法國大模型新創公司的Mistral Mixtral 8x22B排名第七墊底。

上海人工智慧實驗室表示，此次三科全卷測試，成績由具備高考評卷經驗的老師匿名人工判分，閱卷開始前，閱卷教師「未被」告知答卷均由模型生成，使閱卷教師完全以面對真實考生的標準評判回答效果。

值得一提的是，大模型「犯錯」的方式和人類考生有差異，有的模型會存在完全不理解題意導致亂答、重複生成、回答更像解析而非解答的問題，因此實際執行上，閱卷老師未能完全適應給分的過程，團隊則要求老師將離譜的錯誤直接視為答題錯誤，解析類型的回答以是否包含正確解題過程作為唯一準則。此外，每個題目都邀請了至少三位老師評閱取平均分數。

針對大模型在各科的表現，語文方面，評卷老師認為，模型的現代文閱讀理解能力普遍較強，但是不同模型的文言文閱讀理解能力差距較大。大模型作文則更像問答題，雖然有針對性但缺乏修飾，幾乎不存在人類考生都會使用舉例論證、引用論證、名人名言和人物材料等手法。對於「比喻」等語文概念，多數模型無法理解。

在數學考卷上，老師們發現，大模型的主觀題回答「相對凌亂」，且過程具有迷惑性，甚至出現過程錯誤但得到正確答案的情況。大模型的公式記憶能力較強，但是無法在解題過程中靈活引用。

英語則整體表現良好，但部分模型因不適應題型，在七選五、克漏字填空等題型得分率較低。大模型英文作文普遍存在因超出字數限制而扣分的情況，而人類考生多因為字數不夠扣分。

高考人工智慧 AI

上一則

6月20日星座運勢獅子愛情有斬獲射手積極向前行

下一則

我的頻道

紐約久旱逢甘霖降雨預計持續到周末

紐約市推進特殊高中入學考試合約審批

6月20日星座運勢獅子愛情有斬獲射手積極向前行

6月21日星座運勢牡羊愛情事業得意天秤同事就是貴人

延伸閱讀

中國與美國4個領域差距正在拉大學者：值得高度警惕

世界人工智能大會7月上海登場將展出45款智慧機器人

IMF加強亞太工作設上海區域中心

前OpenAI首席科學家辦新公司要創建安全強大的AI體系

熱門新聞

3生肖2025年可望一夜暴富屬龍遇貴人相助事業運旺

4生肖年底愈來愈富屬鼠投資得利、他們創業成功賺大錢

愈老愈開心星座天秤轉型氣質潮人、這星座受後輩尊敬超自豪

2025年4星座愛情事業兩得意他敢創新挑戰迎來成功

白色蛋黃安全嗎？專家破解吃蛋四迷思

煮飯前「加一物」延長澱粉分解時間白米飯變得更香甜

FB留言

超人氣

12星座堅持己見排行牡羊必當贏家、他從不改變原則

含淚告別網壇的納達爾生涯總獎金史上第二高

好市多這款超搶手抹布出自華人之手

這名網球選手每踏入球場就進帳近100萬美元

川普調高關稅衝擊物價這幾類民生消費品漲最凶

紐約久旱逢甘霖 降雨預計持續到周末

紐約市推進 特殊高中入學考試合約審批

AI考高考成績如何？這個中國大模型「考生」贏過GPT-4o

6月20日星座運勢 獅子愛情有斬獲 射手積極向前行

6月21日星座運勢 牡羊愛情事業得意 天秤同事就是貴人

延伸閱讀

中國與美國4個領域差距正在拉大 學者：值得高度警惕

世界人工智能大會7月上海登場 將展出45款智慧機器人

IMF加強亞太工作 設上海區域中心

前OpenAI首席科學家辦新公司 要創建安全強大的AI體系

熱門新聞

3生肖2025年可望一夜暴富 屬龍遇貴人相助事業運旺

4生肖年底愈來愈富 屬鼠投資得利、他們創業成功賺大錢

愈老愈開心星座 天秤轉型氣質潮人、這星座受後輩尊敬超自豪

2025年4星座愛情事業兩得意 他敢創新挑戰迎來成功

白色蛋黃安全嗎？ 專家破解吃蛋四迷思

煮飯前「加一物」延長澱粉分解時間 白米飯變得更香甜

12星座堅持己見排行 牡羊必當贏家、他從不改變原則

含淚告別網壇的納達爾 生涯總獎金史上第二高

好市多這款超搶手抹布 出自華人之手

這名網球選手每踏入球場 就進帳近100萬美元

川普調高關稅衝擊物價 這幾類民生消費品漲最凶

紐約久旱逢甘霖降雨預計持續到周末

紐約市推進特殊高中入學考試合約審批

6月20日星座運勢獅子愛情有斬獲射手積極向前行

6月21日星座運勢牡羊愛情事業得意天秤同事就是貴人

中國與美國4個領域差距正在拉大學者：值得高度警惕

世界人工智能大會7月上海登場將展出45款智慧機器人

IMF加強亞太工作設上海區域中心

前OpenAI首席科學家辦新公司要創建安全強大的AI體系

3生肖2025年可望一夜暴富屬龍遇貴人相助事業運旺

4生肖年底愈來愈富屬鼠投資得利、他們創業成功賺大錢

愈老愈開心星座天秤轉型氣質潮人、這星座受後輩尊敬超自豪

2025年4星座愛情事業兩得意他敢創新挑戰迎來成功

白色蛋黃安全嗎？專家破解吃蛋四迷思

煮飯前「加一物」延長澱粉分解時間白米飯變得更香甜

12星座堅持己見排行牡羊必當贏家、他從不改變原則

含淚告別網壇的納達爾生涯總獎金史上第二高

好市多這款超搶手抹布出自華人之手

這名網球選手每踏入球場就進帳近100萬美元

川普調高關稅衝擊物價這幾類民生消費品漲最凶