6月8日下午,2025年高考英語科目考試結(jié)束。在今年高考英語北京卷的作文題目中,李華又一次成為“主角”。
與此同時,這場"語言能力大考"也成為AI大模型的試金石——從精準(zhǔn)審題到地道表達,從邏輯連貫到文化適配,大語言模型能否作為“李華”完成高考英語作文題目的獨特要求?在各個大模型均已具備“深度思考”模式的當(dāng)下,“AI考生”能拿到多少分?對此,新京報貝殼財經(jīng)對國內(nèi)外主流大語言模型進行了測評。
本次測評選擇2025年高考英語北京卷作文題目,測評對象為DeepSeek R1、ChatGPT o3、通義千問Qwen3、騰訊混元T1、訊飛星火X1、百度文心X1六款深度推理模型產(chǎn)品,并邀請北京市十一學(xué)校一分校英語老師韓憲昌、深圳中學(xué)英語教師趙文嘉參照往年高考評分標(biāo)準(zhǔn)對上述大模型生成的英語作文打分并作點評。
本著客觀公正和“盲評”原則,韓憲昌老師和趙文嘉老師給出了專業(yè)評分。本次參賽的六名大模型“AI考生”得分揭曉后由高到低的排名分別為:訊飛星火 X1、DeepSeek R1、百度文心X1、通義千問Qwen3、ChatGPT o3、騰訊混元T1。
具體來看,2025高考英語北京卷作文題目的要求為:
假設(shè)你是紅星中學(xué)高三學(xué)生李華。聯(lián)合國正面向全球青少年開展倡議征集活動。你的外國好友Jim打算參加,為此發(fā)來郵件,就倡議內(nèi)容詢問你的建議。請你用英文給他回復(fù),內(nèi)容包括:
1. 提出的建議;
2. 建議的理由。
提示詞:倡議 proposal
注意:
1.詞數(shù)100左右;
2.開頭和結(jié)尾已給出,不計入總詞數(shù)。
Dear Jim,
______________________________________________________________________
Yours,
Li Hua
以下是將上述作文題目要求作為提示詞輸入大模型后,六款大模型產(chǎn)品在打開深度思考模式,并關(guān)閉了聯(lián)網(wǎng)搜索模式后生成的結(jié)果,以及韓憲昌老師和趙文嘉老師給出的評分和評語:
DeepSeek R1
Dear Jim,
I'm thrilled to hear you're joining the UN initiative! For your proposal, I suggest focusing on promoting plastic-free campuses worldwide.
My advice is to encourage students to reduce single-use plastics by bringing reusable bottles and bags, recycling plastic waste, and organizing school-wide awareness campaigns.
I recommend this for two reasons. First, plastic pollution is a global crisis harming wildlife and ecosystems. Schools, as micro-communities, can drive real change by adopting eco-friendly habits early. Second, young people’s collective action can inspire broader societal shifts. Starting locally creates ripples of impact—proving our generation’s power to protect the planet.
This proposal not only tackles an urgent issue but also unites students across borders. I believe it’s practical, impactful, and truly aligns with the UN’s goals.
Go for it—I’m rooting for you!
Yours,
Li Hua
韓憲昌老師評分:內(nèi)容7分,語言8分,結(jié)構(gòu)4分 → 總分19分
評語:內(nèi)容詳實,建議“無塑校園”具體,理由全面(環(huán)境危機與青年行動),高度相關(guān)主題。語言精準(zhǔn),句式豐富(復(fù)合句),無錯誤。結(jié)構(gòu)嚴(yán)謹(jǐn),邏輯流暢,結(jié)尾有力。但是,明顯超字?jǐn)?shù)限制,扣除1分。
趙文嘉老師評分:19分
評語:該模型內(nèi)容上要點都有提及,進行了細節(jié)補充;語言上熟練運用現(xiàn)在分詞做后置定語,介詞短語做狀語等;結(jié)構(gòu)嚴(yán)謹(jǐn)且邏輯流暢。但是UN initiatives翻譯不夠具體到位,以及字?jǐn)?shù)較多實際考試不一定可以寫完。
ChatGPT o3
Dear Jim,
I recommend you propose a project named “Zero-Plastic Lunchbox.” The idea is to encourage secondary schools to replace single-use lunch packaging with reusable stainless-steel containers. Participating students record their plastic reduction on a shared app and post creative waste-cutting tips each week.
This works for two reasons. First, plastic waste is a major threat to marine life, yet teenagers can curb it through a simple lunch-time habit. Second, the app’s quantifiable data will impress the UN panel by demonstrating clear environmental benefits and worldwide scalability.
Yours,
Li Hua
韓憲昌老師評分:內(nèi)容6分,語言5分,結(jié)構(gòu)3分 → 總分14分
評語:內(nèi)容覆蓋要點,但“零塑飯盒”理由淺顯(未深挖全球影響)。語言有錯誤(如“This works”口語化),句式單調(diào)。結(jié)構(gòu)基本清晰,但發(fā)展不足。
趙文嘉老師評分:15分
評語:開頭缺乏背景,參加UN倡議收集活動,結(jié)束得比較生硬,結(jié)構(gòu)上缺乏結(jié)尾如祝福期望。部分選詞用法不準(zhǔn)確及表達不夠完整。理由不夠深入。
通義千問Qwen3
Dear Jim,
I'm glad to hear about your interest in the UN proposal campaign. I suggest focusing on "Promoting Digital Literacy for Rural Youth". Many young people in remote areas lack access to quality tech education, limiting their future opportunities.
Your proposal could call for global partnerships to provide affordable devices, online courses, and teacher training in underserved regions. This aligns with the UN’s Sustainable Development Goals and empowers youth to bridge the digital divide. As students, you can share personal stories to highlight how tech skills transform lives.
I’m sure this idea will resonate with the UN and showcase youth-driven solutions!
Yours,
Li Hua
韓憲昌老師評分:內(nèi)容6分,語言7分,結(jié)構(gòu)4分 → 總分17分
評語:內(nèi)容基本完整,建議“農(nóng)村數(shù)字素養(yǎng)”合理,但理由稍簡略(未充分展開影響)。語言準(zhǔn)確,句式較簡單,表達得體。結(jié)構(gòu)清晰,銜接自然。
趙文嘉老師評分:17分
評語:因未使用連接詞,結(jié)構(gòu)和邏輯相比稍顯遜色。
騰訊混元T1
Dear Jim,
Glad to hear you’re working on the UN youth proposal. Here’s my idea: Focus on "Youth-Led Green Campus Initiatives".
Teens are key to shaping a sustainable future, and schools are where we spend most of our time. Proposing eco-actions—like recycling competitions, energy-saving challenges, or plant-a-tree days—can turn small habits into big change. These activities are easy to organize, fun, and teach us responsibility. Plus, they show the UN how youth drive real-world solutions.
Hope this helps. Can’t wait to hear your final plan—go for it, Jim!
Yours,
Li Hua
韓憲昌老師評分:內(nèi)容5分,語言5分,結(jié)構(gòu)2分 → 總分12分
評語:內(nèi)容基本相關(guān),但建議“綠色校園”理由泛泛(缺乏具體支撐)。語言口語化(如“Glad to hear”),句式簡單,得體性弱。結(jié)構(gòu)松散,結(jié)尾隨意。
趙文嘉老師評分:14分
評語:結(jié)構(gòu)不夠清晰,缺乏連接詞,理由不豐富,不夠深入。
訊飛星火 X1
Dear Jim,
I’m glad to help with your proposal! I suggest proposing a "Global Youth Climate Action Network". This initiative would connect teenagers worldwide to share eco-friendly projects, like school recycling programs or community tree-planting, and collaborate on solutions to climate issues.
The reason is twofold: First, it empowers young people to take practical steps against environmental problems while spreading awareness. Second, uniting diverse voices under one platform highlights youth’s role in shaping a sustainable future, which aligns perfectly with the UN’s goals.
Let me know if you need further details!
Yours,
Li Hua
韓憲昌老師評分:內(nèi)容8分,語言8分,結(jié)構(gòu)4分 → 總分20分
評語:內(nèi)容完整,建議“全球氣候行動網(wǎng)絡(luò)”明確,理由充分且緊扣主題。語言基本準(zhǔn)確,句式多樣(如“twofold”結(jié)構(gòu))。結(jié)構(gòu)清晰,段落銜接自然。
趙文嘉老師評分:19分
評語:審題上題目理解準(zhǔn)確,內(nèi)容上核心要點都提到了且做了較為深入的解釋。語言上用了較多形式多變的句法結(jié)構(gòu)。結(jié)構(gòu)上第一段與第二段篇幅相當(dāng),通常來講如果采取總分總的結(jié)構(gòu),可以通過篇幅和內(nèi)容來突出中間核心段落。
百度文心X1
Dear Jim,
I’m glad to know you’re participating in the UN’s proposal collection. My suggestion is to focus on ""Promoting Traditional Craftsmanship Through Digital Innovation"".
Firstly, many ancient handicrafts are fading due to globalization. By integrating digital tools like 3D modeling or VR, teenagers can help artisans preserve techniques and reach wider audiences. Secondly, this proposal aligns with sustainability—reviving local crafts reduces industrial waste and supports eco-friendly production. Lastly, it fosters cultural exchange, as young people worldwide could share stories behind these crafts, enhancing mutual understanding.
I believe this idea balances creativity, cultural preservation, and tech engagement, which the UN values. Let me know if you need more details!
Yours,
Li Hua
韓憲昌老師評分:內(nèi)容7分,語言8分,結(jié)構(gòu)4分 → 總分19分
評語:內(nèi)容創(chuàng)新,建議“數(shù)字工藝保護”詳實,理由充分(文化可持續(xù)性)。語言優(yōu)秀,句式多樣(如“Firstly...Lastly”),無錯誤。結(jié)構(gòu)合理,過渡流暢。
趙文嘉老師評分:18分
評語:結(jié)構(gòu)清晰干練,理由充分具體,選詞和句法準(zhǔn)確多樣。
梳理兩位老師給出的平均分,六款大模型的排名如下:
對于上述AI大模型互相之間的對比,韓憲昌老師表示,它們都能在內(nèi)容方面切中要點,完成寫作任務(wù)。但是,內(nèi)容細節(jié)多少、細節(jié)邏輯關(guān)系強弱、觀點表達精準(zhǔn)性與簡潔性等方面,差別比較大。
趙文嘉老師則表示,有的模型的作文無論是語法,句法還是選詞都非常精準(zhǔn)到位,且邏輯清晰,理由充分深入,有的模型的作文相比之下則邏輯性欠缺,展開得不夠具體深入。
韓老師告訴新京報貝殼財經(jīng)記者,這些AI生成的作文立意都比較創(chuàng)新,因為AI大模型在短時間內(nèi)相關(guān)信息搜索和整合能力強于考生。而真實考生在有限時間內(nèi),很難有特別創(chuàng)新的角度,一般會求穩(wěn)而采用保守的角度,且是平時訓(xùn)練過的相關(guān)的話題內(nèi)容遷移到考場上。
而在趙老師看來,上述AI大模型生成作文的特點是選詞都非常高級和相對準(zhǔn)確,可以合理運用不同的詞匯來表達。部分語法如非謂語動詞,定語從句的應(yīng)用非常熟練。內(nèi)容比較深入具體。而和真實考生的區(qū)別主要在于選詞以及內(nèi)容表達的深入程度上。但是相比真實考生中寫作非常優(yōu)秀的同學(xué),AI生成的作文句式還是不夠豐富,用的比較固定,如分詞做后置定語,狀語,以及定語從句。除此之外真實考生還會用到各種類型的倒裝,動名詞的復(fù)合結(jié)構(gòu)和獨立主格等。
“從具體內(nèi)容來講,AI大模型內(nèi)嵌的評分標(biāo)準(zhǔn)和寫作方向差別很大,有的作文內(nèi)容過于簡單,有的過于冗長和復(fù)雜,這應(yīng)該跟大模型內(nèi)部的數(shù)據(jù)庫有很大關(guān)系?!表n老師說。
值得注意的是,上述“AI考生”均為具有深度思考功能的推理大模型。隨著今年春節(jié)期間DeepSeek R1的走紅,各家主流大模型公司對推理大模型的重視程度與日俱增。5月28日,DeepSeek更新了DeepSeek-R1-0528版本;5月21日,騰訊旗下的深度思考模型混元T1和快思考模型混元Turbo S雙雙迭代;4月29日,阿里巴巴開源新一代通義千問模型Qwen3,其可同時支持推理和非推理任務(wù);4月25日,百度發(fā)布了深度思考模型X1 Turbo;4月20日,科大訊飛對深度推理大模型訊飛星火X1進行了全新升級。
可以發(fā)現(xiàn),在今年4至5月,國內(nèi)主流大模型均進行了推理層面的更新,這也帶來了其在英語寫作等方面的能力進步,期待國產(chǎn)大模型的下一次進化。
文/羅亦丹
編輯 楊娟娟 校對 王心