ChatGPT-5.2 AI眼镜进考场,30分钟92.5分,碾压95%大学生
发布时间:2026-01-09 06:46 浏览量:4
当一副AI眼镜戴着ChatGPT-5.2走进大学考场,30分钟交出92.5分的答卷,碾压95%人类考生时,我们该震惊的不是“作弊”本身——而是那个用标准答案衡量学习的时代,终于被技术撕开了一道血淋淋的口子。
香港科技大学这场“人机同场考试”像一面照妖镜:搭载大模型的乐奇Rokid眼镜,在《计算机网络原理》期末考里,用人类考生一半的时间跑完流程,选择题和单页简答题拿满分,跨页逻辑题稳得像老教授,连计算步骤都写得比多数学生工整。更讽刺的是,它暴露的硬件短板——30分钟电量掉42%、摄像头模糊会影响答题稳定性——反而成了次要话题。所有人突然意识到:当AI能稳定完成“读题-理解-推理-作答”闭环,我们争论“作弊该不该禁止”,就像在马车时代讨论“汽车该不该限速”,完全跑偏了方向。
“一代人有一代人的学习工具”,这话没错。但这次不一样——以前的小抄、学习机,顶多算“辅助外挂”,而AI眼镜是“整机代打”。它不是帮你查漏补缺,是直接替你跑完了整个考试流程。
港科大团队选的测试场景够狠:《计算机网络原理》,公认的“硬核专业课”,考概念记背、逻辑推导、算法应用,样样戳中人类学生的痛点。结果呢?AI眼镜不仅30分钟交卷,还在100多人里冲进前五。英国雷丁大学更狠,把AI生成的答卷混进题库,94%的“AI考生”成功蒙混过关,平均分比真人还高。这哪是“作弊”?这分明是技术在说:“你们这套评估标准,我闭着眼睛都能过。”
AI眼镜答题情境
为什么会这样?因为传统考试从根上就没打算“考活人”。从小学到大学,我们的试卷永远在重复两件事:“你有没有记住我教的知识”“你会不会按我教的步骤解题”。在记忆、计算、按流程推导这些维度上,AI天然是“卷王”——它不会紧张,不会忘公式,更不会算错数。当评估体系把“标准答案”当圣旨,就等于把战场设在了AI的主场。
有人说:“分数还是有用的,至少能看出谁努力。”但AI眼镜的出现,把这句话的漏洞暴露无遗。
纽约大学Stern商学院搞了个新玩法:口试。学生不光要交作业,还得当场解释“为什么选这个方案”“决策时排除了哪些选项”。AI先当考官追问,再交叉评分,重点看“你是不是真的理解”。这才戳中了要害:学习的本质从来不是“记住答案”,是“学会思考”。
你想想,真实世界里哪有“标准答案”?工作中,老板问“怎么优化项目流程”,没人会给你ABCD四个选项;生活中,“要不要换工作”,更没有“第一步算SWOT,第二步列 pros and cons”的固定步骤。真正重要的能力——提出好问题、在信息不全时做判断、在多个方案里权衡取舍——这些传统考试根本考不出来。
港科大的AI眼镜考了92.5分,但它永远不会问“这道题的考点和现实网络安全漏洞有什么关系”,也不会纠结“用A算法虽然快,但会不会牺牲用户隐私”。这些需要“人味”的思考,恰恰是AI的盲区,也是人类该守住的“核心竞争力”。
面对AI,很多人第一反应是“禁了它”。但你禁得了眼镜,禁得了手机吗?禁得了手机,禁得了脑子里的“AI插件”吗?技术从来不是洪水猛兽,是镜子——它照出的,是我们评估体系的“肌无力”。
真正该做的,是把评估重心从“结果”拽回“过程”。就像纽约大学的口试,让学生把思路“摊开来讲”;就像有些高校开始推“展示型作业”,让学生用项目、报告、辩论来证明“我真的懂了”。分数可以有,但不能只有分数。理解有没有发生?逻辑有没有断层?判断有没有取舍?这些被压缩成“92.5分”的细节,才是区分“真学习”和“假刷题”的关键。
更重要的是,教会学生“和AI协作”。当AI能搞定信息整理、公式推导,人就该专注于“要不要信这个结论”“怎么用这个结论解决问题”。就像港科大教授说的:“与其把AI挡在门外,不如让它当‘助教’,把人的精力解放出来搞判断、做选择。”
最后想说:AI眼镜走进考场,不是教育的末日,是转机。它逼着我们重新思考:教育到底要培养什么人?考试到底要筛选什么能力?当技术已经能“代打”标准答案,我们总不能还指望用分数给学生贴标签吧?
或许,未来的考场不会再有“作弊”一说——因为那时的考试,考的是AI永远学不会的东西:你的思考,你的判断,你的“人味”。而那副AI眼镜,不过是帮你搬砖的工具,真正盖楼的,还得是你自己。