GPT5测试被质疑作弊故意避开难题刷高分
本文来自:APPSO (ID:appsolution),作者:APPSO,原文标题:《GPT-5 测试被质疑作弊,故意避开难题刷高分?图表「生成」还得看 OpenAI》人不能同时踩两个坑,但OpenAI做到了。GPT-5发布会上,OpenAI因为一张比例失调的图表被全网群嘲。后续他们火速更新图表,目前已经调整好了比例。表面上看,GPT-5在SWE-bench Verified测试中拿下74.9%的成绩,似乎压了Claude一头,但知名分析机构SemiAnalysis却发现这图表里还藏着别的猫腻。(左为新版图表,右为旧版出错图表)给吃瓜的朋友先科普一下,SWE-bench...
more...