全球科技前沿2025年4月22日2025年4月22日作者 《中华品牌》杂志OpenAI 的 o3 模型声称可以解决超过 25% 的 FrontierMath 问题,但测试显示只有 10%。 OpenAI, 模型在基准测试中的得分低于声称的, 的
评论