如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-20 02:35:15
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-19 18:50:16国产轮胎那么便宜,为什么很多人非要买高价的国外轮胎??
- 2025-06-18 00:00:12现在做一个独立开发者晚吗?
- 2025-06-18 00:10:12你曾庆幸自己做过什么事?
- 2025-06-19 18:30:16golang 与rust 在服务器程序领域相比较,各有什么优劣势?
- 2025-06-19 18:20:16微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
- 2025-06-19 18:20:16大量消息在 MQ 里长时间积压,该如何解决?
- 2025-06-19 18:45:15据报道称“浏览器内核有上千万行代码”,浏览器内核真的很复杂吗?
- 2025-06-19 18:20:16从零写一个3D物理引擎难度多大?
- 2025-06-19 19:10:17马斯克宣布星舰将配备 42 台发动机,如何评价这一设计?
- 2025-06-19 18:25:15055驱逐舰 是个什么概念?
推荐产品
-
冬天也要穿胸罩吗?
坦白局…你们的冬天真的都不穿内衣啊?是这样的,今天不小心碰到 -
大量消息在 MQ 里长时间积压,该如何解决?
一个同学跟我说,昨天他去字节跳动面试,面试官这样问他,“如何 -
伊朗没有战斗机吗?为什么不起飞空中拼***?
咋了,你想看F-35I给F-14老爷爷踩踩背? 更新:好了, -
有哪些让你目瞪口呆的 Bug ?
讲个离谱的, 第一阶段,之前买了一个小主机,巴掌大,一直用来
最新资讯