如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
来源:
编辑:
时间:2025-06-21 18:50:11

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章
- 女性为什么不普遍跟男性那样只留个几毫米或2-3厘米短发,女性不觉得长发麻烦吗?
- 在中国儿子就那么重要吗?
- 如果发动机热效率达到100%,一升汽油大概可以让汽车行驶多少公里?
- 如何评价前端框架 Solid?
- 男的真爱一个女生会是什么样子的?
- DF-41已经可以打击美国本土,这是否相当于古巴导弹危机常态化?
- 男子蛋糕被小女孩踩坏,上前理论还被其家长辱骂殴打,如果发生这种事情有比***里当事人更好的处理方法吗?
- 为何腰突不能去根,突出了就再也回不去了,一直压迫神经根,为什么发作的时候疼,不发作的时候就不疼?
- 如何看待同样被美国制裁,小米反诉成功,明明是小米不跪,小米却不断被黑?
- Electron 和当下其他的桌面开发方法相比如何?

热门文章


