你现在的位置是：当前位置：首页 >

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

更新时间：2025-06-21 04:05:16

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

上一篇 : 能分享一下你写过的rust项目吗？

下一篇 : 据说go和c#的开发者都说自己比较节省内存，你们认为呢？

案例推荐

case recommendation

如何评价高圆圆的身材算是美女类型的吗？

查看案例
敏感时刻，美国「末日飞机」出现异常动向，出现在华盛顿附近，什么是「末日飞机」？这代表着什么？

查看案例
***拍大尺度片子时摄影师不会看光吗？

查看案例
为什么一部分 Go 布道师的博客不更新了？

查看案例
广东省肇庆市怀集县洪水后，赵一鸣零食店被哄抢，物资和收银机里面的几千块钱被哄抢一空，如何评价？

查看案例
前端，后端，全栈哪个好找工作？

查看案例
网传广东怀集洪水后赵一鸣超市被哄抢，县***回应相关单位正在核实，若属实哄抢者该承担哪些法律责任？

查看案例
如何评价***伊内斯·特洛奇亚的身材？

查看案例