如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-22 09:35:17
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-22 07:50:15继续C++还是转前端?
- 2025-06-22 07:25:14评价一下Proxmox VE与ESXi的优劣?
- 2025-06-22 07:15:15当量子计算机能预测人类选择,自由意志是否沦为算法的注脚?
- 2025-06-22 07:10:156 月 21 日「苏超」第五轮南京队 4-0 战胜常州队,如何评价这场比赛?
- 2025-06-22 07:10:15以色列为什么突然敢打伊朗了?不怕被报复?
- 2025-06-22 08:15:15为什么有些人认为中国武器装备看起来很土?
- 2025-06-22 07:15:15中国稀土供应链到底强成什么样了?为何全球都离不开中国?稀土对制造业意味着什么?
- 2025-06-22 07:20:14Rust开发Web后端效率如何?
- 2025-06-22 07:50:15腾讯开源的 libco 号称千万级协程支持,那个共享栈模式原理是什么?
- 2025-06-22 07:30:14switch模拟器是不是历史上唯一在主机当红时就几乎完美模拟器?
推荐产品
-
如何评价泰勒·斯威夫特的身材?
本来是进来看美照的,没想到刷到了这个,“霉霉不露肚脐眼,是因 -
你的低成本爱好是什么?
不开导航上高速瞎逛,然后去那些稍微偏点小县城、村庄,找个地方 -
中国的航空发动机现在是什么水平?
目前的进展: 军用先进涡扇: 涡扇-15 :即将批量服役歼- -
北京日报点名批评“苏超”过度娱乐化的动机是什么?
准确的说,是感受到了威胁。 贵州村超规模小,位置偏远,当地
新闻动态
最新资讯