如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-21 17:45:17
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-21 03:10:17你们的腰突是怎么突然好的?
- 2025-06-21 03:30:16rust 解决了什么问题?
- 2025-06-21 03:20:16有没有女主活的很清醒的文?
- 2025-06-21 03:55:16花旗预测未来几季金价将回落至每盎司 3000 美元以下,这其中有哪些相关依据?
- 2025-06-21 02:50:16你卡过最厉害的bug是什么?
- 2025-06-21 02:55:16换过电池的苹果手机内部发现被加装了一个部件,有大佬知道这是干什么的吗?
- 2025-06-21 03:10:17央行行长潘功胜首次在公开场合谈及稳定币,稳定币是什么?有何深意?
- 2025-06-21 03:55:16如何看待使用mac mini当7*24h的服务器?
- 2025-06-21 03:10:17广东怀集水灾后一家超市疑似被哄抢,这种行为在灾难面前的道德和法律问题如何看待?
- 2025-06-21 03:15:15为什么不建议在 Docker 中跑 MySQL?
推荐产品
-
跟离异的女同事聊天时,她冒出一句:「你老婆还不如我,离了跟我过得了」,我该怎么回答?
女同事开玩笑,你接不上,此乃一败。 说你老婆不如她,你不维 -
语雀后端从Node迁移到J***a说明了什么?
nodejs全栈,感触最深的是:开发人员心智负担实在太大了, -
PHP现在真的已经过时了吗?
作为微小企业的技术面试官,负责后端技术招聘,结合公司实际业务 -
腰陆陆续续疼了一年多了,这个是腰突吗?
题主已经拍过片子,腰五骶一存在椎间盘突出,但没有确定的是什么
新闻动态
最新资讯