当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
为什么感觉中国这么多进食障碍(厌食或暴食)的女生?
go为了编译速度减少了很多编译优化?为什么不能提供优化编译模式来提升运行效率?是太懒还是另有隐情?
DIY的NAS易用性如何?
人死了以后意识去哪了?
中国军队有多强,在世界能排第几?
没有上进心的男人都不考虑未来的吗?
腰椎间盘突出有多痛苦?
给小孩买什么游戏机?
究竟怎么学习IOS 开发啊?
为什么有的人喜欢带着 MacBook 去咖啡店或者书店上网,而不是 ThinkPad 之类的?
如何证明散片 CPU 比盒装 CPU 差?
为什么一部分 Go 布道师的博客不更新了?
为什么 macOS 比 Windows 稳定?
男医生在给年轻靓丽的女性检查时会是什么心态?
手机的运行内存真的有必要上16GB吗?
MacBook的诱惑在哪里?
为什么要学go语言,golang的优势有哪些?
你后悔娶了现在老婆吗?
哪张照片让你觉得刘亦菲美得不可方物?
哪些音频剪辑工具很好用?
女明星穿瑜伽裤出门是什么体验?
导师给了1.4W要我给工作室买个主机,是整机还是自己配?
obsidian用一两年后会有多大?全文搜索还快吗?
俄罗斯妹子***漂亮热情,中国男人是不是很喜欢娶?
如何评价林志玲?
Electron 做游戏客户端的潜力有多大?
家里想搞一个服务器,怎么才不违规?
CPU 为什么很少会坏?
如果将伊朗换成中国,中国能否抗住以色列和美国的这轮打击?