微信号:扫一扫 联系我们
如何评价字节跳动开源的 HTTP 框架 Hertz ?
如何看待伊朗议员沙赫里亚里: 我们恳求最高领袖批准使用核武器?
为什么QQ上的网络状态没有了?
有哪些值得推荐的小型 C 语言开源项目?
两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。