文章来源:放心AI网发布时间:2025-04-17 16:18:32
OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内,成功登顶人工智能竞技场,并成为全任务分类的第一名。然而,这一荣耀并未持续太久,马斯克的 xAI Grok-3模型迅速逆袭,反超成为总榜第一名。
根据投票数据显示,GPT-4.5与 Grok-3各自获得超过3000票,最终总分为1412对1411,仅差一分。尽管 GPT-4.5在大多数项目上表现优秀,但 Grok-3在特定的 “带风格控制” 和 “困难提示词” 任务上略有优势,这使得它在总分上实现了反超。
对于这场 “六小时逆转”,不少用户表示怀疑,认为如此迅速的变化是否合理。对此,有业内人士解释称,竞争榜单设有投票门槛,只有在同一时间内达到3000票的模型才能登上榜单。因此,刚刚发布不久的这两款模型能够同步达到该标准,是一场巧合的结果。
值得一提的是,尽管 GPT-4.5刚发布时面临着一些负面评价,用户对于其高情商的认可度却在日后显著上升。OpenAI 的首席执行官萨姆・奥尔特曼甚至分享了与 GPT-4.5的对话,表示这是他首次收到用户请求其承诺不再下架该模型。
与此同时,GPT-4.5还在一项另类竞赛中取得了优异表现,参与了一场类似于 “大模型狼人杀” 的游戏。在这场比赛中,各大 AI 模型需进行辩论、策略制定与投票,最终的胜者由被淘汰的成员组成的陪审团决定。GPT-4.5在合作、欺骗及策略制定等方面展现出超越人类的优秀表现。
这一切都表明,人工智能的竞争愈加激烈,各大模型在各自领域内不断创新、提升。未来,谁将最终赢得这场智能之战,值得我们持续关注。
相关攻略 更多
最新资讯 更多
GPT-4.5崛起仅六小时便失宠,xAIGrok-3逆袭夺冠
更新时间:2025-04-17
Spotify推出AI音乐创作工具,允许用户个性化改编歌曲
更新时间:2025-04-17
科幻照进现实!耶鲁大学发布MindLLM:AI读懂大脑,fMRI信号秒变文字!
更新时间:2025-04-17
可灵AI正式登陆Android平台
更新时间:2025-04-17
官宣!可灵AI安卓应用正式上线
更新时间:2025-04-17
自变量机器人成功融资,迈向具身智能新纪元
更新时间:2025-04-17
StabilityAI与Arm合作推出离线生成音频技术
更新时间:2025-04-17
Viam融资3000万美元,携手巨头加速全球AI自动化布局!
更新时间:2025-04-17
飞猪推出AI行程助手:在线旅游行业首个融合多模型智能产品
更新时间:2025-04-17
AI大战超级玛丽!Claude3.7封神:Gemini、GPT-4o全军覆没,谁才是游戏界真王者?
更新时间:2025-04-17