如果说过去几轮世界杯,人们讨论最多的是AI会不会“集体翻车”,那么澳大利亚与埃及这场比赛,则呈现出另一种完全不同的画风,AI没有形成共识。
北京时间7月4日凌晨2点,澳大利亚与埃及战成1:1。赛前,在联想集团×咪咕视频《世界杯预测人机大战》中,12家大模型并没有像以往那样集体押向一边,而是出现了本届赛事最明显的一次“意见分裂”。
最终,12家AI形成了三个阵营:2家支持澳大利亚取胜;4家支持埃及取胜;6家认为双方将在90分钟内战平。这意味着,平局第一次成为AI阵营中的主流观点,比赛结束后回看,这6家坚持平局判断的大模型,成为本场比赛最大的赢家。其中,通义千问、Kimi、智谱、MiniMax、阶跃五家模型不仅猜中了平局方向,更直接命中了1:1的准确比分。中移九天虽然预测的是0:0,但同样命中了平局结果。

最终,AI阵营取得了6家命中胜平负,5家命中准确比分。这是本届世界杯AI预测中少见的一次“高质量平局预测”。
相比之下,人类嘉宾阵营则出现了明显分化。颜强、韩乔生都预测埃及1:2取胜;阎鹤祥则看好澳大利亚2:1获胜;只有张路和苏东坚持战平。其中,张路直接命中1:1比分,苏东预测0:0,同样判断正确了比赛方向。最终,5位嘉宾中有2位猜中平局,其中1位命中准确比分。

如果单纯比较胜平负,这场比赛AI与人类都没有出现压倒性优势,但真正值得关注的是另一件事。过去的世界杯预测中,大模型越来越容易形成“共识”。面对强弱分明的比赛,12家模型往往会给出高度一致的判断;即便出现冷门,也常常表现为“集体翻车”。而澳大利亚与埃及这场比赛,却完全不同,模型之间出现了明显分歧。有人相信澳大利亚的整体实力;有人更看好埃及的反击效率;也有人认为双方实力接近,平局概率最高。
最终,没有共识,反而更接近真相。从某种意义上说,这也说明,大模型的预测能力正在进入新的阶段。它们不再只是简单输出相似答案,而是在面对势均力敌的比赛时,开始根据各自的数据体系、权重模型和推理逻辑,得出不同结论。而这种差异,恰恰也是AI预测越来越有意思的地方,它不只是告诉你谁会赢,更是在展示不同模型究竟是如何理解一场足球比赛。
对于本届世界杯来说,这场1:1也留下了一个很有意思的纪录:第一次,不是AI集体猜对,而是AI先“吵”出了三个答案,最后平局派赢了。
本文为“世界杯预测人机大战”每日战报,由新浪财经联合联想集团、咪咕视频共同呈现。活动详情请关注咪咕视频APP。每晚9点,联想集团与咪咕视频联合出品的《人机大战:谁是世界杯预言家》在咪咕视频热播,敬请观看!
无论是段永平、如今vivo的掌门人沈炜,还是傅盛、程维等,他们的企业在业界都是数一数二,影响力很大,但为人都很低调、务实。 李良彬亦是如此。 外界称李良彬为“儒商”,外表儒雅、遇事谦和,但其实李良彬经...
微成都报道日前,硅料龙头通威股份(600438.SH)一纸公告震动市场,其子公司四川永祥股份有限公司(以下简称永祥股份)成功完成了49.16亿元的战略增资,吸引了包括工银金融资产投资有限公司、中国中信...
斑马消费 范建 《新京报》于上周发布的一篇记者卧底调查重磅报道,不仅曝光了精神病医院骗保的惊人内幕,还意外地将“眼科之王”、爱尔眼科创始人陈邦,耗时十年搭建的精神病康复产业置于聚光灯下。 陈邦间接控制...
农业独角兽破产,孙正义又又又被坑了。 最近知名农业独角兽Plenty向得克萨斯州法院申请破产保护,这家曾宣称要“颠覆传统农业”的硅谷明星企业,至此走到终点。 而纵观Plenty成长历程,孙正义作为投...
胜宏科技午后涨超8% 公司拟推出7亿元员工持股计划 胜宏科技午后涨超8% 公司拟推出7亿元员工持股计划 胜宏科技(02476)盘中涨超10%,截至发稿,股价上涨8.45%,现报367港元,...
又一位高管离开正处于业绩震荡中的倍轻松(688793.SH)。9月19日晚间,倍轻松发布公告称,公司副总经理、COO(首席运营官)郑小亚因个人原因申请辞去所任职务。辞职后,郑小亚不再担任公司任何职务。...