Meta将推迟发布旗舰AI模型Behemoth,股价盘中跌超3%

客服微996438431年前财经知识196

周四,据媒体报道,扎克伯格旗下Meta Platforms推迟发布旗舰AI模型Behemoth。Meta的工程师们在显著提升其大型语言模型Behemoth的能力方面遇到困难,员工们质疑其相较前代模型的进步是否足以支撑公开发布。

在还处于早期开发时,Meta内部计划于4月发布Behemoth,以配合Meta首次为开发者举办的AI大会。Meta在该活动前发布了Llama AI模型系列中的两个小型模型,但更大的Behemoth版本发布被推迟至6月。现在,该模型发布时间又被推迟到秋季甚至更晚。

需要注意的是,扎克伯格及其他Meta高管并未公开承诺Behemoth的发布时间。公司最终可能决定提前发布Behemoth,包括推出一个功能受限的版本。但Meta的工程师和研究人员担心其表现不符合此前对外宣称的能力。

Meta曾公开“吹捧”Behemoth的能力,声称其在某些测试中已经超过OpenAI、Google和Anthropic的同类技术。但内部人士表示,该模型的性能受制于训练过程中的困难。

Meta发言人拒绝对此置评。

Meta将推迟发布旗舰AI模型Behemoth,引发了内部对于其数十亿美元AI投资方向的担忧。Meta计划今年资本支出最高可达720亿美元,其中大部分将用于实现CEO扎克伯格在AI方面的宏伟目标。

Meta将推迟发布旗舰AI模型Behemoth,股价盘中跌超3%__Meta将推迟发布旗舰AI模型Behemoth,股价盘中跌超3%

周四的消息出炉后,Meta股价盘中跌超3%,英伟达盘中也出现明显回落。

Meta不满AI产品组表现

Meta的第一代Llama模型由其基础AI研究团队开发,该团队主要由博士研究人员组成,并于2023年初对外发布模型及研究论文。然而此后,参与该论文的14名研究者中已有11人离开Meta公司。后续Llama模型则由另一团队开发。媒体报道称,Meta近期的一些Llama模型也存在问题。

4月发布的两个Llama模型起初在一个受欢迎的AI聊天机器人排行榜上表现良好,但后来被发现,提交至排行榜的并非公开发布的同一模型。

排行榜的代表称,Meta应更明确地说明他们提交的是一个针对测试进行过优化的定制模型。扎克伯格承认,Meta提交给排行榜的AI模型是专门优化过以便在第三方测试中取得好成绩的版本。

据知情人士称,Meta公司高层对开发Llama 4模型的团队表现感到失望,并将Behemoth进展缓慢归咎于该团队。因此,Meta正在考虑对其AI产品组进行重大管理调整。

未来AI模型的进步可能会比以往慢得多

Meta此前因快速追赶全球AI竞赛对手而受到赞誉,并在此过程中投入巨资,开发在WhatsApp、Instagram和Facebook上的聊天机器人技术。

Meta当前的困境也反映出其他顶尖公司在发布下一代AI先进模型过程中遇到的挫折或延误。一些研究人员认为,这种趋势表明未来AI模型的进步可能会比以往慢得多,且成本极高。“目前来看,各个实验室、各种模型的进展都非常小。”

OpenAI的下一代重磅模型GPT-5原本预计在2024年中期发布。去年 12 月,报道称该模型的开发进度落后于计划。今年2月,OpenAI首席执行官Sam Altman表示,将发布的是GPT-4.5,而GPT-5这一寄望于实现更大技术突破的模型还需数月时间。ChatGPT目前运行的是GPT-4o版本。OpenAI拒绝就GPT-5的发布时间发表评论。

Anthropic去年宣布正在研发名为Claude 3.5 Opus的新模型,是其去年发布并持续更新的AI模型的更大型版本。该模型仍未发布,一位发言人表示“即将推出”。

相关文章

中国AI再次刷屏硅谷!华尔街发出预警,直指美股泡沫

中国AI再次刷屏硅谷!华尔街发出预警,直指美股泡沫

中国AI,又给了硅谷亿点点震撼。 这两天,一条科技重磅消息,让外媒惊呼连连。 中国科技企业——月之暗面发布最新开源模型Kimi K2 Thinking,在HLE等测试中超越GPT-5、Claude...

Meta"分割一切"模型强势升级!"听懂人话",处理含上百物体一张图仅需30毫秒

Meta"分割一切"模型强势升级!"听懂人话",处理含上百物体一张图仅需30毫秒

美东时间19日周三,Meta发布第三代"分割一切"模型Segment Anything Models(SAM)——SAM 3,实现了重大突破,首次支持用户通过自然语言描述和图像示例来识别、分割和追踪视...

Grok 4遥遥领先,但马斯克想要得更多

Grok 4遥遥领先,但马斯克想要得更多

Grok4真的很强 近期马斯克发布了“世界上最强的AI模型”,有人直言道AGI在这里已经实现了。xAI 发布了两个版本,分别是 Grok 4 和 Grok 4 Heavy。两者都是推理模型,前者是...

谷歌Gemini 3模型获市场认可,Alphabet股价一度大涨超6%创新高

谷歌Gemini 3模型获市场认可,Alphabet股价一度大涨超6%创新高

Alphabet股价周三飙升5%,投资者看好谷歌最新发布的Gemini 3人工智能模型带来的竞争优势。 周二华尔街见闻提及,谷歌正式发布备受期待的AI模型Gemini 3,并于发布首日立即在谷歌搜索、...

史上最强编程模型Claude 5泄露,最慌的是黄仁勋?

史上最强编程模型Claude 5泄露,最慌的是黄仁勋?

2月2日,X上一位的知名AI博主Pankaj Kumar (@pankajkumar_dev),爆料了Anthropic的下一代旗舰模型Claude Sonnet 5。 这个模型代号为“Fenne...

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

好家伙……我真的是直接好家伙! 3月17日,楽天(乐天)集团正式发布了Rakuten AI 3.0模型,号称是“日本国内最大规模的高性能AI模型”。官方宣传的参数量为约7000亿,并且日语特化,Ap...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:BT86616点击复制并跳转微信