GPT-5发布了，到底有没有那么神？

客服微9964384312个月前 (08-09)财经知识168

GPT-5，终于在深夜出炉。

以为很震惊，以为很惊艳？确实有。

但先来看一张图：

_GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？

OpenAI到底是如何做到在全球直播的场合展示Benchmark，竟然能把52.8显示得比69.1都高，甚至这个69.1能跟30.8平齐的？？？

其它的不谈，单就这一点，开场直接号称“博士水平”的AI，就这么水灵灵地“按需缩放”坐标系，也是引得网友怒喷不已。

GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？_

甚至Altman都赶忙出来转移话题，称技术博客上是正确的……

_GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？

确实，技术博客确实是有所更正。

GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？_

但如此失误，着实不应该，毕竟大家都等了2年啊！

博士水平的AI，来了

不过有一说一，除了这个被大众诟病的致命失误之外，GPT-5在现场的表现还算是可圈可点。

在技术博客中，OpenAI开场直接一句：“迄今为止，这是我们最智能、最快速、最实用的模型，内置的思考能力让每个人都能拥有专家级智能。”

这次发布的GPT-5拥有四个版本：

GPT-5目前已面向普通用户提供免费、plus和Pro三种模式。

同时在API平台上，推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择。

不仅如此，承接昨天时隔6年的开源，OpenAI表示这次GPT-5面向所有人，免费！并且是博士水平的那种。

我们先来看下Benchmark。

最让人吸睛的，还是GPT-5在AIME 2025的表现，直接拿下满分的成绩。

GPT-5发布了，到底有没有那么神？__GPT-5发布了，到底有没有那么神？

其次就是编程能力，相较于o3和4o，GPT-5在思考模式加持之下，达到了74.9%的水平。

_GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？

除此之外，这个模型在多种多模态评测中表现出色，覆盖了图像、视频、空间理解和科学推理等方面。

更强的多模态能力，意味着ChatGPT在处理图片和其他非文字信息时更聪明了——比如看懂图表、总结一张演示照片的内容，或者回答关于图示的问题。

_GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？

而且比较罕见的是，第三方的大模型竞技场（Imarena.ai）也是及时跟进，直接发表声明：“全方面第一”。

具体而言，竞技场涉及的内容包括：文本、Web开发、视觉、编程、数学、创造力、长查询等。

GPT-5发布了，到底有没有那么神？__GPT-5发布了，到底有没有那么神？

由此可见，GPT-5从目前评测标准来看，确实是AI大模型的卫冕之王。

再看效果

成绩是一方面，但实际效果才是硬道理。

深谙此理的Sam Altman在自己的X账号上也是立马跟进，发布了由GPT-5生成的效果：

_GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？

并且Altman还表示，有GPT-5权限的用户，只需发送“use beatbot to make a sick beat to celebrategpt-5”即可体验。

不多不说，营销这块，Altman还是非常手拿把掐的。

不过在直播的现场演示过程中，GPT-5还是有不少惊艳的表现在身上的。

例如让GPT-5生成一个学语法的APP，效果是这样的：

GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？_

不要以为是简单的网站，除了可以完成市面上AI的交互之外，它在里面还可以内嵌一个小游戏（点击“Mouse&Cheese”）：

GPT-5发布了，到底有没有那么神？__GPT-5发布了，到底有没有那么神？

并且若是想改变APP里面的内容，只要一句话，瞬间（现场实测）就可以改变布局：

GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？_

对于更加庞大且复杂的项目，例如现场OpenAI展示了用GPT-5先编程出来的代码：

GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？_

在运行之后，便得到了一个3D效果的“世界”：

GPT-5发布了，到底有没有那么神？__GPT-5发布了，到底有没有那么神？

总而言之，从现场效果来看，GPT-5也是担得起“最聪明、最强编程”的大模型。

“观众”们买单吗？

从目前X上“观众”的反馈来看，讨论最激烈的就是前面我们提到的图表bug。

甚至有网友做了一张简单粗暴的Excel表格来讽刺这次的失误：

GPT-5发布了，到底有没有那么神？__GPT-5发布了，到底有没有那么神？

不过另一方面，老东家微软CEO火速出面站台，并配有一个“爱心”图片以表支持：

GPT-5发布了，到底有没有那么神？_GPT-5发布了，到底有没有那么神？_

再如开发者们常用的VS Code，官方也是Day 0无缝衔接GPT-5：

GPT-5发布了，到底有没有那么神？__GPT-5发布了，到底有没有那么神？

不过对于普罗大众来说，反馈声音最大的莫过于：“说好的免费，我的ChatGPT咋没有呢？”

总而言之，用户到底买不买单，实测效果到底有没有那么神，需要让子弹再飞一会了。

1、https://openai.com/index/introducing-gpt-5/

2、https://x.com/EgeErdil2/status/1953505551570415718

标签: GPT-5 AI技术 OpenAI 大模型人工智能

返回列表

上一篇：清流｜释永信海外资本局：少林寺至少4600万流向澳洲海外资产归属权成谜

下一篇：如何把美团月付的钱套出来？这几种方法你不能错过！

阿里、字节，死磕一个昔日“全军覆没”的赛道

这些C端的AI健康应用，能将晦涩难懂的医学和健康知识，转化成通俗易懂的表达。对着饮食拍照，AI能快速估算卡路里并给出饮食建议；面对满是↑↓符号的化验单，AI能用大白话解读转氨酶升高、血糖异常等指标含...

中国有对标美股AI产业链的企业吗？

Wind做了一个美股AI产业链的图谱，中国有对标的企业吗？其实好消息是，中国和这些巨头对标的企业还不少，有的已经部分领先。先把原图拆解一下（By Kimi）：一、最上层：To C 端 AI 模...

智谱 VS MiniMax：国产大模型双雄上市记

本文系基于公开资料撰写，仅作为信息交流之用，不构成任何投资建议 48小时内，两家国产大模型巨头——智谱与MiniMax，先后敲响港交所的钟声，属于中国AI的资本叙事，悄然进入新章。今天我们来拆解对...

豆包千问DeepSeek，没上苹果先“上车”

最近，车圈和AI企业间再一次传出“牵手”消息，这一次的主角，是特斯拉、字节跳动和深度求索（DeepSeek）。特斯拉中国官网更新的《特斯拉车机语音助手使用条款》显示，全新上市的特斯拉Model Y...

姚顺雨“露脸”，和唐杰杨植麟探讨AGI之路

“我相信今年可能是AI for Science的一个爆发年，因为很多能力大大提升，我们可以做更多的事情。”在昨日举行的AGI-Next前沿峰会上，清华大学教授、智谱首席科学家唐杰这样说道。据了解，...

外滩大会最有“人味”圆桌论坛：不完美创业者才能做出伟大产品

红星资本局9月12日消息9月10日至13日，以“重塑创新增长”为主题的2025 Inclusion·外滩大会（下称“外滩大会”）在上海市举办。 9月12日，在“全球AI投资展望——AI创业的爆发与中...

发表评论

客服微信：BT86616点击复制并跳转微信

六六科学博客

GPT-5发布了，到底有没有那么神？

相关文章

阿里、字节，死磕一个昔日“全军覆没”的赛道

中国有对标美股AI产业链的企业吗？

智谱 VS MiniMax：国产大模型双雄上市记

豆包千问DeepSeek，没上苹果先“上车”

姚顺雨“露脸”，和唐杰杨植麟探讨AGI之路

外滩大会最有“人味”圆桌论坛：不完美创业者才能做出伟大产品

发表评论

豫ICP备2024079567号-1

Powered By Z-BlogPHP. Theme by TOYEAN.

GPT-5发布了，到底有没有那么神？

相关文章

发表评论 取消回复

Powered By Z-BlogPHP. Theme by TOYEAN.

发表评论