OpenAI的奥特曼昨晚发布了GPT-5,从数字上来看应该是一次大更新。毕竟GPT‑4大了一个数,比GPT‑3大了两个数(手头狗头)。
先说核心升级功能:再也不用选模型版本了
松松认为,GPT-5这波升级,就是自动判断你的需求、匹配最适合的模型版本。普通人再也不用选模型版本了,GPT-5会根据每个人“智商”匹配不同版本。(手头狗头)
而国内大模型呢?还得手动选 Pro / Lite / 商用 / 开源版,其实主要目的就是为了省算力。这就导致用户每次都要手动选一个版本。而OpenAI不一样,背后是英伟达顶级显卡的待遇,根本不差那点算力。所以它能把复杂的模型“全都堆一起”,再来个自动调度。
GPT-5共发布了4个版本:
GPT-5(标准版):能处理复杂的逻辑任务和推理,是性能最全面的版本,要给钱才能用。
GPT-5 Mini(迷你版):轻量的版本,速度快、资源省、成本低。
GPT-5 Nano(纳米版):最瘦别的版本,速度爆快、延迟极低。
GPT-5 chat(聊天版):企业级长对话应用,能用文本、图像甚至工具上下文做接续。
不过这些都不重要了,它会根据你的内容输出自动匹配什么版本。
GPT-5缺点:
(1)普通中国人用不了
GPT-5搞了个“统一调度器”取代多模型,普通用户以为用的是GPT-5,实际上系统会根据你的内容自行判断,自动降级,只有付费用户才能长期用。免费版有用量限制,超了自动切换到小模型了。另外普通国人用不了,因为网页都打不开。
(2)还是会胡说八道
虽然乱说话的几率比之前低了,但还GPT-5还是或胡编乱造。尤其是你问一些冷门事件、专业领域,它就开始乱编了,不过呢要比之前好多了。
(3)中文能力还是不如通义千问
用AI写文章、写短视频脚本说实话,不如国内的AI大模型,GPT-5出来的东西还是有股外国味。不过GPT的最大一个优势呢,是啥都干啥,不被屏蔽,不像Deepseek说两句就:我们换个话题聊一聊吧。
(4)图像理解能力可能不如GPT-4o和通义千问
GPT-5侧重文本推理,而理解视频、图像还差点事,比如你放他分析下中国互联网公司财报,复杂的网页,有时候还是不太行。现在通义甚至能看视频、看动图,这点OpenAI还没完全跟上。
GPT-5更新的功能总结:
1,“统一调度器”取代多模型
以后不分什么基础班、PRO版、思考版、迷你版了,系统会根据你的内容自行判断(前提是要给钱)。我感觉这功能是个趋势。现在的大模型各个版本太多了,还不如就一个版本,用户也好理解。
2,编程能力提升了
前端生成更好看。如下图所示,确实是好看了,反正官网给的案例是这样的,他说啥就是啥呗。 SWE-bench Verified 评估得分74.9%,比之前的o3版本略微提升,Aider polyglot 编辑率高达 88%。
3,回答速度更快、脑回路更清晰了。
这个不好评价,他说啥就是啥呗。他们官网给了案例,大意是说GPT-5写的“诗”比之前的版本更牛逼了。英文的诗咱也不懂哈,但从排版和字数上来看,是比老版本更清晰了。
4,支持256K长文本
这个比通义千问略逊色,通义好歹能支持1M(1500万字)的文档了,而GPT-5还是不行。不过也比之前更好了,因为通义千问是在有条件下才支持1M,而GPT-5不用,上来就能长文本。不过你要用长文本的话,估计要付费了。不过也很好了, 一大段扫文档、合同、报告都能一口气弄完了。
5,第三方插件接入
支持视觉、写作、医疗题答,比如Google日历、Gmail,能主动帮你安排提成、提醒啥的。
当然还有其他一些细节功能提升,比如:
(1)幻觉率降低45%,思考模式下再减少80%,
(2)API 新增两个关键参数:verbosity(高/中/低)、reasoning_effort(minimal 可快速输出)
还有一些我不列了,英文翻译成中文,太麻烦了,而且和普通创业者没关系的。
写在最后:
GPT‑5才发布一天,网上都给锤爆了,什么史诗级更新、引领未来,但我相信用过GPT‑5的人并不多,而且随着时间推移,国内的AI大模型会追的越来越紧!
源自:卢松松
未经允许不得转载:致远同盟 » GPT-5有多强?4个缺点+5个优点全在这了