GPT-5发布:OpenAI的最新力作
当地时间8月7日,OpenAI正式推出了其最新的基础大模型GPT-5。这款模型被OpenAI誉为“迄今为止最智能、最快、最有用的模型”,具备内置的思维能力,能够将专家级的智能交到每个人手中。
GPT-5的主要特点
1. 多领域性能提升:
- 编程:GPT-5在编程方面表现出色,只需简单的提示,就能生成网站、应用程序和游戏。例如,要求创建一个滚球小游戏,GPT-5能够根据提示生成一个简单的小游戏。
- 写作:在写作方面,GPT-5可以用于起草和编辑报告、电子邮件、备忘录等。根据OpenAI的演示,GPT-5生成的短诗更具画面感和意象,情感表达更加细腻,语句也更加通顺。
- 数学和科学:GPT-5在竞赛数学、专家级数学、博士级科学问题等基准测试中表现出色,得分远超前代模型。
- 多模态能力:GPT-5在视觉推理和基于视频的多模态推理方面也有所提升,得分超过前代模型。
2. 减少幻觉和错误:
- GPT-5在减少幻觉方面取得了显著进展,幻觉率仅为前代模型的六分之一。在无法回答问题时,GPT-5会更倾向于承认自身的局限性,而不是给出错误的答案。
- 在使用网络搜索时,GPT-5出现错误事实的概率比前代模型低45%,在思考时出现错误事实的概率低80%。
3. 更自然的对话:
- GPT-5减少了对人类的“阿谀奉承”,在对话中的表现更像人类的“朋友”而不是一个“人工智能”。相关评估中,“阿谀奉承”的概率从14.5%降至6%以下。
4. 更高效的输出:
- GPT-5在生成内容时,输出的token数量减少了50%~80%,这使得生成的内容更加精炼和准确。
定价与可用性
GPT-5、GPT-5-mini、GPT-5-nano三款模型提供API服务。具体定价如下:
- GPT-5:输入每百万token 1.25美元,输出每百万token 10美元。
- GPT-5 mini:输入每百万token 0.25美元,输出每百万token 2美元。
这些价格均低于GPT-4.1和o4-mini的定价。
市场反应与竞争
尽管GPT-5在多个基准测试中表现出色,但其发布后仍面临一些质疑。特斯拉CEO埃隆·马斯克对GPT-5的能力表示怀疑,并指出xAI的Grok 4在某些基准测试中表现优于GPT-5。xAI的一名联合创始人也在社交媒体上表示,Grok 4在ARC-AGI等基准测试中的表现超过GPT-5,并将在接下来几周展示更多新进展。
此外,GPT-5的推出节奏相比前几代有所放缓。从GPT-4推出到GPT-5面世,间隔了大约两年半的时间。在这段时间内,OpenAI还推出了4o、o1、o3、o4系列模型,探索大模型在推理方面的能力。
尽管如此,GPT-5的发布仍然是人工智能领域的一个重要里程碑。OpenAI表示,ChatGPT在全球已有超过7亿用户,这表明大语言模型在实际应用中的广泛影响力。
---
总的来说,GPT-5的发布展示了OpenAI在大语言模型领域的持续创新和技术进步。然而,随着竞争的加剧和技术的发展,未来的人工智能领域将更加充满挑战和机遇。