409阅读
2回复

[智能应用]“GPT-5对人类的阿谀奉承减少了” [复制链接]

上一主题下一主题查看指定楼层

在线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君

发帖: 165308

金币: 471064

道行: 20030

原创: 766

奖券: 350

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 20200(小时)
注册时间: 2012-06-21
最后登录: 2025-12-11

只看楼主正序阅读使用道具楼主发表于: 08-08

— 本帖被兵马大元帅执行加亮操作(2025-08-11) —

用户被禁言,该主题自动屏蔽!

山庄提示：道行不够，道券不够？---☆点此充值☆

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 210111

金币: 596977

道行: 2005

原创: 2438

奖券: 3180

斑龄: 40

道券: 1167

获奖: 0

座驾

设备

摄影级

在线时间: 46174(小时)
注册时间: 2008-10-01
最后登录: 2025-12-12

只看该作者板凳发表于: 08-08

GPT-5发布：OpenAI的最新力作

当地时间8月7日，OpenAI正式推出了其最新的基础大模型GPT-5。这款模型被OpenAI誉为“迄今为止最智能、最快、最有用的模型”，具备内置的思维能力，能够将专家级的智能交到每个人手中。

GPT-5的主要特点

1. 多领域性能提升：
   - 编程：GPT-5在编程方面表现出色，只需简单的提示，就能生成网站、应用程序和游戏。例如，要求创建一个滚球小游戏，GPT-5能够根据提示生成一个简单的小游戏。
   - 写作：在写作方面，GPT-5可以用于起草和编辑报告、电子邮件、备忘录等。根据OpenAI的演示，GPT-5生成的短诗更具画面感和意象，情感表达更加细腻，语句也更加通顺。
   - 数学和科学：GPT-5在竞赛数学、专家级数学、博士级科学问题等基准测试中表现出色，得分远超前代模型。
   - 多模态能力：GPT-5在视觉推理和基于视频的多模态推理方面也有所提升，得分超过前代模型。

2. 减少幻觉和错误：
   - GPT-5在减少幻觉方面取得了显著进展，幻觉率仅为前代模型的六分之一。在无法回答问题时，GPT-5会更倾向于承认自身的局限性，而不是给出错误的答案。
   - 在使用网络搜索时，GPT-5出现错误事实的概率比前代模型低45%，在思考时出现错误事实的概率低80%。

3. 更自然的对话：
   - GPT-5减少了对人类的“阿谀奉承”，在对话中的表现更像人类的“朋友”而不是一个“人工智能”。相关评估中，“阿谀奉承”的概率从14.5%降至6%以下。

4. 更高效的输出：
   - GPT-5在生成内容时，输出的token数量减少了50%~80%，这使得生成的内容更加精炼和准确。

定价与可用性

GPT-5、GPT-5-mini、GPT-5-nano三款模型提供API服务。具体定价如下：
- GPT-5：输入每百万token 1.25美元，输出每百万token 10美元。
- GPT-5 mini：输入每百万token 0.25美元，输出每百万token 2美元。

这些价格均低于GPT-4.1和o4-mini的定价。

市场反应与竞争

尽管GPT-5在多个基准测试中表现出色，但其发布后仍面临一些质疑。特斯拉CEO埃隆·马斯克对GPT-5的能力表示怀疑，并指出xAI的Grok 4在某些基准测试中表现优于GPT-5。xAI的一名联合创始人也在社交媒体上表示，Grok 4在ARC-AGI等基准测试中的表现超过GPT-5，并将在接下来几周展示更多新进展。

此外，GPT-5的推出节奏相比前几代有所放缓。从GPT-4推出到GPT-5面世，间隔了大约两年半的时间。在这段时间内，OpenAI还推出了4o、o1、o3、o4系列模型，探索大模型在推理方面的能力。

尽管如此，GPT-5的发布仍然是人工智能领域的一个重要里程碑。OpenAI表示，ChatGPT在全球已有超过7亿用户，这表明大语言模型在实际应用中的广泛影响力。

---

总的来说，GPT-5的发布展示了OpenAI在大语言模型领域的持续创新和技术进步。然而，随着竞争的加剧和技术的发展，未来的人工智能领域将更加充满挑战和机遇。