切换到宽版
  • 19阅读
  • 2回复

[数码讨论]大模型最强生态?今天有答案了[5P] [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
175838
金币
336806
道行
2004
原创
2411
奖券
2855
斑龄
36
道券
1035
获奖
0
座驾
设备
摄影级
在线时间: 39655(小时)
注册时间: 2008-10-01
最后登录: 2025-08-10
只看楼主 倒序阅读 使用道具 楼主  发表于: 前天 09:10

数百万大模型用户如今可以在亚马逊云科技上部署OpenAI的最新推理模型,这一消息引发业界震动。

8月6日,OpenAI最新发布的两款开放权重基础模型gpt-oss-120b与gpt-oss-20b,首次可通过Amazon Bedrock和Amazon SageMaker AI访问,帮助客户快速构建生成式AI应用;与此同时,亚马逊投资的Anthropic最新一代Claude Opus 4.1和Claude Sonnet 4混合推理模型也刚上线Bedrock平台。两家AI领域明星级产品的落地访问,奏响了亚马逊云科技在Agentic AI时期的“双响炮”。

目前,Amazon Bedrock成为汇集了OpenAI、Anthropic、DeepSeek、Meta、Mistral AI等13家顶级AI公司大模型的部署托管平台。一个用户思维惯性也正显现:每当大模型明星产品重磅发布后,用户都能无延时地通过Amazon Bedrock或SageMaker平台调用它们。以至于有人戏称,大模型争霸赛可以直接在Amazon Bedrock上争了。这背后究竟有怎样的战略考量和市场逻辑?

“选择大于一切”,AI巨变时代的战略定力

其实早在大模型争霸赛之前,亚马逊云科技就确定了“选择大于一切”的战略方向。

2023年4月,亚马逊云科技推出Amazon Bedrock平台,率先打破行业对“单一终极AI模型”的追逐,以多样化模型奠定基础。2024年re:Invent大会上,Andy Jassy提出“Choice Matters”战略,其逻辑背景是,没有一款大模型能“包打一切”、适应全部场景,如今这一前瞻性布局已形成包含上百款商业及开源模型的庞大生态,彰显了差异化技术路线的长期价值——随着智能体Agentic AI的到来,用户对具备复杂任务执行能力的多样化模型需求持续增长,多元模型选择和多模型协作将是一种趋势。

但当时大模型企业风头正劲,外界目光普遍聚焦在模型性能竞赛中。

而当狂热褪去,亚马逊云科技对市场的商业洞察在两年后得到Gartner的印证。Gartner在2025年预测,到2027年将有80%的中国企业采用多模型策略,确保客户在云上的多模型选择权变得至关重要。

客户自由选择的前提是有的可选。“选择大于一切”战略方向确立的同时,亚马逊云科技发布了模型托管平台Amazon Bedrock。此后,Amazon Bedrock成为每个季度亚马逊云科技财报文字描述中出现频率几乎最高的业务词组,每次出现都意味着创新进展。

当前Amazon Bedrock有217款大模型可供选择调用,回顾各大模型入驻的时间线,可以用步步为营来形容:2023年4月,Anthropic模型上线Bedrock平台,同时还有AI21 Labs模型;7月,Meta的Llama模型入驻;9月,Stability AI上线可用,同时亚马逊云科技自研的Nova系列产品上线;11月,Cohere入驻;2024年2月,Mistral AI入驻;2025年2月,DeepSeek-R1上线……直到眼下OpenAI的加入,让“选择大于一切”的战略拼图更加完整。有人戏称,现在就差谷歌的Gemini和马斯克的Grok,Amazon Bedrock就可以“集齐龙珠”了。

2024年,来自Gartner的统计显示:有三分之二受访企业高管认为生成式AI将带来颠覆性变革,其热潮促使大量试点及概念验证(PoC)项目启动,然而仅有41%的项目能进入生产阶段。换句话说,“模型打榜”的癫狂氛围让企业纷纷一拥而上,却受困于模型选择背后的成本预算、数据的迁移与管理、实施中的ROI投资回报等问题,导致多一半的项目折戟。

“选择大于一切”这一理念来源于亚马逊云科技强大的云服务经验。客户面对大模型选择时,需要在时延、成本、精度三个层面上找到平衡。通常,小的模型成本低、速度快,但精度也低;大的模型恰好相反。模型也不是越大越好,而是要选择适配客户业务、能带来商家价值增量的组合。

就像OpenAI刚开放的权重基础模型gpt-oss-120b和gpt-oss-20b,OpenAI旗下大模型主要以GPT和o系列命名,此次开源针对的是后者,而非核心GPT。它能在高端笔记本电脑,甚至手机上运行,且性价比更高,进一步满足下沉需求。

OpenAI针对这个“强大的带有推理能力的全新开放权重(open-weight)模型”表示,发布开源系统的原因之一是一些企业和个人更倾向于在自有计算机硬件上运行这类技术。不难看出,如果说一年前业界还热衷于对开源模型和闭源模型的模式之争,现在的热度已转向如何能够以更低成本、更便捷地为终端客户服务。

在Amazon Bedrock上,用户非常清楚,不仅有适合单个场景的高性价比和能力适配的模型,也能完成多模型参与场景匹配实现最佳效果。而这一最强生态中,亚马逊云科技亲自下场自研的Nova系列四大模型也极为关键,通过与其他优质模型适配,形成了不同使用场景下的模型组合。

例如,在复杂的翻译系统中,DeepSeek R1和Claude 3.7负责处理难度大的专业翻译,Nova Lite处理日常用语;在聊天机器人中,Nova Lite先理解用户说什么,Claude再负责处理复杂问题;做深度研究时,让DeepSeek R1和Claude 4专门负责推理,Claude Haiku处理具体的函数调用……

亚马逊云科技始终坚持“选择大于一切”,一方面,客户可以通过更多的选择最大化地实现业务价值;另一方面,亚马逊云科技也可以通过这一战略在生成式AI的市场竞争中赢得成功。这也是它区别于其他可能只提供单一模型选择的云服务提供商之处。

AI比拼的不是冲刺速度

当模型厂商还在纠结是否开放,AWS已经建立起了最完整的AI朋友圈——这意味着最强大的生态,也意味着最庞大的用户基础。

OpenAI现已正式在Amazon Bedrock与Amazon SageMaker AI上线其开放权重模型,用户可以通过Bedrock AgentCore部署并运行高效Agent智能体;也可以在机器学习平台SageMaker上结合开放权重模型与完善的工具链实现模型的预训练、评估、微调与部署。目前SageMaker平台上大约有185款开源模型供选择,加上Bedrock平台上的217款商业模型,一共有大约400款可选。

据测算,目前在Amazon Bedrock上运行的OpenAI两个开放权重模型中的大尺寸模型,在性价比方面是同类Gemini模型的3倍、DeepSeek-R1的5倍,以及OpenAI自家的o4模型的两倍。另据OpenAI公布,gpt-oss-120b模型在竞赛编码、工具调用基准测试中的得分接近或超过自家闭源的o4-mini模型。

成本的下降是推进AI发展进入拐点的重要因素。斯坦福大学2025年人工智能报告指出,过去两年推理成本下降了约280倍。推理成本的极速降低使得Agentic AI应用的规模化部署成为可能。根据不久前亚马逊云科技中国峰会上亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松的判断,如今正处于AI发展的拐点——即Agentic AI爆发的前夜,将从“我问AI答”,“我说AI写”,发展到“我说AI做”。

得益于OpenAI的开放权重模型兼具紧凑体量与强大性能,并具备先进的推理能力,支持调节推理深度与思维链输出,可将复杂问题分解为清晰的逻辑步骤,因而非常适用于Agent工作流、代码生成、科学分析和数学问题求解等场景。其较小的模型甚至能在手机端应用,实现“口袋里的AI”。而Anthropic最新一代Claude Opus 4.1和Claude Sonnet 4模型不仅能持续处理复杂的长周期任务,更能驱动AI智能体实现“数小时工作分钟级完成”的突破性效能。

但总体看来,生成式AI现在还处于非常早期的阶段。亚马逊CEO安迪·贾西在今年二季度财报分析师会议上抛出一个有关大模型部署成本“头重脚轻”的观点。他认为,现在AI部署成本大部分产生于模型训练阶段,也就是“头”的部分,但当市场趋于成熟、有更多用户将AI应用部署到生产上并形成规模化时,80%-90%的AI成本将出现在推理环节。届时用户将更关注所使用的计算和硬件,更重视性价比、安全性与系统稳定。

以这个趋势判断回头去看大模型竞赛,决定AI竞赛最终胜负的,并非一时的冲刺速度,或者起跑时的身位,而是全面的战略耐力。现在下结论、排座次为时尚早。

亚马逊云科技从自研芯片到AI应用的全栈布局思路,将把握住这个趋势性的发展脉络。它针对生成式AI采用三层技术栈,搭建了一个完整的支持系统。在架构上,最底层是以英伟达GPU和自研芯片为代表的基础设施,用于模型训练及推理;中间层的核心是Amazon Bedrock托管服务;顶层是以Amazon Q、Kiro编程助手为代表的开箱即用的生成式AI应用工具。

以底层基础设施为例,亚马逊云科技在与英伟达紧密合作的同时,自研芯片迭代加快,其专为大规模模型训练设计的第二代AI芯片Trainium2号称“在性价比上比其他GPU供应商高出30%到40%”,并已成为Anthropic等公司新一代模型训练的支柱。这种成本优势将在客户大规模部署AI应用时变得至关重要。

此外,亚马逊云科技是目前稳定性排名第一的云服务商。在Frost&Sullivan最新报告《云服务韧性由何决定?》中,亚马逊云科技以99.99%的超高可用性,成为中国唯一达到“四个九”标准的云服务提供商,其稳定性较行业平均水平高出5倍。而Amazon Bedrock平台上的安全护盾Guardrails,通过可配置安全策略可拦截高达88%的有害内容,提升第三方模型的使用安全性。

庞大的客户基础与生态将是最终的护城河。安迪·贾西提醒投资者,生成式AI的推理工作负载最终将像计算、存储和数据库一样,成为云服务的一个基础构建模块,“大家肯定希望把AI应用和现有系统放一起。今天,在AWS上的应用和数据,比其他所有平台加起来还多。”

亚马逊云科技是目前全球最大的云厂商,第二名的规模大约是其65%。践行“选择大于一切”,亚马逊云科技用三年时间证明了多模型战略的远见,这带来的不仅是规模效应,而且这种与客户现有IT架构的深度绑定的模式,将使其在AI应用规模化普及时拥有天然的客户黏性优势——这在AI竞赛新篇章中至关重要。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
175838
金币
336806
道行
2004
原创
2411
奖券
2855
斑龄
36
道券
1035
获奖
0
座驾
设备
摄影级
在线时间: 39655(小时)
注册时间: 2008-10-01
最后登录: 2025-08-10
只看该作者 沙发  发表于: 前天 09:12
亚马逊云科技:以“选择大于一切”战略引领生成式AI新时代

一、事件背景:OpenAI与Anthropic最新模型上线Amazon Bedrock

2025年8月6日,OpenAI正式将其最新发布的开放权重基础模型gpt-oss-120b与gpt-oss-20b部署在Amazon Bedrock和Amazon SageMaker AI平台上。与此同时,亚马逊投资的Anthropic也上线了其新一代模型Claude Opus 4.1和Claude Sonnet 4,标志着亚马逊云科技在Agentic AI时代的“双响炮”战略正式落地。

这一事件不仅为数百万大模型用户提供了最新的AI推理能力,也进一步巩固了Amazon Bedrock作为全球最大AI模型托管平台的地位。

---

二、平台战略:Amazon Bedrock成为AI模型生态的核心枢纽

1. 平台现状与模型生态
- 覆盖厂商:目前Amazon Bedrock已集成OpenAI、Anthropic、DeepSeek、Meta、Mistral AI等13家顶级AI公司的模型。
- 模型数量:截至2025年,Amazon Bedrock可调用217款商业模型,SageMaker平台支持185款开源模型,合计约400款模型,形成最完整的AI模型生态。
- 用户惯性思维:每当有新模型发布,用户第一时间想到的是通过Amazon Bedrock或SageMaker调用,形成“大模型争霸赛直接在Bedrock上进行”的行业共识。

2. 模型上线时间线(关键节点)
| 时间 | 上线模型 |
|------|----------|
| 2023年4月 | Anthropic、AI21 Labs |
| 2023年7月 | Meta Llama |
| 2023年9月 | Stability AI、Nova系列 |
| 2023年11月 | Cohere |
| 2024年2月 | Mistral AI |
| 2025年2月 | DeepSeek R1 |
| 2025年8月 | OpenAI gpt-oss系列 |

---

三、战略核心:“选择大于一切”的长期主义布局

1. 战略提出与演进
- 2023年4月:亚马逊云科技推出Amazon Bedrock,打破对“单一终极AI模型”的追逐。
- 2024年re:Invent大会:CEO Andy Jassy提出“Choice Matters”战略,强调没有一款模型能包打一切。
- 2025年Gartner印证:预测到2027年,80%中国企业将采用多模型策略,验证亚马逊云科技的前瞻性。

2. 战略逻辑
- 模型不是越大越好:需在时延、成本、精度之间找到平衡。
- 业务适配优先:选择能带来商家价值增量的模型组合,而非盲目追求性能。
- 多元模型协作:随着Agentic AI的发展,多模型协同将成为趋势。

---

四、技术亮点:OpenAI新模型与Claude系列的差异化优势

1. OpenAI gpt-oss系列
- 定位:非核心GPT系列,为开放权重模型,可在本地运行。
- 性能表现:
  - gpt-oss-120b在竞赛编码、工具调用测试中得分接近或超过自家闭源模型o4-mini。
  - 性价比:比Gemini模型高3倍,比DeepSeek-R1高5倍,比自家o4模型高2倍。
- 适用场景:支持推理深度调节与思维链输出,适用于Agent工作流、代码生成、科学分析、数学问题求解等。

2. Anthropic Claude Opus 4.1 & Sonnet 4
- 能力亮点:
  - 持续处理复杂长周期任务。
  - 支持“数小时工作分钟级完成”的智能体效能。
- 部署方式:已上线Amazon Bedrock,支持快速构建AI应用。

---

五、成本与部署趋势:从训练主导到推理主导

1. 成本结构变化
- 当前:AI部署成本集中在模型训练阶段。
- 未来趋势(安迪·贾西观点):
  - 当AI应用进入规模化阶段,80%-90%成本将出现在推理环节。
  - 用户将更关注:
    - 使用的计算与硬件
    - 性价比
    - 系统稳定性
    - 安全性

2. 成本下降趋势
- 斯坦福报告(2025):过去两年推理成本下降约280倍。
- 意义:极大推动Agentic AI规模化部署,进入“我说AI做”的新阶段。

---

六、全栈技术布局:三层架构支撑生成式AI发展

1. 底层基础设施
- 合作与自研并重:
  - 与英伟达GPU合作
  - 自研芯片Trainium2:专为大规模模型训练设计,性价比比其他GPU高30%-40%
- 客户价值:在大规模AI部署时提供显著成本优势

2. 中间层:Amazon Bedrock托管服务
- 核心功能:
  - 多模型统一调用接口
  - 支持AgentCore部署高效智能体
  - 提供安全护盾Guardrails,拦截88%有害内容

3. 顶层:开箱即用AI应用工具
- 代表产品:
  - Amazon Q:企业级AI助手
  - Kiro编程助手:代码生成与优化工具

---

七、市场前景与竞争格局

1. 亚马逊云科技的竞争优势
- 全球最大云厂商:市场份额约为第二名的1.5倍(65%)
- 超高稳定性:可用性达99.99%,中国唯一“四个九”标准云服务商
- 客户黏性:与现有IT架构深度绑定,形成天然护城河

2. 未来发展方向
- AI成为基础构建模块:像计算、存储、数据库一样成为云服务标配
- 客户偏好:更倾向于将AI应用与现有系统整合
- 亚马逊云科技定位:成为“AI+企业系统”的一体化平台

---

八、结语:AI竞赛的胜负在于战略耐力,而非短期冲刺

亚马逊云科技凭借“选择大于一切”的战略定力,在生成式AI浪潮中展现出强大的生态构建能力与技术整合能力。它不仅提供最丰富的模型选择,还通过自研芯片、托管平台、应用工具构建了完整的三层技术栈。

在Agentic AI爆发前夜,亚马逊云科技正站在AI发展的拐点,以“我说AI做”的新范式开启智能时代新篇章。

> “决定AI竞赛最终胜负的,并非一时的冲刺速度,而是全面的战略耐力。”
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
149373
金币
314509
道行
20030
原创
757
奖券
194
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17587(小时)
注册时间: 2012-06-21
最后登录: 2025-08-10
只看该作者 板凳  发表于: 前天 12:54
全球大模型生态格局:头部企业技术突破与场景落地并进
当前大模型生态呈现多强竞争态势,国际巨头与国内企业在技术迭代、场景落地及生态构建上加速布局。Anthropic的Claude4系列凭借编程、推理和Agent能力树立行业标准,成为智能体开发的核心支撑14。而OpenAI最新发布的GPT-5通过“基础模型+深度推理模型+实时路由器”的统一架构,实现效率与精度的双重提升,其编程能力在SWE-bench Verified测试中得分74.9%,并新增交互人格、跨平台集成等功能,推动AI向“按需软件”时代迈进23。国内方面,微美全息(WIMI.US)聚焦多模态AI与硬件协同,自研开发引擎提升虚实交互技术,形成差异化竞争力14。

大模型核心能力与生态拓展方向
技术突破:多模态融合与效率优化
GPT-5首次实现文本、图像、音频、视频的原生级融合,并通过实时路由器技术动态匹配任务复杂度,减少算力浪费3。Claude4则以长时任务处理能力见长,成为复杂智能体开发的底层依赖1。国内企业如微美全息通过AI视觉算法强化环境感知与手势识别,推动交互自然化1。

场景落地:从工具到生态的渗透
OpenAI将GPT-5集成至微软Copilot生态,并推出教育专属的ChatGPT Study模式,覆盖编程、医疗、学习等领域24。Anthropic则通过Agent技术赋能工业、文娱等赛道,拉动软硬件产业链协同1。三星70亿美元投建美国芯片封装工厂,进一步完善AI硬件生态1
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个