切换到宽版
  • 376阅读
  • 2回复

[智能应用]华为盘古大模型5.5问世!推理、智能体能力大爆发 [7P] [复制链接]

上一主题 下一主题
离线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君
 

发帖
165308
金币
471100
道行
20030
原创
766
奖券
350
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20200(小时)
注册时间: 2012-06-21
最后登录: 2025-12-13
— 本帖被 兵马大元帅 执行加亮操作(2025-06-22) —
用户被禁言,该主题自动屏蔽!
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
离线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君

发帖
165308
金币
471100
道行
20030
原创
766
奖券
350
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20200(小时)
注册时间: 2012-06-21
最后登录: 2025-12-13
只看该作者 沙发  发表于: 06-21
用户被禁言,该主题自动屏蔽!
如何不发帖就快速得到金币道行
 
在线jjybzxw

UID: 551814


发帖
210619
金币
601673
道行
2006
原创
2438
奖券
3180
斑龄
40
道券
1167
获奖
0
座驾
设备
摄影级
在线时间: 46259(小时)
注册时间: 2008-10-01
最后登录: 2025-12-13
只看该作者 板凳  发表于: 06-21
华为盘古大模型5.5的发布确实是国产大模型领域的一个重要里程碑。这个系列的模型专注于实际产业问题的解决,并且已经在市场上获得了广泛的认可。盘古大模型5.5包含了五大基础模型,覆盖了自然语言处理(NLP)、多模态、预测、科学计算和计算机视觉(CV)领域,这进一步推动了大模型在行业数智化转型中的核心作用。

在NLP领域,盘古5.5主要包含三大模型:盘古Ultra MoE、盘古Pro MoE和盘古Embedding,以及高效推理策略和深度研究产品DeepDiver。盘古Ultra MoE是一个准万亿级别的模型,拥有7180亿参数,是国内领先、比肩世界一流水平的MoE深度思考模型。它在模型架构和训练方法上进行了创新性设计,成功实现了准万亿MoE模型的全流程训练。盘古Pro MoE是一个72B A16B的模型,在SuperCLUE榜单上表现优异,比肩6710亿参数的DeepSeek-R1。盘古Embedding是一个7B级别的小模型,在学科知识、编码、数学和对话能力方面均优于同期同规模模型。

此外,盘古大模型5.5还包括了自适应快慢思考合一的高效推理方案,提升了推理效率和准确性。盘古DeepDiver作为开放域信息获取Agent,展现了在科学助手、个性化教育以及复杂的行业报告调研等场景中的高阶能力。

盘古5.5还覆盖了预测、科学计算和CV领域的大模型,如采用triplet transformer统一预训练架构的盘古预测大模型,与深圳气象局合作升级的「智霁」大模型,以及全新发布的300亿参数视觉大模型。这些模型在各自的领域展现出强大的落地价值和变革潜力。

总的来说,华为盘古大模型5.5通过多样化的架构与算法创新,在核心技术能力上达到了领先水平,并在多个关键应用领域展现出强大的实力。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个