查看完整版本: [-- 华为发布AI推理创新技术UCM,计划于9月开源 --]

武当休闲山庄 -> 数码讨论 -> 华为发布AI推理创新技术UCM,计划于9月开源 [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

jjybzxw 2025-08-13 08:42

IT之家 8 月 12 日消息,今日,华为正式发布 AI 推理创新技术 UCM(推理记忆数据管理器)。

据IT之家了解,作为一款以 KV Cache 为中心的推理加速套件,UCM 融合了多类型缓存加速算法工具,分级管理推理过程中产生的 KV Cache 记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每 Token 推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智慧金融 AI 推理加速应用试点,并已取得成果。

华为计划于 2025 年 9 月正式开源 UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有 Share Everything (共享架构) 存储厂商和生态伙伴。


jjybzxw 2025-08-13 08:43
华为发布 AI 推理创新技术 UCM:推动智慧金融发展

华为在8月12日正式发布了AI推理创新技术UCM(推理记忆数据管理器)。这一技术的发布标志着华为在AI领域的又一重大突破,特别是在智慧金融领域的应用。

UCM 技术概述

UCM是一款以KV Cache为中心的推理加速套件,融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据。通过这种方式,UCM能够扩大推理上下文窗口,实现高吞吐、低时延的推理体验,从而降低每Token的推理成本。

应用场景

该技术已率先在中国银联的“客户之声”、“营销策划”和“办公助手”三大业务场景中开展智慧金融AI推理加速应用试点,并已取得显著成果。这些应用场景的共同特点是需要处理大量的数据和复杂的推理任务,UCM技术的应用显著提升了这些任务的效率和准确性。

开源计划

华为计划于2025年9月正式开源UCM技术,届时将在魔擎社区首发。后续,华为将逐步将这一技术贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。这一开源计划将进一步推动AI技术的普及和发展,为更多企业和开发者提供强大的技术支持。

技术优势

1. 高吞吐、低时延:通过分级管理KV Cache记忆数据,UCM能够显著提升推理过程的效率,降低时延。
2. 成本降低:扩大推理上下文窗口,减少重复计算,从而降低每Token的推理成本。
3. 灵活性:UCM融合了多类型缓存加速算法工具,能够适应不同的业务场景和需求。

未来展望

随着AI技术的不断发展,UCM技术的应用前景广阔。特别是在智慧金融领域,UCM技术将为金融机构提供更高效、更准确的AI推理服务,提升客户体验和服务质量。同时,华为的开源计划也将促进整个AI生态的发展,推动更多创新应用的出现。

总之,华为发布的UCM技术不仅在技术上实现了重大突破,还在应用上展现了巨大的潜力。我们期待这一技术在未来能够为更多行业和领域带来积极的影响。

姜谷粉丝 2025-08-13 13:27
用户被禁言,该主题自动屏蔽!


查看完整版本: [-- 华为发布AI推理创新技术UCM,计划于9月开源 --] [-- top --]


Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled


沪ICP备:05041533号