分享文章
华为正式开源UCM技术:最大提升22倍 AI推理性能跃升
智能
2025-11-05 17:45
声明:该文章来自(快科技)版权由原作者所有,K2OS渲染引擎提供网页加速服务。
近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。
UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。
UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。
它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。
目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。

UCM产品架构

[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
排名
热点
搜索指数
- 1 指引法治中国建设 总书记这样阐述 7904427
- 2 中方回应中日官员磋商:当然不满意! 7808512
- 3 外交部回应德国政府涉台海言论 7713891
- 4 全运会百米冠军首次属于“00后” 7617598
- 5 49.1万张飞日本机票被取消 7523737
- 6 中方说了三个绝不允许 7427331
- 7 广东冷到“结冰”了 7329896
- 8 四川古蔺惊现“恐龙王国” 7232923
- 9 矢野浩二发文:永远支持一个中国 7138402
- 10 物业通知将投毒治理遛狗不清粪便 7045472


>
>
>
>
>
>
