华为云发布FlexNPU,打造弹性伸缩“算力金箍棒”
华为云将构建更适配中小企业需求的AI“黑土地”,推动算力服务从粗放调度向精准成本核算转变。
在近日举办的华为云中小企业AI解决方案发布会上,一项名为“柔性智算操作系统FlexNPU”的黑科技正式亮相。该技术旨在解决企业级智能体普及面临的算力瓶颈,通过弹性伸缩能力将Token消耗控制在预算范围内,打造面向Agentic时代的极致性价比,被喻为算力的“金箍棒”。
图片来源:华为方面提供
华为云中国区销售伙伴发展部部长郭婷表示,2026年华为云将构建更适配中小企业需求的AI“黑土地”,推动算力服务从粗放调度向精准成本核算转变,破解企业“用不起、用不好”算力的难题。针对当前企业智能化转型中面临的成本高、技术壁垒厚等挑战,华为云发布了涵盖基础设施、模型服务、智能体平台及应用层的全栈解决方案,助力企业打造能对接业务系统的“数字员工”。目前,该方案已深入2600多家企业,解决500多个场景化问题。
华为云首席架构师顾炯炯指出,Agent时代因自主规划与长上下文导致Token消耗指数级增长,而传统算力池利用率不足30%,浪费严重。为此,华为云推出FlexNPU,赋予算力“液态化”伸缩能力,实现资源按需动态分配。
FlexNPU具备极致共享、极致弹性和极致高可用三大核心属性。在大模型推理方面,通过PD动态混部等技术,解决集群不均衡与算力空转难题,预计提升至少40%的Token性价比;在小模型推理方面,实现最小粒度达1% NPU卡及128MB显存的时分复用,使小模型平均算力成本降低2至3倍;在高可用保障方面,凭借软硬解耦及Token级KV Cache实时快照技术,实现故障秒级恢复与断点续推,大幅减少重计算开销。
发布会现场,多位伙伴分享了落地案例。天宽科技基于昇腾算力打造的制造业Agent方案,使合同审核准确率高达90%,效率提升3倍;天津宏达瑞信利用华为云天筹求解能力优化物流路径,排线效率提升60倍以上,物流成本降低5.8%。
会上,华为云还发布了“加速智能化 企业快成长行动2026”,承诺为中小企业及开发者提供品牌、商业及技术全方位支持。未来,华为云将继续秉持“用AI解行业难题”理念,携手伙伴深耕AI算力黑土地,共赢智能时代机遇。
本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com