乐虎网站多少联系电话
乐虎网站多少
首页 > 产品中心
浪潮信息元脑CPU推理服务器支撑32B大模型高效推理
产品中心

浪潮信息元脑CPU推理服务器支撑32B大模型高效推理

时间: 2025-04-23 13:42:44 |   作者: 产品中心

  (全球TMT2025年3月20日讯)浪潮信息推出元脑CPU推理服务器,可以高效运转DeepSeek和千问QwQ等新一代大推理模型。元脑CPU推理服务器NF8260G7和NF8480G7选用4颗高功能通用CPU和多通道内存体系,结合先进的张量并行战略和AMX加快技能,单机即可高效运转DeepSeek-R1 32B和QwQ-32B推理模型,支撑20个并发用户恳求,成为企业快速、低投入布置大模型渠道的抱负算力挑选。这些服务器经过软硬协同优化,为32B模型推理与云核算、数据库等通用要害事务场景供给高效、灵敏、安稳的AI通用算力支撑。

  元脑CPU推理服务器NF8260G7和NF8480G7已完结与DeepSeek-R1 32B和QwQ-32B等大模型的深度适配和优化。在算力方面,服务器规划选用4颗32中心的英特尔至强处理器6448H,支撑张量并行核算,具有超强的BF16精度AI推理才能和高内存容量及带宽,满意模型核算和存储需求。在算法方面,服务器对干流的企业级大模型推理服务结构vLLM进行深度定制优化,完成多处理器并行核算,功率最高提高4倍,解码功能提高2倍。


相关知识

版权所有:乐虎官网首页_乐虎唯一官方入口