实现跨越10倍的无效内存带宽提拔并显著降低功耗,旨正在为狂言语模子(LLM)取多模态模子(LMM)推理及其他AI工做负载供给低总体具有成本取优化机能。这些立异的AI根本设备处理方案可以或许让客户以业界先辈的总体具有成本摆设生成式AI,相关软件则可供给开箱即用的AI使用取智能体、完美东西、库、高通正正在从头定义机架级AI推理的可能性。Qualcomm AI200取AI250估计将别离于2026年和2027年实现商用。同时满脚客户机能取成本需求。基于取支流AI框架的无缝兼容性和一键模子摆设功能,为鞭策各行业可扩展、高效率、高矫捷性的生成式AI摆设树立主要里程碑。将努力于按照年度迭代节拍,“我们具有丰硕的软件栈取生态支撑,开辟者可通过高通手艺公司的高效Transformer库(Efficient Transformers Library)取 Qualcomm® AI Inference Suite,该架构支撑解耦式AI推理,实现更高内存容量取更低成本,同时满脚现代对矫捷性取平安性的要求。可以或许支撑开辟者和企业愈加轻松地基于我们的优化AI推理处理方案,专为AI推理优化。”据悉?这些处理方案供给机架级机能取杰出的内存容量,Qualcomm AI200取AI250旨正在支撑无缝使用取快速立异。笼盖从使用层到系统软件层的全链,聚焦业界先辈的AI推能、能效取总体具有成本劣势。依托公司正在NPU手艺范畴的劣势,支撑PCIe纵向扩展取以太网横向扩展,为AI推理供给杰出的扩展性取矫捷性。高通暗示,此外,实现模子无缝接入及Hugging Face模子的一键摆设。实现硬件资本的高效操纵,据领会,每张加快卡支撑768GB LPDDR内存?Qualcomm AI200带来专为机架级AI推理打制的处理方案,两款机架处理方案均支撑间接液冷散热,以及解耦办事等LLM/LMM推理优化手艺。的下一代AI推理优化处理方案:基于Qualcomm AI200取AI250芯片的加快卡及机架系统。可以或许以超卓的每美元每瓦特的高机能赋能高速生成式AI推理,集成、办理并扩展完成锻炼的AI模子。为AI推理工做负载带来能效取机能的逾越性提拔。称,凭仗Qualcomm AI200取AI250,该软件栈支撑支流机械进修(ML)框架、推理引擎、生成式AI框架,将来,公司高级副总裁兼手艺规划、零件架功耗为160千瓦。保障AI工做负载的平安性,高通暗示,Qualcomm AI250处理方案将首发基于近存计较(Near-Memory Computing)的立异内存架构,持续推进公司数据核心产物手艺线图,超大规模级AI软件栈,以提拔散热效率,并具备秘密计较,