IBM 公司昨日(11 月 18 日)發布公告,宣布和 AMD 公司達成合作,計劃在 IBM Cloud 上部署 AMD Instinct MI300X 加速器服務(accelerators as a service)。
此項服務預計將在 2025 年上半年推出,目標是提升企業客戶在生成式 AI 模型和高性能計算(HPC)應用中的性能和能效。
IBM 表示通過此合作,其 watsonx AI 與數據平臺,以及 Red Hat Enterprise Linux(RHEL 發行版)的 AI 推理支持也整合 MI300X 加速器。
IBM Cloud 將提供 AMD Instinct MI300X 加速器,以支持企業客戶處理計算密集型工作負載。
援引新聞稿,MI300X 加速器配備 192GB 高帶寬內存(HBM3),能夠支持大型模型的推理和微調,幫助客戶以更少的 GPU 運行更大的模型,降低推理成本。