近日,Arm 控股有限公司宣布推出 Arm 终端计算子系统 (CSS),以提供领先的人工智能 (AI) 体验,助力芯片合作伙伴轻松、快速地构建基于 Arm 架构的解决方案,并加速其产品上市进程。
据了解,Arm 终端 CSS 为旗舰系统级芯片 (SoC) 提供基础计算要素,其具备最新的 Armv9 CPU、Arm Immortalis GPU、基于三纳米工艺生产就绪的 CPU 和 GPU 物理实现,以及最新的 Corelink 系统互连和系统内存管理单元 (SMMU)。此外,今日同步推出的 Arm Kleidi 将有助于软件开发者无缝取得 Arm CPU 上的最佳性能,其包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。
对此,Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:“Arm 平台秉承了 Arm DNA 的能效理念,随着 AI 时代的加速发展,它正为下一波计算需求奠定根基。Arm 终端 CSS 在平台功能方面实现了显著进步,持续突破高端移动端体验的极限。”
据悉,Arm 终端 CSS 是迄今速度最快的 Arm 计算平台,提升了 30% 以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了 59% 的 AI 推理速度,适用于更广泛的 AI/机器学习 (ML) 和计算视觉工作负载。
Arm 终端 CSS 的关键在于 Arm 目前性能最强、效率最高、功能最广泛的 CPU 集群,带来最佳的性能和能效。新的 Arm Cortex-X925 实现了 Cortex-X 系列推出以来最高的同比性能提升,该 CPU 利用了领先的三纳米工艺节点,在 3.8GHz 的时钟速率和最大缓存大小的条件下,与 2023 年旗舰智能手机的四纳米 SoC 相比,其单线程性能大幅提高 36%。而在 AI 性能方面,Cortex-X925 取得了惊人的 41% 性能提升,可显著提高如大语言模型 (LLM) 等设备端生成式 AI 的响应能力。
此外,新的 Arm Cortex-A725 CPU 将对前沿性能的不懈追求与出色的效率相结合,该 CPU 将针对 AI 和手游用例的性能效率提高了 35%。这一改进也得益于更新后的 Arm Cortex-A520 CPU 和更新后的 DSU-120,使得采用最新 Armv9 CPU 集群的消费电子设备可提升能效和可扩展性。
新的 Arm Immortalis-G925 GPU 是 Arm 性能最强、效率最高的 GPU,在各款领先的手游应用中实现了 37% 的性能提升,并在多个 AI 和 ML 网络上提升了 34% 的性能。Immortalis-G925 面向旗舰智能手机市场,而包括 Arm Mali-G725 和 Mali-G625 GPU 在内的全新高可扩展性 GPU 系列,则面向从高端手机到智能手表和 XR 可穿戴设备等广泛的消费电子设备市场。
值得一提的是,Arm 始终关注全球数百万的开发者,确保他们能够获得打造下一波 AI 应用所需的性能、工具和软件库。为了使开发者能够以最高性能快速实现这些创新,Arm 推出了 Arm Kleidi,其中包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。
据了解,KleidiAI 是一套面向 AI 框架开发者的计算内核,使他们能够在各种设备上轻松获得 Arm CPU 上的最佳性能,并支持 Neon、SVE2 和 SME2 等关键 Arm 架构功能。KleidiAI 与 PyTorch、Tensorflow、MediaPipe 等热门 AI 框架集成,旨在加速 meta Llama 3、Phi-3 等关键模型的性能,并且还可前后兼容,以确保 Arm 在引入更多技术时依然能适用未来市场的需求。
通过将前沿的 CPU 和 GPU 技术、生产就绪的物理实现和持续的软件优化独特结合,Arm 终端 CSS 加之 Kleidi 软件,将为未来 AI 提供计算平台,而 Arm 正是这一未来的基石。