今日,AMD倾力推出ROCm软件栈的全新版本——ROCm 6.3,其中融入了多项尖端工具与优化技术,旨在极大地增强AMD Instinct GPU加速器在AI、机器学习(ML)以及高性能计算(HPC)领域的应用效能。
ROCm 6.3的问世,标志着开源平台的一大飞跃。它不仅带来了多项创新功能,更被AMD视为一项重要的里程碑。ROCm 6.3致力于通过提升开发者的工作效率,为从初创企业到高性能计算领域的广大用户带来革命性的体验。
ROCm 6.3的五大核心升级亮点包括:
ROCm 6.3内置的SGLang,专为超快速推理生成式AI(GenAI)模型设计,特别是针对AMD Instinct GPU上的LLM和VLM等高级生成模型。
Transformer的深度优化,通过在AMD Instinct上重新设计FlashAttention-2,实现了训练和推理的显著加速。
AMD Fortran编译器的加入,使基于Fortran的传统HPC应用程序能够无缝迁移至GPU加速,释放现代GPU的强大潜力。
rocFFT的多节点FFT支持,成为HPC工作流中的一大革新,实现了高性能的分布式FFT计算。
计算机视觉库的增强,包括AV1、rocJPEG等,帮助企业轻松应对视频分析、数据集增强等多样化工作负载。
值得一提的是,AMD还将ROCm 6.2中的Omnitrace和Omniperf更名为ROCm System Profiler和ROCm Compute Profiler,旨在提升可用性、稳定性,并与ROCm分析生态系统实现无缝对接。