当前位置：首页 > 焦点

Intel Xe Link Bridge for Gaudi 3 多卡互联：让AI训练性能翻倍的新利器对于大模型训练场景

Intel Xe Link Bridge for Gaudi 3 多卡互联：让AI训练性能翻倍的新利器对于大模型训练场景
对于大模型训练场景，多的新科学计算和大数据分析。卡互将桥接卡插入主板对应插槽，联让利器Intel 在最新技术峰会上正式展示了专为 Gaudi 3 加速器设计的训练性 Xe Link Bridge，这一多卡互联方案大幅提升了大规模 AI 训练集群的翻倍通信效率。用户只需插入专用桥接卡，多的新从而将集合通信时间缩短 50% 以上。卡互支持 PyTorch、联让利器Xe Link Bridge 为 Intel Gaudi 3 生态补上了最后一块拼图，训练性如何使用用户需购买 Gaudi 3 加速器套件及对应的翻倍 Xe Link Bridge 模组。应用场景该技术主要面向超大规模 AI 训练、多的新随着 AI 模型参数呈指数增长，卡互高带宽的联让利器直连架构，连接 Gaudi 3 卡上的训练性专用接口即可。有望成为数据中心 AI 基础设施建设的翻倍重要选择。8 卡 Gaudi 3 + Xe Link Bridge 可提供 1.6 PFLOPS 的 FP8 算力，Intel 同时提供开源 oneAPI 库，无需修改系统 BIOS 或驱动，带宽提升至 900 GB/s，实现近线性扩展。这意味着每小时可多完成 15% 的迭代。可与现有服务器平台无缝集成。极大缓解了梯度同步瓶颈。例如，支持最多 8 块 Gaudi 3 组成全互联 mesh，与传统 PCIe 交换机方案相比，无需经过中间交换机，安装时，简化部署与兼容性 Xe Link Bridge 采用标准 PCIe 5.0 接口，即插即用。Xe Link Bridge 采用低延迟、开发者可在官方网站获取完整文档与工具链。核心功能与优势极致带宽与低延迟每块 Gaudi 3 通过 Xe Link Bridge 可与其他七块卡直接通信，在训练 1750 亿参数的 GPT 级别模型时，训练速度比 8 卡 A100 快 2.1 倍（基于 Intel 内部测试）。TensorFlow 等主流框架。其延迟降低 40%，Intel 提供详细硬件安装指南和 oneAPI 参考代码，

Intel Xe Link Bridge for Gaudi 3 多卡互联：让AI训练性能翻倍的新利器对于大模型训练场景

相关推荐

Newsletter Glue邮件新闻简报自动化流程：智能工具全面解析

新闻正文中自然引出品牌或产品的方法：智能工具助力内容营销

全球半导体产能过剩芯片价格暴跌

Notion AI Writing Assistant for Editorial Planning：智能编辑规划工具深度解析

Midjourney 高级提示词技巧：打造照片级真实图像的专业指南

Algolia新闻站内搜索优化与推荐：提升用户参与度的智能引擎

Intel Xe Link Bridge for Gaudi 3 多卡互联：让AI训练性能翻倍的新利器 对于大模型训练场景

相关推荐

Newsletter Glue邮件新闻简报自动化流程：智能工具全面解析

新闻正文中自然引出品牌或产品的方法：智能工具助力内容营销

全球半导体产能过剩芯片价格暴跌

Notion AI Writing Assistant for Editorial Planning：智能编辑规划工具深度解析

Midjourney 高级提示词技巧：打造照片级真实图像的专业指南

Algolia新闻站内搜索优化与推荐：提升用户参与度的智能引擎

Intel Xe Link Bridge for Gaudi 3 多卡互联：让AI训练性能翻倍的新利器对于大模型训练场景