华为在全联接大会2023期间发布了全新架构的昇腾 AI 计算集群 Atlas900SuperCluster,该集群可支持超万亿参数的大模型训练。

该集群采用了全新的华为星河 AI 智算交换机 CloudEngine XH16800,并使用了创新的超节点架构,大大提升了大模型训练能力。

华为

此外,华为还发布了更开放、更易用的 CANN7.0,让开发者可以更直接地调用和管理计算资源,使大模型具备差异化的竞争力。华为还升级了 Ascend C 编程语言,提供更高效的编程方式。

该集群还通过提升系统可靠性,将大模型训练的稳定性从天级提升到月级。