在近日举行的华为全联接大会2025上高杠杆股票配资平台,华为副董事长、轮值董事长徐直军,一口气官宣了未来三年多款芯片和超节点的演进路线。
期间,首届数据中心创新峰会上,华为发布星河AI Fabric 2.0方案,这是继2018年发布AI Fabric后的全方位升级,打造算力满载、业务永续的数据中心网络,为企业数智化转型注入新动能。
一手算力、一手算法,而这份布局未来的组合拳,不仅为中国的AI产业积蓄力量,也传递出中国“硬核科技”突围的信号,更将为全球的数智化贡献中国智慧和中国方案。
挑战:网络“吞吐率”制约大模型价值
“要想富,先修路”,在数字世界中,只有为数据交互构建一个智能化的网络基础架构,才能释放其巨大的价值。
AI技术应用已经成为企业创新发展的新阵地,以自然语言处理、图文自动生成、知识问答交互为代表的AI大模型应用层出不穷。
在AI大模型开发与应用热潮背后,其暴露出的痛点也不容忽视。比如,如何把海量数据高效传送到算力中心,充分释放算力潜能,并且快速地将算力输送给一线用户,成为了AI大模型应用落地和价值提升的关键。
但AI大模型在训练过程中参数规模巨大,百亿和千亿级别犹如“家常便饭”,因此需要通过基于全局的网络智能调度,才能更好地完成训练任务。
与此同时,算力规模的快速变化也带来了严重的负载冲突,要想充分释放算力,网络的高吞吐率必不可少。
最后,AI大模型训练过程复杂,从数据采集、管理到模型训练、优化,是一个长期的过程,网络中的任何一个微小错误都可能导致巨大的损失,高可靠的网络保障也成为了大模型调优的基础。
“54天,419次意外故障,中断频次达平均每3小时1次”,去年年中,Meta 发布了一篇研究论文,详细介绍了其 Llama 3 405B 模型在由 16384 个英伟达 H100 80GB GPU 组成的集群上进行训练。
该报告显示,78%的故障因硬件问题产生,其中,网络瓶颈又成为算力释放的关键挑战。大模型训练需依托大规模算力集群释放潜能,网络可靠性不足导致训练效率下降是行业面临的重要难题。
同时,在大模型推理中,同一任务的网络通信时长普遍大于计算时长,造成近20%的算力浪费,大模型推理“算等网”亦成为一大业务挑战。
破局:将网络性能提升至新高度
“问渠哪得清如许,为有源头活水来”,面向AI时代的数据中心网络,要解决的核心问题便是提升网络可靠性、降低数据传输时延,提升计算效率。
在算力资源有限且成本高昂的背景下,作为数据中心三大基础之一的网络,需要思考的是如何把算力的潜能发挥到极致,而非成为制约算力释放的瓶颈。
破解网络吞吐、时延和可靠性挑战,华为升级星河AI数据中心网络方案,构建AI时代高质量网络底座,首先便将网络性能提升至新的高度。
华为此次发布的星河AI Fabric 2.0方案,就上演了一番将网络损耗转化为算力增益的“魔法”,从三个层面掀起了一场算法革命:
AI大脑:依托星翼网络数字地图与NetMaster网络智能体,实现业务拖拽式编排与部署自动化、应用网络一体运维自动化,以及异构网络与安全的端到端自动化,大幅提升运维效率。
AI联接:通过NSLB(网络级负载均衡)系列算法实现全网负载均衡,将网络吞吐提升至95%,训练/推理效率提升超10%;依托磐石高可靠架构的iReliable三级可靠技术,可靠性提升10倍。
AI网元:针对AI训练“大带宽、突发性”与推理“高并发、低延迟”的差异化需求,通过FLB均衡、Token均衡算法实现95%以上吞吐效率,400ns级低时延;在安全方面,搭载内生安全技术及分组隔离能力,全面提升网络安全性能。
负载均衡器是一种软件或硬件设备,它起到了将网络流量分散到一组服务器的作用,可以防止任何一台服务器过载。负载均衡算法就是负载均衡器用来在服务器之间分配网络流量的逻辑。
在这场以智能化驱动的变革中,一张使能0算损业务永续的数据中心网络,为构建最佳算力底座、赋能千行万业跃升生产力,奠定了坚实基石。
应用:赋能千行百业降本增效
星河AI网络并不针对单一产品,而是一系列方案产品甚至是一种理念。在AI深入千行万业的同时,对于制造企业用户而言,打通数据传输的壁垒,释放数据的价值,真正做到数据驱动,才是网络建设的关键。
从内部数据交互的角度,制造企业需要构建研发设计、生产管理、售后服务的产品全生命周期数据集成;从外部数据共享的角度,需要打通供应链管理、物料采购与规划等,保持与上下游的联动,同时还需要注意数据安全风险。在赵志鹏看来,只有深耕所在的细分领域,才能准确把握网络应用需求,为企业创造价值。
例如在企业研发阶段,设计人员可以基于网络实现协同研发,同时高效地获取算力支持,进而缩短产品研发周期,增强市场竞争力。例如上海大众就通过华为智能无损网络,完成了应用精准识别并进行智能流量控制,用于加速自身CAE仿真等关键研发任务,使新车研发周期从54个月压缩至40个月。
在产品生产过程中,面对消费市场的个性化、多元化需求,企业的多品种、小批量柔性化生产能力正变得尤为重要。立景创新联合华为打造了高品质无线生产网络,实现了无尘车间全无线部署,达到变产线、不变网络的效果,使其产线调整到启动新生产时间从15-30天,压缩至2-3天,极大地缩短了停产断网时间。
面对制造企业的信息孤岛问题,例如美的厨卫电器工厂,通过智能网络调度算法,使物料的准确抓取提升至0.3mm,放置准确率达99%以上,多工位协同自动化水平从30%提升到50%以上。
华为星河AI网络正在从最初的单点探索应用转向生产全生命周期的渗透,为制造企业应用创新带来更多可能。
根据Gartner的预测报告,到2026年,超过80%的企业将采用生成式人工智能API或部署生成式人工智能的应用程序;到2028年,AI智能体将自动化至少15%的日常决策,提升企业生产力与运营效率。星河AI网络,终将迎来用武之地。
在别人的墙基上砌房子,再大再漂亮也可能经不起风雨。回顾此次全连接大会,华为用一系列组合拳证明了,在国产AI算力平台(昇腾)上,能够高效、稳定地训练并优化达到国际顶尖水平的超大规模稀疏模型(MoE),实现了从硬件到软件、从训练到优化、从基础研究到工程落地的“全栈国产化”和“全流程自主可控”的闭环,并在关键性能指标上达到业界领先水平。
它代表的是中国企业另一种可能:哪怕在最顶端的软硬件领域,也有能力一步步把关键技术把控在自己手中。
南方+记者 郜小平
万联配资提示:文章来自网络,不代表本站观点。