
【11万卡组网+36小时上线:scaleFabric的速率与脸色】在最近群众王人在怜惜的中科朝阳新发布的高速集聚系统scaleFabric开yun体育网,有两个数字让我印象非常深:11万和36。这两个数字,王人和scaleFabric径直有计划。
11万,是scaleFabric架构的最大组网规模。3万卡仅仅郑州这一个节点的规模,这套架构表面上能救济11万卡互联。什么办法?NVIDIA的InfiniBand上限是5万卡,scaleFabric径直翻倍还多。这意味着更大规模的模子并行、更短的考试周期、更大的思象空间。当别东谈主还在有计划若何把几万卡连起来的本领,scaleFabric仍是在筹商十万卡级的集聚拓扑了。
36,是郑州万卡集群从部署到上线的时分——36小时。你莫得看错,不是36天,是36小时。过去搞一套千卡集群,光调集聚就得一周起步,万卡集群更是按月算。scaleFabric若何作念到的?谜底是SuperTunnel的自稳当才能。传统决议每换一个模子,集聚参数就得随着调一遍,碰到问题翻文档、查社区、发工单。SuperTunnel开箱即用,自动识别通讯花样,自动优化融合,把几个月的使命压缩到一天半。
认真数据中心的架构师说了一句话,我也印象长远,他说:咱们当今作念的事,不是复制NV的阶梯,而是用不同的步调达到相似的极端。路不相同,不代表走不到。scaleFabric等于那条不相同的路。
这条路上开yun体育网,仍是有了塌实的脚印,国产要支棱起来了!!!

