刚刚刚刚,黄仁勋甩出三代核弹 AI 芯片!小我私
栏目:专题报道 发布时间:2025-03-19 09:17
英伟达 GTC 年夜会曾经成了 AI 界超等碗,不脚本也不提词器,半途黄仁勋被线缆卡住,反而是这场高浓度 AI 宣布会里最有人味的片断,在当今提前基础提前彩排或录播的科技宣布会里曾经很稀缺了。刚,黄仁勋再次宣布了全新一代核弹级 AI 芯片,不外这场宣布会的另有个暗藏配角——DeepSeek。因为智能体 AI(Agentic AI)跟推理才能的晋升,当初所需的盘算量至少是客岁此时预估的 100 倍。推理本钱效力给 AI 行业带来影响,而不是简略地沉积盘算才能,成为贯串这场宣布会的主线。英伟达要酿成 AI 工场,让 AI 以超出人类的速率进修跟推理。推理实质上是一座工场在出产 token,而工场的代价取决于是否发明收入跟利润。因而,这座工场必需以极致的效力打造。黄仁勋取出的英伟达新「核弹」也在告知咱们,将来的人工智能竞争不在于谁的模子更年夜,而在于谁的模子存在最低的推理本钱跟更高推理的效力。除了全新 Blackwell 芯片,另有两款「真·AI PC」全新的 Blackwell 芯片代号为「Ultra」,也就是 GB300 AI 芯片,接棒客岁的「寰球最强 AI 芯片」B200,再一次实现机能上的冲破.Blackwell Ultra 将包含英伟达 GB300 NVL72 机架级处理计划,以及英伟达 HGX B300 NVL16 体系。Blackwell Ultra GB300 NVL72 将于往年下半年宣布,参数细节如下:1.1 EF FP4 Inference:在停止 FP4 精度的推理义务时,可能到达 1.1 ExaFLOPS(每秒百亿亿次浮点运算)。0.36 EF FP8 Training:在停止 FP8 精度的练习义务时,机能为 1.2 ExaFLOPS。1.5X GB300 NVL72:与 GB200 NVL72 比拟,机能为 1.5 倍。20 TB HBM3:装备了 20TB HBM 内存,是前代的 1.5 倍40 TB Fast Memory:领有 40TB 的疾速内存,是前代的 1.5 倍。14.4 TB/s CX8:支撑 CX8,带宽为 14.4 TB/s,是前代的 2 倍。单个 Blackwell Ultra 芯片将跟前代一样供给雷同的 20 petaflops(每秒万万亿次浮点运算) AI 机能,但装备更多的 288GB 的 HBM3e 内存。假如说 H100 更合适年夜范围模子练习,B200 在推理义务中表示杰出,那么 B300 则是一个多功效平台,预练习、后练习跟 AI 推理都不在话下。英伟达还特殊指出,Blackwell Ultra 也实用于 AI 智能体,以及用于练习呆板人跟汽车主动驾驶的「物理 AI」。为了进一步加强体系机能,Blackwell Ultra 还将与英伟达的 Spectrum-X 以太网跟英伟达 Quantum-X800 InfiniBand 平台集成,为体系中的每个 GPU 供给 800Gb/s 的数目吞吐量,辅助 AI 工场跟云数据核心可能更快处置 AI 推理模子。除了 NVL72 机架,英伟达还推出了包括单个 GB300 Blackwell Ultra 芯片的台式电脑 DGX Station。Blackwell Ultra 之外,这个主机还将装备 784GB 的统一体系内存,内置 800Gbps 英伟达 ConnectX-8 SuperNIC 收集,可能支撑 20 petaflops 的 AI 机能。
服务热线
400-123-4567