Cip Blackwell AI generasi NVIDIA menghadapi masalah terlalu panas apabila dipasang di rak pelayan berkapasiti tinggi.Isu -isu ini telah membawa kepada perubahan reka bentuk dan kelewatan, dan telah menimbulkan kebimbangan di kalangan pelanggan seperti Google, Meta, dan Microsoft mengenai penyebaran pelayan Blackwell yang tepat pada masanya.
Orang dalam telah mendedahkan bahawa GPU Blackwell Nvidia boleh terlalu panas apabila digunakan dalam pelayan dengan 72 cip.Peranti ini dijangka mengambil sehingga 120kW kuasa setiap rak.Isu -isu ini telah memaksa Nvidia untuk menilai reka bentuk rak pelayannya beberapa kali, kerana terlalu panas dapat mengehadkan prestasi GPU dan menimbulkan risiko kerosakan komponen.Pelanggan bimbang bahawa kemunduran ini mungkin menghalang jadual mereka untuk menggunakan cip baru di pusat data.
Menurut laporan, Nvidia telah mengarahkan pembekalnya untuk membuat pelbagai perubahan reka bentuk pada rak untuk menangani isu -isu yang terlalu panas.Syarikat ini bekerjasama rapat dengan pembekal dan rakan kongsi untuk membangunkan semakan kejuruteraan untuk meningkatkan penyejukan pelayan.Walaupun pelarasan ini adalah amalan standard untuk pelepasan teknologi berskala besar, mereka masih menambah kelewatan dan melambatkan lagi tarikh penghantaran yang diharapkan.
Menurut laporan oleh First Financial, sebagai tindak balas kepada kelewatan dan isu -isu yang terlalu panas, jurucakap Nvidia menyatakan, "Kami sedang bekerjasama dengan penyedia perkhidmatan awan terkemuka sebagai bahagian penting dalam pasukan kejuruteraan dan proses kami.GB200, sistem yang paling maju sehingga kini, ke dalam pelbagai persekitaran pusat data memerlukan reka bentuk bersama dengan pelanggan kami. "Nvidia juga menyatakan bahawa "pelanggan sedang merebut peluang pasaran untuk sistem GB200.
Sebelum ini, Nvidia terpaksa menangguhkan pengeluaran Blackwell kerana kecacatan reka bentuk dalam hasil cip.NVIDIA's Blackwell B100 dan B200 GPU menggunakan teknologi pembungkusan TSMC CowOS-L untuk menyambungkan dua cip mereka.Reka bentuk ini termasuk lapisan perantaraan RDL dengan jambatan LSI (Silicon Interconnect) LSI, menyokong kelajuan pemindahan data sehingga 10TB/s.Kedudukan tepat jambatan LSI ini adalah penting bagi teknologi untuk beroperasi seperti yang diharapkan.Walau bagaimanapun, ketidakcocokan dalam ciri -ciri pengembangan haba antara cip GPU, jambatan LSI, interlayer RDL, dan substrat motherboard telah menyebabkan kegagalan warping dan sistem.Untuk menangani isu ini, Nvidia mengubahsuai lapisan logam teratas dan struktur bonggol silikon GPU untuk meningkatkan kebolehpercayaan pengeluaran.
Oleh itu, NVIDIA Blackwell GPU yang disemak semula hanya akan memulakan pengeluaran besar -besaran pada akhir Oktober, yang bermaksud Nvidia akan dapat menghantar cip ini dari akhir Januari tahun depan.
Pelanggan Nvidia, termasuk gergasi teknologi seperti Google, Meta, dan Microsoft, menggunakan NVIDIA GPU untuk melatih model bahasa besar mereka yang paling kuat.Kelewatan Blackwell AI GPU secara semulajadi akan menjejaskan rancangan dan produk pelanggan Nvidia.