Eşik

Hoş geldin, yabancı.

Adın nedir? Kaydetmek, beğenmek ve kütüphaneni taşımak için adını çizgiye bırak.

Aktif Sinyal

DeepSeek’in HBM verimliliği Çin’in yapay zeka donanım ekosisteminin önünü

Kaynak: @bookwormengr
Saat: 4:52
Ağırlık: 95/100

Sesli Özet

0:00 / 0:00

DeepSeek'in, donanım kısıtlamalarını aşmak ve Çin'de yerel bir yapay zeka ekosistemini harekete geçirmek amacıyla mimari verimliliğe odaklanan stratejik bir dönüşüm içinde olduğu bildiriliyor. Şirket, Multi-head Latent Attention (MLA) ve Mixture-of-Experts (MoE) gibi algoritmik yeniliklere öncelik vererek High Bandwidth Memory (HBM) gereksinimlerini önemli ölçüde azalttı.

Örneğin, DeepSeek V4 modeli 1 milyon tokenlik bir bağlam için yalnızca 5,48GB HBM gerektirirken, bu rakam GLM veya Qwen gibi rakiplerin benzer modellerinin ihtiyaç duyduğu belleğin çok küçük bir kısmına tekabül ediyor. Bu teknik yaklaşım, DeepSeek'in ham işlem gücünü NAND SSD ve LPDDR bellek gibi daha bol bulunan kaynaklarla takas etmesine olanak tanıyor.

Kaynağa Git

Loading the timeline

Preparing the first signals.