Mengeksplorasi DeepSeek dengan Menggunakan Chip Huawei untuk Menjawab Pertanyaan

DeepSeek: Model AI Hemat Biaya yang Membuat Heboh di Dunia Teknologi

DeepSeek telah menciptakan kehebohan di dunia teknologi dengan merilis large language model (LLM) yang lebih irit dibanding model sejenis, seperti yang digunakan di ChatGPT. Mereka menggunakan chip AI Nvidia H800 — yang kemampuannya lebih rendah dibanding H100 — untuk melatih LLM mereka. DeepSeek mengklaim hanya menggunakan 2.000 chip Nvidia H800 untuk melatih model AI tersebut dengan biaya sekitar USD 6 juta untuk menciptakan model AI DeepSeek R1 dan DeepSeek V3. Namun, baru-baru ini terungkap bahwa selain menggunakan chip AI Nvidia, DeepSeek juga menggunakan chip AI dari Huawei.

Chip AI Nvidia H800 dan Huawei Ascend 910C dalam Proses Pelatihan dan Inferensi

Menurut Alexander Doria, DeepSeek R1 LLM dilatih menggunakan chip Nvidia H800, namun untuk proses inferensi, mereka menggunakan chip Huawei Ascend 910C. Inference adalah proses penggunaan AI yang sudah dilatih untuk membuat prediksi atau keputusan berbasis data yang baru diberikan. Dengan kata lain, tahapan ini adalah saat AI digunakan oleh pengguna untuk menjawab pertanyaan-pertanyaan yang diberikan.

Doria, melalui akun @Dorialexander, menyatakan bahwa LLM ini tidak menggunakan chip Ascend 910C untuk proses pelatihan, melainkan hanya untuk proses inference. Hal ini menunjukkan bahwa kemampuan komputasi yang dibutuhkan oleh DeepSeek tidak terlalu tinggi, mengingat Ascend 910C memiliki kemampuan komputasi yang lebih rendah dibanding chip Nvidia H800. Huawei sedang merencanakan untuk membuat Ascend 920 yang akan bersaing dengan chip Nvidia Blackwell B200.

READ  "Dugaan Terhadap DeepSeek Mencuri Data OpenAI Disambut Pujian dari CEO Microsoft"

DeepSeek: Menggabungkan Chip Nvidia dan Huawei untuk Kesuksesan AI Mereka

DeepSeek sebelumnya dituduh memiliki puluhan ribu chip AI Nvidia H100 yang mereka rahasiakan. Sejak tahun 2022, Amerika Serikat melarang ekspor chip canggih Nvidia seperti H100 atau A100 ke China, namun chip seperti Nvidia H800 masih dapat diekspor. CEO Scale AI, Alexandr Wang, mengungkap bahwa DeepSeek sebenarnya memiliki 50 ribu unit Nvidia H100 namun mereka menyembunyikannya.

Diperkirakan bahwa DeepSeek menggunakan kombinasi chip canggih Nvidia dengan chip yang memiliki kemampuan lebih rendah. Dengan bantuan chip terlarang tersebut, DeepSeek mampu bersaing dengan AI dari Amerika Serikat. Nvidia H100 menjadi favorit karena mampu menangani data dalam kecepatan tinggi dan memiliki harga per unit yang sangat mahal, yaitu sekitar USD 25 ribu.

Kesimpulan

DeepSeek telah menciptakan gebrakan dengan model AI yang hemat biaya namun tetap memiliki kinerja yang impresif. Penggunaan kombinasi chip Nvidia dan Huawei menjadi kunci kesuksesan mereka dalam mengembangkan model AI yang memenuhi kebutuhan pasar saat ini. Meskipun terdapat kontroversi terkait penggunaan chip terlarang, DeepSeek tetap menjadi sorotan dalam industri teknologi. Diharapkan dengan terus berinovasi, DeepSeek dapat terus menjadi pemimpin dalam pengembangan AI di masa depan.

(asj/fay)

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *