NE

News Elementor

NE

News Elementor

What's Hot

Berikut Penjelasan DeepSeek Tentang Penggunaan Pemakaian Chip Nvidia

Table of Content

Jakarta – Laporan DeepSeek yang disusun Pendiri DeepSeek Liang Wenfeng menyebutkan DeepSeek-V3 dilatih menggunakan 2.048 GPU Nvidia H800.

Langkah ini bagaimana model hardware bisa mengubah tantangan ini secara efektif, membuat pelatihan dan inference dalam skala menjadi efisien.

DeepSeek dan High-Flyer merupakan penyandang dana DeepSeek yang sebelumnya sudah menimbun H800.

GPU H800 ini didesain khusus oleh Nvidia untuk pasar China sesuai aturan pembatasan yang diterapkan oleh AS, tapi juga dilarang pada 2023.

Cara melatih model AI yang dipakai oleh startup ini merupakan solusi dari pelatihan model AI yang dibatasi oleh hardware dan biaya yang tinggi, seperti OpenAI untuk melatih GPT.

DeepSeek juga mengemukakan optimasi teknis untuk meningkatkan efisiensi memori, memuluskan komunikasi antar chip. Selain itu meningkatkan performa infrastruktur artificial intelligence/AI (kecerdasan buatan) secara keseluruhan.

Berbagai metode yang diterapkan oleh DeepSeek diklaim bisa mengurangi biaya komputasional untuk prapelatihan dan mencapai performa lebih kencang selama inference.

Metode in sudah diadopsi oleh banyak pengembang AI di China seperti Alibaba dalam model AI Qen3.

DeepSeek merilis model V3 pada Desember 2024 yang sebulan kemudian diluncurkan R1. Kedua model AI ini mengejutkan dunia karena kebutuhan komputasinya jauh lebih irit dibanding GPT, tapi kemampuan yang sebanding.

Selanjutnya, DeepSeek diam tentang masa depan rencana penelitiannya, hanya disebutkan secara reguler.

Banyak perusahaan teknologi China mengklaim penelitiannya di ranah AI bisa berakselerasi secara cepat. Enam bulan sejak V3 dirilis, berbagai perusahaan teknologi China sudah meluncurkan banyak model AI baru yang terlihat menjanjikan.

Baidu merilis model AI Ernie 4.5 Turbo dan X1 Turbo pada April 2024 dengan kemampuan multimodal reasoning dan harga yang 40% lebih murah dibanding DeepSeek V3.

Kemudian, Alibaba juga memperkenalkan model AI Qwen terbarunya, yang langsung menyalip V3 sebagai model AI open source paling populer di dunia pada bulan yang sama. (adm)

Sumber: detik.com

adm

ade@teknoandtravel.com

Recent News

Trending News

Editor's Picks

Banyak Orang Terlihat Romantis Berinteraksi dengan AI, Padahal Mereka Lebih Depresi dan Kesepian

Jakarta – Studi Peneliti dari Universitas Brigham Young yang dimuat Journal of Social and Personal Relationships menemukan banyak orang berinteraksi dengan artificial intelligence/AI (kecerdasan buatan) terlihat romantis. Namun, sebagian besar dari mereka tampaknya lebih depresi dan kesepian dibandingkan mereka yang tidak memakai AI. Peneliti menemukan satu dari lima orang secara keseluruhan dan seperempat dari orang...

Borneo Championship-Circuit Global Championship 2025 Berlangsung di Jakarta, Bangun Ekosistem Reparasi Ponsel Secara Profesional dan Terintegrasi

Jakarta – Borneo Schematic Indonesia dan G-LON China menggelar Borneo Championship-Circuit Global Championship (CGC) 2025 di Jakarta pada 30-31 Agustus 2025. Kegiatan ini merupakan kejuaraan internasional reparasi Central Processing Unit Telepon Selular (CPU ponsel). Kompetisi ini menjadi bagian dari rangkaian Circuit Global Championship World Cup Series 2025 yang puncaknya akan berlangsung di Guangzhou, China pada...

Samsung dan SK Hynix Tak Bisa Produksi Chip di China, Departemen Perdagangan AS Cabut Izin

Jakarta – Departemen Perdagangan Amerika Serikat (AS) mencabut izin produksi chip Samsung dan SK Hynix, sehingga tak bisa membeli peralatan baru untuk pabrik chipnya di China. Jadi, kedua perusahaan ini tidak bisa memperbarui atau meningkatkan kapasitas produksi di pabriknya. Dengan begitu Samsung hanya memproduksi chip flagship di Korea Selatan (Korsel) dan AS, sedangkan pabrik di...

NE

News Elementor

Lorem Ipsum is simply dummy text of the printing and typesetting industry.

Popular Categories

Must Read

©2024- All Right Reserved. Designed and Developed by  Blaze Themes