NE

News Elementor

NE

News Elementor

What's Hot

Berikut Penjelasan DeepSeek Tentang Penggunaan Pemakaian Chip Nvidia

Table of Content

Jakarta – Laporan DeepSeek yang disusun Pendiri DeepSeek Liang Wenfeng menyebutkan DeepSeek-V3 dilatih menggunakan 2.048 GPU Nvidia H800.

Langkah ini bagaimana model hardware bisa mengubah tantangan ini secara efektif, membuat pelatihan dan inference dalam skala menjadi efisien.

DeepSeek dan High-Flyer merupakan penyandang dana DeepSeek yang sebelumnya sudah menimbun H800.

GPU H800 ini didesain khusus oleh Nvidia untuk pasar China sesuai aturan pembatasan yang diterapkan oleh AS, tapi juga dilarang pada 2023.

Cara melatih model AI yang dipakai oleh startup ini merupakan solusi dari pelatihan model AI yang dibatasi oleh hardware dan biaya yang tinggi, seperti OpenAI untuk melatih GPT.

DeepSeek juga mengemukakan optimasi teknis untuk meningkatkan efisiensi memori, memuluskan komunikasi antar chip. Selain itu meningkatkan performa infrastruktur artificial intelligence/AI (kecerdasan buatan) secara keseluruhan.

Berbagai metode yang diterapkan oleh DeepSeek diklaim bisa mengurangi biaya komputasional untuk prapelatihan dan mencapai performa lebih kencang selama inference.

Metode in sudah diadopsi oleh banyak pengembang AI di China seperti Alibaba dalam model AI Qen3.

DeepSeek merilis model V3 pada Desember 2024 yang sebulan kemudian diluncurkan R1. Kedua model AI ini mengejutkan dunia karena kebutuhan komputasinya jauh lebih irit dibanding GPT, tapi kemampuan yang sebanding.

Selanjutnya, DeepSeek diam tentang masa depan rencana penelitiannya, hanya disebutkan secara reguler.

Banyak perusahaan teknologi China mengklaim penelitiannya di ranah AI bisa berakselerasi secara cepat. Enam bulan sejak V3 dirilis, berbagai perusahaan teknologi China sudah meluncurkan banyak model AI baru yang terlihat menjanjikan.

Baidu merilis model AI Ernie 4.5 Turbo dan X1 Turbo pada April 2024 dengan kemampuan multimodal reasoning dan harga yang 40% lebih murah dibanding DeepSeek V3.

Kemudian, Alibaba juga memperkenalkan model AI Qwen terbarunya, yang langsung menyalip V3 sebagai model AI open source paling populer di dunia pada bulan yang sama. (adm)

Sumber: detik.com

adm

ade@teknoandtravel.com

Recent News

Trending News

Editor's Picks

Arsitektur Cloud Tersentralisasi Tak Bisa Penuhi Tuntutan, Kondisi Ini Sudah Disadari Peusahaan

Jakarta – Laporan riset Internationa Data Corporation (IDC) terbaru yang dibuat untuk Akamai Technologies menyebutkan perusahaan keamanan siber dan komputasi cloud mendukung dan melindungi bisnis secara online. Sementara itu penelitian berjudul ‘The Edge Evolution: Powering Success from Core to Edge mengungkapkan perusahaan di Asia Pasifik menyadari arsitektur cloud yang tersentralisasi tidak dapat memenuhi tuntutan skala,...

Presiden AS Donald Trump Undang Petinggi Perusahaan TI Dunia, Elon Musk Bilang Tak Diundang

Jakarta – Presiden Amerika Serikat (AS) Donald Trump mengundang sejumlah pimpinan perusahaan teknologi informasi (TI) untuk makan malam di Gedung Putih, Washington DC pada Kamis (4/9/2025). Mereka adalah Pendiri Meta Mark Zuckerberg, Pendiri Microsoft Bill Gates, Chief Executbe Officer (CEO) Apple Tim Cook, Sergey Brin dan Sundar Pichai dari Google, dan Pendiri OpenAI Sam Altman....

Banyak Orang Terlihat Romantis Berinteraksi dengan AI, Padahal Mereka Lebih Depresi dan Kesepian

Jakarta – Studi Peneliti dari Universitas Brigham Young yang dimuat Journal of Social and Personal Relationships menemukan banyak orang berinteraksi dengan artificial intelligence/AI (kecerdasan buatan) terlihat romantis. Namun, sebagian besar dari mereka tampaknya lebih depresi dan kesepian dibandingkan mereka yang tidak memakai AI. Peneliti menemukan satu dari lima orang secara keseluruhan dan seperempat dari orang...

NE

News Elementor

Lorem Ipsum is simply dummy text of the printing and typesetting industry.

Popular Categories

Must Read

©2024- All Right Reserved. Designed and Developed by  Blaze Themes