NE

News Elementor

NE

News Elementor

What's Hot

Alibaba Saingi OpenAI Rilis Model AI

Table of Content

Jakarta – Model AI baru QwQ-32B-Preview dengan kemampuan reasoning (penalaran) telah hadir. Model ini merupakan salah satu dari sedikit model yang menyaingi o1 milik OpenAI, dan merupakan model pertama yang tersedia untuk diunduh dengan lisensi permisif.

Dikembangkan oleh tim Qwen Alibaba, QwQ-32B-Preview berisi 32,5 miliar parameter dan dapat mempertimbangkan perintah hingga kurang lebih 32 ribu kata.

Model ini berkinerja lebih baik pada tolok ukur tertentu daripada o1-preview dan o1-mini, dua model penalaran yang telah dirilis OpenAI sejauh ini.

Menurut pengujian Alibaba, QwQ-32B-Preview mengalahkan model o1-preview OpenAI pada pengujian AIME dan MATH. AIME menggunakan model AI lain untuk mengevaluasi kinerja model, sementara MATH adalah kumpulan soal cerita.

QwQ-32B-Preview dapat memecahkan teka-teki logika dan menjawab pertanyaan matematika yang cukup menantang, berkat kemampuan ‘bernalar’-nya.

Namun, model ini tidak sempurna. Alibaba mencatat dalam sebuah posting blog bahwa model tersebut mungkin tiba-tiba beralih bahasa, terjebak dalam loop, dan berkinerja buruk pada tugas yang memerlukan ‘penalaran akal sehat’.

Tidak seperti kebanyakan AI, QwQ-32B-Preview dan model penalaran lainnya secara efektif memeriksa fakta sendiri.

Hal ini membantu mereka menghindari beberapa jebakan yang biasanya membuat model tersandung, dengan sisi negatifnya adalah mereka sering kali membutuhkan waktu lebih lama untuk sampai pada solusi.

Mirip dengan o1, QwQ-32B-Preview bernalar melalui tugas, merencanakan ke depan, dan melakukan serangkaian tindakan yang membantu model tersebut menemukan jawaban.

QwQ-32B-Preview yang dapat dijalankan dan diunduh dari platform pengembangan AI Hugging Face, tampaknya mirip dengan model penalaran DeepSeek yang baru-baru ini dirilis karena model ini secara hati-hati membahas topik politik tertentu.

Alibaba dan DeepSeek sebagai perusahaan China tunduk pada pembandingan oleh regulator internet China untuk memastikan respons model mereka ‘mewujudkan nilai-nilai inti sosialisme-komunisme’.

Banyak sistem AI di China menolak untuk menanggapi topik yang dapat menimbulkan kemarahan regulator, seperti spekulasi tentang rezim Xi Jinping.

Salah satu contohnya, ketika QwQ-32B-Preview ditanya ‘Apakah Taiwan bagian dari China?’, sistem AI ini menjawab bahwa Taiwan bagian dari China (dan ‘tidak dapat dicabut’).

Ini adalah perspektif yang tidak sejalan dengan sebagian besar yang diketahui dunia, tetapi sejalan dengan partai yang berkuasa di China.

Contoh lain, pertanyaan tentang Lapangan Tiananmen tidak ditanggapi. Pertanyaan ini masih dianggap tabu dan sensitif di sebagian besar kalangan masyarakat China.

QwQ-32B-Preview saat ini tersedia secara terbuka di bawah lisensi Apache 2.0, yang berarti dapat digunakan untuk aplikasi komersial.

Namun, hanya beberapa komponen model yang telah dirilis, sehingga mustahil untuk mereplikasi QwQ-32B-Preview atau mendapatkan banyak wawasan tentang cara kerja internal sistemnya.

Meningkatnya perhatian pada model penalaran muncul karena kelayakan ‘hukum penskalaan’. Teori lama yang menyatakan bahwa memberikan lebih banyak data dan daya komputasi pada suatu model akan terus meningkatkan kemampuannya, mulai diteliti.

Serangkaian laporan pers menunjukkan bahwa model dari lab AI utama termasuk OpenAI, Google, dan Anthropic tidak membaik secara dramatis seperti sebelumnya.

Hal itu telah menyebabkan perlombaan cara pendekatan, arsitektur, dan teknik pengembangan AI baru, salah satunya adalah komputasi waktu pengujian.

Dikenal juga sebagai komputasi inferensi, komputasi waktu uji pada dasarnya memberi model waktu pemrosesan ekstra untuk menyelesaikan tugas, dan mendukung model seperti o1 dan QwQ-32B-Preview.

Laboratorium besar selain OpenAI dan perusahaan China bertaruh bahwa komputasi waktu uji adalah masa depan.

Menurut laporan terbaru dari The Information, Google telah memperluas tim internal yang berfokus pada model penalaran menjadi sekitar 200 orang, dan menambahkan daya komputasi yang substansial untuk upaya tersebut. (adm)

Sumber: detik.com

bening

adripareport@gmail.com http://teknoandtravel.com

Leave a Reply

Your email address will not be published. Required fields are marked *

Recent News

Trending News

Editor's Picks

IAEA Desak Pertemuan Darurat di Kantor Pusat, Setelag AS Bom Fasilitas Nuklir Iran

Jakarta – International Atomic Energy Agency/IAEA (Badan Tenaga Atom Internasional) meminta pertemuan darurat di kantor pusat yang berlokasi di Wina, Austria. Hal ini segera setelah Amerika Serikat (AS) mengebom fasilitas nuklir Iran. Direktur Jenderal IAEA, Rafael Grossi membatalkan perjalanan ke Brussels pada Senin (23/6/2025). Semula dia berencana untuk ambil bagian dalam pertemuan para menteri luar...

AS Bom Pusat Program Nuklir Iran, Citra Satelit Perlihatkan Kerusakan

Jakarta – Amerika Serikat (AS) melakukan pemboman berskala besar terhadap tiga fasilitas pusat program nuklir Iran, yakni Fordow, Natanz, dan Isfaham pada Ahad (235/2025). Serangan ini dilakukan dengan operasi sandi bernama Midnight Hammer. Dari citra satelit terlihat kerusakan dari luar angkasa dari serangan yang dilakukan pesawat siluman B-2 Spirit yang kemudian melepaskan enam bom bunker-buster...

ChatGPT Dinilai Berkinerja Buruk Bagi Tingkat Syaraf dan Perilaku, Riset Berlangsung Selama 4 Bulan

Jakarta – Peneliti dari MIT Media Lab, Wellesley College, dan Massachusetts College of Art and Design menilai pengguna large language model (LLM) seperti ChatGPT memiliki kinerja buruk pada tingkat syaraf, linguistik, dan perilaku. Langkah ini diketahuinya dari studi selama empat bulan bertajuk ‘Your Brain on ChatGPT’ yang diterbitkan pada 10 Juni 2025. Studinya memang belum...

Roscosmos Diperkirakan Luncurkan Satelit Low Earth Orbit

Jakarta – Badan Antariksa Rusia, Roscosmos diperkirakan meluncurkan satelit low earth orbit (LEO) pesaing Starlink pada akhir 2025. Perangkat ini pertama bagi Rusia yang akan bersaing dengan Starlink dan ditargetkan mengangkut 16 satelit. “Peluncuran pertama dijadwalkan pada akhir tahun ini,” kata Kepala Roscosmos, Dmitry Bakanov pada Senin (24/6/2025). Roscosmos berencana meluncurkan 900 satelit LEO pada...

ZTE Didukung Telkomsel Implementasi solusi 5G Site Khusus, Jaringan Ramah Lingkungan dan Sederhana

Jakarta – ZTE Corporation mengumumkan implementasi komersial dari solusi 5G site khusus yakni UniSite 1+2+3. Kolaborasi ini bertujuan membangun jaringan 5G yang ramah lingkungan, lebih sederhana, dan lebih cerdas. Solusi UniSite 1+2+3 dari ZTE merupakan pendekatan terkini dalam pengembangan jaringan yang menggabungkan kesederhanaan desain, efisiensi energi, dan inovasi teknologi. Solusi ini dikembangkan melalui kolaborasi erat...

NE

News Elementor

Lorem Ipsum is simply dummy text of the printing and typesetting industry.

Popular Categories

Must Read

©2024- All Right Reserved. Designed and Developed by  Blaze Themes