Dunia kecerdasan buatan menyambut kehadiran Falcon 180B, model bahasa berskala besar dengan 180 miliar parameter. Dilatih dengan 3,5 triliun token, model ini menjanjikan kemampuan yang belum pernah ada sebelumnya dalam pemrosesan bahasa alami. Simak berita lengkapnya berikut ini!
Dilansir dari Bitcoin News, Falcon 180B diperkenalkan oleh Hugging Face dan TII sebagai model bahasa terbesar yang tersedia untuk publik. Model ini dilatih dengan dataset RefinedWeb milik TII, yang mencakup sebagian besar data web dan sejumlah data terkurasi seperti percakapan dan makalah teknis.
Dalam hal arsitektur, Falcon 180B merupakan evolusi dari Falcon 40B, memanfaatkan inovasi seperti multiquery attention untuk meningkatkan skalabilitas.
Model ini dilatih dengan menggunakan hingga 4096 GPU secara simultan, memanfaatkan Amazon SageMaker, selama total sekitar 7 juta jam GPU.
Baca Juga: Konten AI dalam Dunia Game, Bagaimana Reaksi Epic Games dan Steam?
Falcon 180B telah menunjukkan hasil yang mengesankan dalam berbagai tugas pemrosesan bahasa alami, mengungguli model-model terdahulu seperti LLaMA 2 dan GPT-3.5.
Model ini mencapai skor 68,74 di Papan Peringkat Hugging Face, menjadikannya model berkinerja tertinggi yang dirilis untuk publik.
Falcon 180B juga menunjukkan kinerja yang sebanding dengan model komersial seperti PaLM-2 Large dari Google, menandakan kemampuannya yang luar biasa dalam bidang ini.
Baca Juga: Indonesia Berikan ‘Golden Visa’ Pertama kepada CEO OpenAI, Sam Altman: Apa Artinya?
Falcon 180B telah tersedia di ekosistem Hugging Face, dimulai dengan versi Transformers 4.33. Model ini dapat diakses dan digunakan oleh para peneliti dan pengembang untuk berbagai aplikasi.
Model ini juga telah dioptimalkan untuk berbagai perangkat keras, dengan versi yang dikuantisasi yang mempertahankan metrik serupa dengan model asli.
Dengan rilis Falcon 180B, komunitas diharapkan dapat lebih jauh memanfaatkan dan menyempurnakan model ini, membawa kemajuan lebih lanjut dalam pemrosesan bahasa alami.
Dengan peluncuran Falcon 180B, dunia AI telah melihat langkah besar menuju kemajuan dalam pemrosesan bahasa alami. Model ini tidak hanya menetapkan standar baru untuk model terbuka, tetapi juga menjanjikan inovasi dan kemajuan lebih lanjut di masa depan.
Ikuti kami di Google News untuk mendapatkan berita-berita terbaru seputar crypto. Nyalakan notifikasi agar tidak ketinggalan beritanya.
*Disclaimer
Konten ini bertujuan memperkaya informasi pembaca. Selalu lakukan riset mandiri dan gunakan uang dingin sebelum berinvestasi. Segala aktivitas jual beli dan investasi aset crypto menjadi tanggung jawab pembaca.
Referensi: