BOPELNEWS – Facebook Rilis Llama 3.1, Model AI Gratis Sekelas GPT-4
Meta (perusahaan induk Facebook , Instagram, WhatsApp) telah meluncurkan model bahasa besar (large language model/LLM) terbarunya, Llama 3.1 405B, Selasa (23/7/2024).
Llama 3.1 405B di klaim sebagai model bahasa besar gratis dan open-source pertama, yang memiliki performa setara model kecerdasan buatan (artificial intelligence/AI) kelas atas seperti GPT-4o dan GPT-4 milik OpenAI, Claude 3.5 Sonnet, serta Google Gemini 1.5 Pro.
Karena gratis, pengguna bisa mengunduh Llama 3.1 405B di komputernya kemudian menjalankannya tanpa pungutan biaya. Namun, tentunya pengguna membutuhkan komputer dengan spesifikasi yang mumpuni.
“Kami merilis Meta Llama 3.1 405B secara publik, yang kami yakini merupakan model bahasa terbuka terbesar dan paling mumpuni di dunia,” tulis Meta dalam blog resminya.
“Llama 3.1 405B adalah model (bahasa besar) pertama yang tersedia secara terbuka, yang menyaingi model AI teratas dalam hal kemampuan tercanggih seperti pengetahuan umum, kemampuan pengendalian, matematika, penggunaan alat, dan terjemahan multi-bahasa,” sambung Meta.
Secara rinci, pengujian Meta menunjukkan bahwa Llama 3.1 405B mampu mengalahkan Nemotron 4 340B Instruct, GPT-4, GPT-4o, dan Claude 3.5 Sonnet dalam pengujian IFEval, GSM8K, ARC Challenge, Nexus, serta ZeroSCROLLS/QuALITY.
Hal ini di mungkinkan karena Llama 3.1 405B memiliki 405 miliar parameter, dan di latih menggunakan lebih dari 15 triliun token data, dengan 16.000 unit pengolah grafis (GPU) Nvidia H100.
Perlu Dicatat
Perlu di catat, hasil benchmark ini merupakan hasil evaluasi dari Meta. Dengan begitu, hasil ini tidak mempertimbangkan pengalaman subjektif dalam berinteraksi dengan model bahasa AI.
Yang jelas, Meta memastikan bahwa Llama 3.1 405B berguna untuk peringkasan teks panjang, agen percakapan multibahasa, dan asisten coding, serta untuk membuat data sintetis yang di gunakan untuk melatih model bahasa AI pada masa depan.
Pembuatan data sintetis itu secara resmi di dukung oleh lisensi Meta Llama 3.1 untuk pertama kalinya.
Meta turut bekerja sama dengan Amazon, Databricks, Nvidia, IBM, dan perusahaan lainnya untuk meluncurkan berbagai layanan, yang membantu developer atau perusahaan menyempurnakan dan melatih model AI mereka sendiri.
Selain Llama 3.1 405B, Meta juga meluncurkan peningkatan dari Llama 8B dan 70B. Kini, keduanya di lengkapi dukungan multibahasa dan panjang konteks (kapasitas memori LLM) yang di perluas sebanyak 128.000 token.
Model bahasa besar Llama 3.1 405B, 8B, dan 70B di unduh lewat situs resmi Meta. Llama 3.1 405B juga bisa di jajal di chatbot Meta AI, tetapi sejauh ini Indonesia belum kebagian Meta AI.
Tidak Khawatir
CEO Meta Mark Zuckerberg merasa tidak khawatir kalah saing secara teknis, akibat perilisan Llama 3.1 405B yang bersifat open-source.
“Orang-orang sering bertanya apakah saya khawatir kehilangan keunggulan teknis dengan Llama yang bersifat open-source,
tapi menurut saya ini tidak menggambarkan gambaran besarnya,” tulis Zuckerberg dalam posting sepanjang 2.300 kata di situs Meta.
Zuckerberg melanjutkan, bahwa meluncurkan Llama 3.1 secara gratis dan open-source ke dunia akan membantunya
“berkembang menjadi ekosistem alat, peningkatan efisiensi, optimisasi silikon, dan integrasi lainnya yang lengkap.
” Pria yang akrab di sapa Zuck ini merujuk pada sejarah panjang perusahaan Meta dalam pengembangan proyek open-source. Meta di klaim telah hemat miliaran dollar AS dengan memublikasikan desain server, jaringan, dan pusat datanya secara terbuka.
“Pendekatan ini secara konsisten berhasil bagi kami jika kami terus menerapkannya dalam jangka panjang,” pungkas Zuckerberg,
Tinggalkan komentar