Meta Llama 3 เพิ่งเปิดตัวซึ่งเป็นโมเดลภาษาขนาดใหญ่โอเพ่นซอร์ส (LLM) รุ่นใหม่ Llama 8 มีวางจำหน่ายในเวอร์ชันพารามิเตอร์ 70B และ 3B มีประสิทธิภาพเหนือกว่าคู่แข่งแบบโอเพ่นซอร์สในการทดสอบประเมินผลหลายรายการ
การเผยแพร่
🇬🇧 ติดตาม ที่สุด newsletter เกี่ยวกับ AI (เป็นภาษาอังกฤษ 🇮🇧) 🇧🇷 แอสซิเน ที่สุด newsletter เกี่ยวกับ AI (ในภาษาโปรตุเกส 🇧🇷)
Detalhes
- การทดสอบ Meta แสดงให้เห็นว่า Llama 3 8B และ 70B มีประสิทธิภาพเหนือกว่ารุ่นที่มีขนาดใกล้เคียงกัน เช่น Gemma และ Mistral 7B จาก Google และโคลง 3 Sonnet ของ Anthropic
- โมเดลดังกล่าวได้รับการฝึกฝนบนชุดข้อมูลที่มีขนาดใหญ่กว่า Llama 7 ถึง 2 เท่า โดยมีโทเค็น 15 ล้านล้านโทเค็นและโค้ดมากกว่า 4 เท่า
- เวอร์ชันที่ใหญ่กว่าซึ่งมีพารามิเตอร์มากกว่า 400B ควรจะออกใน "เดือนข้างหน้า" และแข่งขันกับ GPT-4
- Llama 3 ได้รับการบูรณาการข้ามแพลตฟอร์มผ่านผู้ช่วย AI ของ Meta ซึ่งพร้อมใช้งานบน Facebook, Instagram, WhatsApp, Messenger และเว็บไซต์ใหม่ Meta.ai.
ทำไมเรื่องนี้ถึงสำคัญ
- ด้วยผลลัพธ์ที่น่าประทับใจและกำลังจะมีการเปิดตัวโมเดลยักษ์ใหญ่ Mark Zuckerberg กำลังเป็นรูปเป็นร่าง
- แม้ว่าคนส่วนใหญ่จะยังคงติดต่อกับ AI เพียงเล็กน้อย แต่การบูรณาการในวงกว้างของ Meta ทำให้โมเดล AI ระดับสูงสามารถใช้งานได้อย่างเสรีสำหรับผู้ใช้มากกว่า 3 พันล้านรายในผลิตภัณฑ์ของตน
อ่านเพิ่มเติม: