เครดิตรูปภาพ: การสืบพันธุ์/Databricks

DBRX: Databricks เปิดตัว LLM โอเพ่นซอร์สพร้อมคุณสมบัติขั้นสูงที่มีประสิทธิภาพเหนือกว่าคู่แข่ง

Databricks เพิ่งเปิดตัว DBRX ซึ่งเป็นโมเดลภาษาขนาดใหญ่แบบโอเพ่นซอร์ส (LLM) ใหม่พร้อมภาษาขั้นสูงและความสามารถในการทำความเข้าใจโค้ด

O ดีบีอาร์เอ็กซ์ มีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สชั้นนำ เช่น Mixtral MoE, Llama-2 70B และ Grok-1 ในการทำความเข้าใจภาษา การเขียนโปรแกรม และคณิตศาสตร์

การเผยแพร่

นอกจากนี้ การอนุมานยังเร็วกว่า LLaMA2-2B ถึง 70 เท่า และมีขนาดประมาณ 40% ของ Grok-1 ในการนับพารามิเตอร์ทั้งหมดและที่ใช้งานอยู่

โมเดลนี้ยังแสดงให้เห็นถึงความเหนือกว่า GPT-3.5 ในงานบริบทแบบยาวและเกณฑ์มาตรฐาน RAG

น่าประหลาดใจที่การฝึกอบรม DBRX ตั้งแต่เริ่มต้นใช้เวลาเพียง 10 ล้านเหรียญสหรัฐและสองเดือน โดยเน้นถึงประสิทธิภาพและประสิทธิผลในการพัฒนาโมเดลภาษา

การเผยแพร่

การสร้างโมเดลระดับ GPT 3.5 ของ Databricks ด้วยเงินเพียง 10 ล้านเหรียญสหรัฐในเวลา 3 เดือน ถือเป็นการสร้างมาตรฐานใหม่สำหรับอุตสาหกรรม อย่างไรก็ตาม ในขณะที่การติดอันดับกระดานผู้นำแบบโอเพ่นซอร์สนั้นน่าประทับใจ แต่การมาถึงของ Llama XNUMX ที่บริษัทตั้งตารอคอยอย่างสูงกำลังใกล้เข้ามาแล้ว Meta บ่งบอกว่าโมเดลไม่น่าจะอยู่ด้านบนสุดได้นาน

อ่านเพิ่มเติม:

* ข้อความของบทความนี้สร้างขึ้นบางส่วนโดยเครื่องมือปัญญาประดิษฐ์ โมเดลภาษาที่ล้ำสมัยซึ่งช่วยในการจัดเตรียม ทบทวน การแปล และการสรุปข้อความ รายการข้อความถูกสร้างขึ้นโดย Curto มีการใช้ข่าวสารและการตอบกลับจากเครื่องมือ AI เพื่อปรับปรุงเนื้อหาขั้นสุดท้าย
สิ่งสำคัญคือต้องเน้นว่าเครื่องมือ AI เป็นเพียงเครื่องมือ และความรับผิดชอบขั้นสุดท้ายสำหรับเนื้อหาที่เผยแพร่นั้นอยู่ที่ Curto ข่าว. ด้วยการใช้เครื่องมือเหล่านี้อย่างมีความรับผิดชอบและมีจริยธรรม วัตถุประสงค์ของเราคือการขยายความเป็นไปได้ในการสื่อสาร และทำให้การเข้าถึงข้อมูลที่มีคุณภาพเป็นประชาธิปไตย
🤖

กำลังมองหาเครื่องมือปัญญาประดิษฐ์ที่จะทำให้ชีวิตของคุณง่ายขึ้นอยู่ใช่ไหม? ในคู่มือนี้คุณเรียกดูแคตตาล็อกหุ่นยนต์ที่ขับเคลื่อนด้วย AI และเรียนรู้เกี่ยวกับฟังก์ชันการทำงานของพวกมัน มาดูผลการประเมินที่ทีมนักข่าวของเรามอบให้กัน!

การเผยแพร่

เลื่อนขึ้น