קרדיט תמונה: רפרודוקציה/Databricks

DBRX: Databricks משיקה LLM בקוד פתוח עם תכונות מתקדמות שעולות על המתחרים

Databricks הכריזה זה עתה על DBRX, מודל שפות גדולות בקוד פתוח חדש (LLM) עם יכולות מתקדמות של הבנת שפה וקוד.

O DBX מתעלה על דגמי קוד פתוח מובילים כגון Mixtral MoE, Llama-2 70B ו Grok-1, בהבנת שפה, תכנות ומתמטיקה.

פִּרסוּם

בנוסף, ההסקה שלו מהירה עד פי 2 מ-LLaMA2-70B והיא בערך 40% מהגודל של Grok-1 בסך הכל ספירת פרמטרים פעילים.

המודל גם מפגין עליונות על פני GPT-3.5 במשימות בהקשר ארוך ובמדדי RAG.

באופן מפתיע, נדרשו רק 10 מיליון דולר וחודשיים כדי לאמן את DBRX מאפס, והדגיש את היעילות והיעילות שלו בפיתוח מודלים של שפה.

פִּרסוּם

היצירה של Databricks של דגם GPT 3.5 ברמת 10 מיליון דולר וחודשיים בלבד מציבה סטנדרט חדש לתעשייה. עם זאת, בעוד שהפסגה בראש טבלת הקוד הפתוח היא מרשימה, הגעתו הקרובה של ה-Llama 3 המצופה של החברה meta מציע שהדגם לא יישאר בחלק העליון לאורך זמן.

קראו גם:

* הטקסט של מאמר זה נוצר בחלקו על ידי כלים של בינה מלאכותית, מודלים שפה מתקדמים המסייעים בהכנה, סקירה, תרגום וסיכום של טקסטים. רשומות טקסט נוצרו על ידי Curto נעשה שימוש בחדשות ותגובות מכלי AI כדי לשפר את התוכן הסופי.
חשוב להדגיש שכלי בינה מלאכותית הם רק כלים, והאחריות הסופית על התוכן המפורסם היא של Curto חֲדָשׁוֹת. על ידי שימוש בכלים אלה בצורה אחראית ואתית, המטרה שלנו היא להרחיב את אפשרויות התקשורת ולהפוך את הגישה למידע איכותי לדמוקרטי.
🤖

מחפש כלי בינה מלאכותית כדי להקל על חייך? במדריך זה, אתה מעיין בקטלוג של רובוטים המונעים בינה מלאכותית ולומד על הפונקציונליות שלהם. בדוק את ההערכה שצוות העיתונאים שלנו נתן להם!

פִּרסוּם

לגלול מעלה