O DBRX عملکرد بهتری از مدل های منبع باز پیشرو مانند Mixtral MoE، Llama-2 70B و Grok-1، در درک زبان، برنامه نویسی و ریاضیات.
تبلیغات
علاوه بر این، استنتاج آن تا 2 برابر سریعتر از LLaMA2-70B است و حدود 40 درصد اندازه آن است. Grok-1 در تعداد کل و پارامترهای فعال.
این مدل همچنین برتری نسبت به GPT-3.5 را در وظایف زمینه طولانی و معیارهای RAG نشان می دهد.
با کمال تعجب، فقط 10 میلیون دلار و دو ماه طول کشید تا DBRX از ابتدا آموزش داده شود و کارایی و اثربخشی آن در توسعه مدلهای زبان را برجسته کند.
تبلیغات
ایجاد یک مدل سطح 3.5 GPT توسط Databricks با تنها 10 میلیون دلار و دو ماه، استاندارد جدیدی را برای صنعت ایجاد می کند. با این حال، در حالی که در صدر جدول رهبران منبع باز قابل توجه است، ورود قریب الوقوع Llama 3 مورد انتظار این شرکت است. متا نشان می دهد که بعید است این مدل برای مدت طولانی در اوج باقی بماند.
همچنین بخوانید:
* متن این مقاله تا حدی توسط ابزارهای هوش مصنوعی، مدلهای زبانی پیشرفته که در تهیه، بررسی، ترجمه و خلاصهسازی متون کمک میکنند، تولید شده است. ورودی های متنی توسط Curto از اخبار و پاسخهای ابزارهای هوش مصنوعی برای بهبود محتوای نهایی استفاده شد.
مهم است که تأکید کنیم ابزارهای هوش مصنوعی فقط ابزار هستند و مسئولیت نهایی محتوای منتشر شده بر عهده Curto اخبار. با استفاده مسئولانه و اخلاقی از این ابزارها، هدف ما گسترش امکانات ارتباطی و دموکراتیک کردن دسترسی به اطلاعات با کیفیت است. 🤖
آیا به دنبال ابزار هوش مصنوعی برای آسان کردن زندگی خود هستید؟ در این راهنما، کاتالوگ ربات های مجهز به هوش مصنوعی را مرور می کنید و با عملکردهای آنها آشنا می شوید. ارزیابی تیم خبرنگاران ما را به آنها بررسی کنید!
تبلیغات