O DBRX supera els principals models de codi obert com Mixtral MoE, Llama-2 70B i Grok-1, en la comprensió del llenguatge, la programació i les matemàtiques.
PUBLICITAT
A més, la seva inferència és fins a 2 vegades més ràpida que LLaMA2-70B i és aproximadament un 40% de la mida de Grok-1 en total i recompte de paràmetres actius.
El model també demostra superioritat sobre GPT-3.5 en tasques de context llarg i benchmarks RAG.
Sorprenentment, només va trigar 10 milions de dòlars i dos mesos a entrenar DBRX des de zero, destacant la seva eficiència i eficàcia en el desenvolupament de models lingüístics.
PUBLICITAT
La creació de Databricks d'un model de nivell GPT 3.5 amb només 10 milions de dòlars i dos mesos estableix un nou estàndard per a la indústria. Tanmateix, tot i que encapçalar la classificació de codi obert és impressionant, l'arribada imminent de l'esperat Llama 3 de la companyia. meta suggereix que és poc probable que el model es mantingui a la part superior durant molt de temps.
Llegiu també:
* El text d'aquest article ha estat generat parcialment per eines d'intel·ligència artificial, models de llenguatge d'última generació que ajuden a la preparació, revisió, traducció i resum de textos. Les entrades de text les va crear Curto Les notícies i les respostes d'eines d'IA es van utilitzar per millorar el contingut final.
És important destacar que les eines d'IA són només eines i la responsabilitat final del contingut publicat recau en el Curto Notícies. Amb un ús responsable i ètic d'aquestes eines, el nostre objectiu és ampliar les possibilitats de comunicació i democratitzar l'accés a la informació de qualitat. 🤖
Busques una eina d'Intel·ligència Artificial que et faci la vida més fàcil? En aquesta guia, navegueu per un catàleg de robots impulsats per IA i apreneu sobre les seves funcionalitats. Consulteu la valoració que els va fer el nostre equip de periodistes!
PUBLICITAT