DBRX: Databricks llança LLM de codi obert amb funcions avançades que superen la competència

O DBRX supera els principals models de codi obert com Mixtral MoE, Llama-2 70B i Grok-1, en la comprensió del llenguatge, la programació i les matemàtiques.

PUBLICITAT

A més, la seva inferència és fins a 2 vegades més ràpida que LLaMA2-70B i és aproximadament un 40% de la mida de Grok-1 en total i recompte de paràmetres actius.

El model també demostra superioritat sobre GPT-3.5 en tasques de context llarg i benchmarks RAG.

Elon Musk i xAI anuncien el llançament obert de Grok-1

Captura-de-Tela-2023-12-08-as-20.20.55-aspect-ratio-930-440

Elon Musk i xAI acaba de llançar el seu model d'idioma amb 314 mil milions de paràmetres, Grok-1, sota una llicència de codi obert Apache 2.0.

Sorprenentment, només va trigar 10 milions de dòlars i dos mesos a entrenar DBRX des de zero, destacant la seva eficiència i eficàcia en el desenvolupament de models lingüístics.

PUBLICITAT

Meta anuncia formació de Llama 3 i nous projectes d'IA

El CEO de Meta va anunciar formació per a Llama 3, posant èmfasi en l'obertura de models d'intel·ligència artificial (IA) i en la realineació de l'organització d'IA per reflectir les prioritats en evolució.

La creació de Databricks d'un model de nivell GPT 3.5 amb només 10 milions de dòlars i dos mesos estableix un nou estàndard per a la indústria. Tanmateix, tot i que encapçalar la classificació de codi obert és impressionant, l'arribada imminent de l'esperat Llama 3 de la companyia. meta suggereix que és poc probable que el model es mantingui a la part superior durant molt de temps.

Llegiu també:

Claude 3 destrona GPT-4; entendre

El Claude 3 Opus d'Anthropic va superar el GPT-4 d'Anthropic OpenAI per primera vegada a la taula de classificació LMSYS Chatbot Arena.

* El text d'aquest article ha estat generat parcialment per eines d'intel·ligència artificial, models de llenguatge d'última generació que ajuden a la preparació, revisió, traducció i resum de textos. Les entrades de text les va crear Curto Les notícies i les respostes d'eines d'IA es van utilitzar per millorar el contingut final.
És important destacar que les eines d'IA són només eines i la responsabilitat final del contingut publicat recau en el Curto Notícies. Amb un ús responsable i ètic d'aquestes eines, el nostre objectiu és ampliar les possibilitats de comunicació i democratitzar l'accés a la informació de qualitat. 🤖

Busques una eina d'Intel·ligència Artificial que et faci la vida més fàcil? En aquesta guia, navegueu per un catàleg de robots impulsats per IA i apreneu sobre les seves funcionalitats. Consulteu la valoració que els va fer el nostre equip de periodistes!

PUBLICITAT

DBRX: Databricks llança LLM de codi obert amb funcions avançades que superen la competència

Sobre l'autor

Juliana Caminoto

Sobre l'autor

Juliana Caminoto

El més llegit

Relacionat