DBRX: Databricks lança LLM de código aberto com recursos avançados que supera a concorrência

O DBRX supera os principais modelos de código aberto, como Mixtral MoE, Llama-2 70B e Grok-1, em compreensão de linguagem, programação e matemática.

Além disso, sua inferência é até 2x mais rápida que a do LLaMA2-70B e tem cerca de 40% do tamanho do Grok-1 em contagens de parâmetros totais e ativos.

O modelo também demonstra superioridade sobre o GPT-3.5 em tarefas de longo contexto e benchmarks RAG.

Elon Musk e xAI anunciam o lançamento aberto do Grok-1

Elon Musk e xAI acabaram de lançar o seu modelo de linguagem com 314 bilhões de parâmetros, Grok-1, sob uma licença de código aberto Apache 2.0.

Surpreendentemente, foram necessários apenas US$ 10 milhões e dois meses para treinar o DBRX do zero, destacando sua eficiência e eficácia no desenvolvimento de modelos de linguagem.

Meta anuncia treinamento do Llama 3 e novos projetos em IA

O CEO do Meta anunciou o treinamento para o Llama 3, enfatizando a abertura de modelos de inteligência artificial (IA) e realinhando a organização de IA para refletir as prioridades em evolução.

A criação, pela Databricks, de um modelo de nível GPT 3.5 com apenas US$ 10 milhões e dois meses estabelece um novo padrão para o setor. No entanto, enquanto liderar a tabela de classificação de código aberto é impressionante, a iminente chegada do tão aguardado Llama 3 da Meta sugere que o modelo provavelmente não permanecerá no topo por muito tempo.

Leia também:

Claude 3 destrona GPT-4; entenda

O modelo Claude 3 Opus da Anthropic ultrapassou o GPT-4 da OpenAI pela primeira vez na tabela de classificação do LMSYS Chatbot Arena.