A Databricks acaba de anunciar o DBRX, um novo modelo de linguagem grande (LLM) de código aberto com recursos avançados de compreensão de linguagem e código.
O DBRX supera os principais modelos de código aberto, como Mixtral MoE, Llama-2 70B e Grok-1, em compreensão de linguagem, programação e matemática.
Além disso, sua inferência é até 2x mais rápida que a do LLaMA2-70B e tem cerca de 40% do tamanho do Grok-1 em contagens de parâmetros totais e ativos.
O modelo também demonstra superioridade sobre o GPT-3.5 em tarefas de longo contexto e benchmarks RAG.
Surpreendentemente, foram necessários apenas US$ 10 milhões e dois meses para treinar o DBRX do zero, destacando sua eficiência e eficácia no desenvolvimento de modelos de linguagem.
A criação, pela Databricks, de um modelo de nível GPT 3.5 com apenas US$ 10 milhões e dois meses estabelece um novo padrão para o setor. No entanto, enquanto liderar a tabela de classificação de código aberto é impressionante, a iminente chegada do tão aguardado Llama 3 da Meta sugere que o modelo provavelmente não permanecerá no topo por muito tempo.
Leia também:
* O texto desta matéria foi parcialmente gerado por ferramentas de inteligência artificial, modelos de linguagem de última geração que auxiliam na elaboração, revisão, tradução e resumos de textos. As entradas de texto foram criadas pela equipe do Curto News e as respostas das ferramentas de IA foram utilizadas para aprimorar o conteúdo final.
É importante destacar que as ferramentas de IA são apenas ferramentas, e a responsabilidade final pelo conteúdo publicado é do Curto News. Ao utilizarmos essas ferramentas de forma responsável e ética, nosso objetivo é ampliar as possibilidades da comunicação e democratizar o acesso à informação de qualidade. 🤖
Procurando uma ferramenta de Inteligência Artificial para facilitar a sua vida? Neste guIA, você navega por um catálogo de robôs movidos a IA e conhece suas funcionalidades. Confira a avaliação que a nossa equipe de jornalistas deu para elas!
Este post foi modificado pela última vez em 28 de março de 2024 13:58
Sam Altman, CEO da OpenAI, Satya Nadella, CEO da Microsoft, e outros executivos de tecnologia…
Getimg.ai é um conjunto de ferramentas de IA para criação e edição de imagens. Ele…
As ações da Intel despencaram mais de 12% na sexta-feira (26) após uma previsão pessimista…
Os advogados de Tupac Shakur alertaram Drake que o levariam aos tribunais se ele não…
A startup de inteligência artificial (IA) Synthesia acaba de revelar uma nova geração de "Avatares…
O Deep Dream Generator é uma plataforma de inteligência artificial (IA) que permite criar imagens…