O DBRX supera i principali modelli open source come Mixtral MoE, Llama-2 70B e Grok-1, nella comprensione del linguaggio, della programmazione e della matematica.
PUBBLICITÀ
Inoltre, la sua inferenza è fino a 2 volte più veloce di LLaMA2-70B ed è circa il 40% più grande di Grok-1 nel conteggio dei parametri totali e attivi.
Il modello dimostra inoltre superiorità rispetto a GPT-3.5 nelle attività a contesto lungo e nei benchmark RAG.
Sorprendentemente, ci sono voluti solo 10 milioni di dollari e due mesi per addestrare DBRX da zero, evidenziandone l’efficienza e l’efficacia nello sviluppo di modelli linguistici.
PUBBLICITÀ
La creazione da parte di Databricks di un modello di livello GPT 3.5 con soli 10 milioni di dollari e due mesi stabilisce un nuovo standard per il settore. Tuttavia, anche se la vetta della classifica open source è impressionante, l'imminente arrivo dell'attesissimo Llama 3 dell'azienda Meta suggerisce che è improbabile che il modello rimanga ai vertici a lungo.
Leggi anche:
* Il testo di questo articolo è stato parzialmente generato da strumenti di intelligenza artificiale, modelli linguistici all'avanguardia che aiutano nella preparazione, revisione, traduzione e sintesi dei testi. Le voci di testo sono state create da Curto Notizie e risposte dagli strumenti di intelligenza artificiale sono state utilizzate per migliorare il contenuto finale.
È importante sottolineare che gli strumenti di intelligenza artificiale sono solo strumenti e la responsabilità finale del contenuto pubblicato spetta a loro Curto Notizia. Utilizzando questi strumenti in modo responsabile ed etico, il nostro obiettivo è espandere le possibilità di comunicazione e democratizzare l'accesso a informazioni di qualità. 🤖
Cerchi uno strumento di Intelligenza Artificiale per semplificarti la vita? In questa guida, sfogli un catalogo di robot basati sull'intelligenza artificiale e scopri le loro funzionalità. Scopri la valutazione che il nostro team di giornalisti ha dato loro!
PUBBLICITÀ