O DBRX překonává přední open source modely, jako je Mixtral MoE, Llama-2 70B a Grok-1, v porozumění jazyku, programování a matematice.
PUBLICITA
Navíc je jeho odvození až 2x rychlejší než LLaMA2-70B a je asi o 40 % větší než Grok-1 celkový počet a počet aktivních parametrů.
Model také demonstruje nadřazenost nad GPT-3.5 v úlohách s dlouhým kontextem a benchmarcích RAG.
Překvapivě trvalo pouze 10 milionů dolarů a dva měsíce, než se DBRX naučil od nuly, což podtrhlo jeho efektivitu a efektivitu při vývoji jazykových modelů.
PUBLICITA
Vytvoření modelu GPT 3.5 úrovně společností Databricks za pouhých 10 milionů dolarů a dva měsíce nastavuje nový standard pro toto odvětví. Nicméně, i když je první místo v žebříčku open source působivé, brzký příchod společnosti Llama 3 velmi očekávaný meta naznačuje, že model pravděpodobně nezůstane na vrcholu dlouho.
Čtěte také:
* Text tohoto článku byl částečně generován nástroji umělé inteligence, nejmodernějšími jazykovými modely, které pomáhají při přípravě, kontrole, překladu a sumarizaci textů. Textové položky byly vytvořeny Curto Ke zlepšení konečného obsahu byly použity novinky a odpovědi z nástrojů AI.
Je důležité zdůraznit, že nástroje AI jsou pouze nástroje a konečnou odpovědnost za publikovaný obsah nese společnost Curto Zprávy. Odpovědným a etickým používáním těchto nástrojů je naším cílem rozšířit možnosti komunikace a demokratizovat přístup ke kvalitním informacím. 🤖
Hledáte nástroj umělé inteligence, který vám usnadní život? V tomto průvodci, můžete procházet katalog robotů s umělou inteligencí a dozvědět se o jejich funkcích. Podívejte se na hodnocení, které jim udělil náš tým novinářů!
PUBLICITA