画像クレジット: Reproduction/Databricks

DBRX: Databricks が競合他社を上回る高度な機能を備えたオープンソース LLM を発表

Databricks は、高度な言語およびコード理解機能を備えた新しいオープンソースの大規模言語モデル (LLM) である DBRX を発表しました。

O DBRX Mixtral MoE、Llama-2 70B、および Grok-1、言語、プログラミング、数学の理解。

宣伝

さらに、その推論は LLaMA2-2B よりも最大 70 倍高速で、サイズは LLaMA40-XNUMXB の約 XNUMX% です。 Grok合計とアクティブなパラメータの数は -1 です。

このモデルは、長いコンテキストのタスクや RAG ベンチマークにおいて GPT-3.5 よりも優れていることも示しています。

驚くべきことに、DBRX をゼロからトレーニングするのに要した時間はわずか 10 万ドルと XNUMX か月であり、言語モデルの開発における効率と有効性が強調されました。

宣伝

Databricks は、わずか 3.5 万ドルと 10 か月で GPT 3 レベルのモデルを作成し、業界の新たな標準を確立しました。しかし、オープンソースのリーダーボードでトップに立っているのは素晴らしいことですが、同社の待望の Llama XNUMX が間もなく登場します。 Meta このモデルが長期間トップに留まり続ける可能性は低いことを示唆しています。

また、お読みください。

* この記事のテキストの一部は、テキストの準備、レビュー、翻訳、要約を支援する最先端の言語モデルである人工知能ツールによって生成されました。テキストエントリは、 Curto AI ツールからのニュースと応答は、最終的なコンテンツを改善するために使用されました。
AI ツールは単なるツールであり、公開されたコンテンツに対する最終的な責任は AI ツールにあることを強調することが重要です。 Curto ニュース。これらのツールを責任を持って倫理的に使用することで、コミュニケーションの可能性を拡大し、質の高い情報へのアクセスを民主化することが私たちの目的です。
🤖

あなたの生活を楽にする人工知能ツールをお探しですか? このガイドではでは、AI 搭載ロボットのカタログを閲覧し、その機能について学びます。ジャーナリストチームが彼らに与えた評価をチェックしてください!

宣伝

スクロールアップする