이미지 출처: 재생산/Databricks

DBRX: Databricks, 경쟁사보다 뛰어난 고급 기능을 갖춘 오픈 소스 LLM 출시

Databricks는 고급 언어 및 코드 이해 기능을 갖춘 새로운 오픈 소스 LLM(대형 언어 모델)인 DBRX를 발표했습니다.

O DBRX Mixtral MoE, Llama-2 70B 및 Grok-1, 언어, 프로그래밍 및 수학을 이해합니다.

널리 알려짐

또한 추론 속도는 LLaMA2-2B보다 최대 70배 빠르며 크기는 LLaMA40-XNUMXB의 약 XNUMX%입니다. Grok총 및 활성 매개변수 수는 -1입니다.

이 모델은 또한 긴 컨텍스트 작업 및 RAG 벤치마크에서 GPT-3.5보다 우수함을 보여줍니다.

놀랍게도 DBRX를 처음부터 훈련하는 데 10만 달러와 XNUMX개월밖에 걸리지 않아 언어 모델 개발의 효율성과 효과가 강조되었습니다.

널리 알려짐

Databricks가 단 3.5만 달러와 10개월 만에 GPT 3 수준 모델을 만들어 업계의 새로운 표준을 설정했습니다. 그러나 오픈 소스 리더보드 XNUMX위를 차지한 것은 인상적이지만, 회사의 큰 기대를 받고 있는 Llama XNUMX의 출시가 임박했습니다. 메타 모델이 오랫동안 상위권에 머물 가능성이 낮다는 것을 암시합니다.

또한 읽기 :

* 이 기사의 텍스트는 텍스트 준비, 검토, 번역 및 요약을 지원하는 최첨단 언어 모델인 인공 지능 도구를 통해 부분적으로 생성되었습니다. 텍스트 항목은 다음에 의해 생성되었습니다. Curto AI 도구의 뉴스와 답변을 활용해 최종 콘텐츠를 개선했습니다.
AI 도구는 도구일 뿐이며 게시된 콘텐츠에 대한 최종 책임은 AI에게 있다는 점을 강조하는 것이 중요합니다. Curto 소식. 이러한 도구를 책임감 있고 윤리적으로 사용함으로써 우리의 목표는 커뮤니케이션 가능성을 확대하고 고품질 정보에 대한 접근을 민주화하는 것입니다.
🤖

당신의 삶을 더 쉽게 만들어 줄 인공 지능 도구를 찾고 계십니까? 이 가이드에서는에서 AI 기반 로봇 카탈로그를 탐색하고 해당 기능에 대해 알아봅니다. 우리 기자단이 내린 평가를 확인해보세요!

널리 알려짐

스크롤