Inteligência Artificial

Cerebras lança ferramenta de inferência de IA para desafiar a Nvidia

Publicado por
Isabella Caminoto

A Cerebras Systems lançou na terça-feira (27) uma ferramenta para desenvolvedores de inteligência artificial (IA) que permite que eles acessem os chips gigantescos da startup para executar aplicativos, oferecendo o que diz ser uma opção muito mais barata do que os processadores padrão da indústria, da Nvidia.

O acesso às unidades de processamento gráfico (GPUs) da Nvidia – muitas vezes por meio de um provedor de computação em nuvem – para treinar e implantar grandes modelos de inteligência artificial usados para aplicativos como o ChatGPT da OpenAI pode ser difícil de obter e caro de executar, um processo que os desenvolvedores chamam de inferência.

“Estamos entregando desempenho que não pode ser alcançado por uma GPU”, disse o CEO da Cerebras, Andrew Feldman, em uma entrevista à Reuters. “Estamos fazendo isso com a mais alta precisão e estamos oferecendo isso pelo menor preço.”

A parte de inferência do mercado de IA é esperada que seja de rápido crescimento e atraente – no final das contas valendo dezenas de bilhões de dólares se consumidores e empresas adotarem ferramentas de IA.

A empresa com sede em Sunnyvale, Califórnia, planeja oferecer vários tipos do produto de inferência por meio de uma chave de desenvolvedor e sua nuvem. A empresa também venderá seus sistemas de IA para clientes que preferem operar seus próprios data centers.

Os chips da Cerebras – cada um do tamanho de um prato de jantar e chamados de Wafer Scale Engines – evitam um dos problemas com a computação de dados de IA: os dados computados por grandes modelos que alimentam aplicativos de IA normalmente não cabem em um único chip e podem exigir centenas ou milhares de chips encadeados.

Isso significa que os chips da Cerebras podem alcançar desempenhos mais rápidos, disse Feldman.

Ela planeja cobrar dos usuários tão pouco quanto 10 centavos por milhão de tokens, que são uma das maneiras pelas quais as empresas podem medir a quantidade de dados de saída de um grande modelo.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 13:27

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024