Cerebras lança ferramenta de inferência de IA para desafiar a Nvidia

Publicado por

Isabella Caminoto

27 de agosto de 2024 16:00

A Cerebras Systems lançou na terça-feira (27) uma ferramenta para desenvolvedores de inteligência artificial (IA) que permite que eles acessem os chips gigantescos da startup para executar aplicativos, oferecendo o que diz ser uma opção muito mais barata do que os processadores padrão da indústria, da Nvidia.

O acesso às unidades de processamento gráfico (GPUs) da Nvidia – muitas vezes por meio de um provedor de computação em nuvem – para treinar e implantar grandes modelos de inteligência artificial usados para aplicativos como o ChatGPT da OpenAI pode ser difícil de obter e caro de executar, um processo que os desenvolvedores chamam de inferência.

“Estamos entregando desempenho que não pode ser alcançado por uma GPU”, disse o CEO da Cerebras, Andrew Feldman, em uma entrevista à Reuters. “Estamos fazendo isso com a mais alta precisão e estamos oferecendo isso pelo menor preço.”

A parte de inferência do mercado de IA é esperada que seja de rápido crescimento e atraente – no final das contas valendo dezenas de bilhões de dólares se consumidores e empresas adotarem ferramentas de IA.

A empresa com sede em Sunnyvale, Califórnia, planeja oferecer vários tipos do produto de inferência por meio de uma chave de desenvolvedor e sua nuvem. A empresa também venderá seus sistemas de IA para clientes que preferem operar seus próprios data centers.

Os chips da Cerebras – cada um do tamanho de um prato de jantar e chamados de Wafer Scale Engines – evitam um dos problemas com a computação de dados de IA: os dados computados por grandes modelos que alimentam aplicativos de IA normalmente não cabem em um único chip e podem exigir centenas ou milhares de chips encadeados.

Isso significa que os chips da Cerebras podem alcançar desempenhos mais rápidos, disse Feldman.

Ela planeja cobrar dos usuários tão pouco quanto 10 centavos por milhão de tokens, que são uma das maneiras pelas quais as empresas podem medir a quantidade de dados de saída de um grande modelo.

Leia também:

ActFound: A IA que pode salvar milhões de vidas, acelerando a criação de novos medicamentos

Este post foi modificado pela última vez em %s = human-readable time difference 13:27

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.