Cerebras lança ferramenta de inferência de IA para desafiar a Nvidia

Cerebras lança ferramenta de inferência de IA para desafiar a Nvidia

A Cerebras Systems lançou na terça-feira (27) uma ferramenta para desenvolvedores de inteligência artificial (IA) que permite que eles acessem os chips gigantescos da startup para executar aplicativos, oferecendo o que diz ser uma opção muito mais barata do que os processadores padrão da indústria, da Nvidia.

PUBLICIDADE

O acesso às unidades de processamento gráfico (GPUs) da Nvidia – muitas vezes por meio de um provedor de computação em nuvem – para treinar e implantar grandes modelos de inteligência artificial usados para aplicativos como o ChatGPT da OpenAI pode ser difícil de obter e caro de executar, um processo que os desenvolvedores chamam de inferência.

“Estamos entregando desempenho que não pode ser alcançado por uma GPU”, disse o CEO da Cerebras, Andrew Feldman, em uma entrevista à Reuters. “Estamos fazendo isso com a mais alta precisão e estamos oferecendo isso pelo menor preço.”

A parte de inferência do mercado de IA é esperada que seja de rápido crescimento e atraente – no final das contas valendo dezenas de bilhões de dólares se consumidores e empresas adotarem ferramentas de IA.

PUBLICIDADE

A empresa com sede em Sunnyvale, Califórnia, planeja oferecer vários tipos do produto de inferência por meio de uma chave de desenvolvedor e sua nuvem. A empresa também venderá seus sistemas de IA para clientes que preferem operar seus próprios data centers.

Os chips da Cerebras – cada um do tamanho de um prato de jantar e chamados de Wafer Scale Engines – evitam um dos problemas com a computação de dados de IA: os dados computados por grandes modelos que alimentam aplicativos de IA normalmente não cabem em um único chip e podem exigir centenas ou milhares de chips encadeados.

Isso significa que os chips da Cerebras podem alcançar desempenhos mais rápidos, disse Feldman.

PUBLICIDADE

Ela planeja cobrar dos usuários tão pouco quanto 10 centavos por milhão de tokens, que são uma das maneiras pelas quais as empresas podem medir a quantidade de dados de saída de um grande modelo.

Leia também:

Rolar para cima