A Cerebras Systems lançou na terça-feira (27) uma ferramenta para desenvolvedores de inteligência artificial (IA) que permite que eles acessem os chips gigantescos da startup para executar aplicativos, oferecendo o que diz ser uma opção muito mais barata do que os processadores padrão da indústria, da Nvidia.
O acesso às unidades de processamento gráfico (GPUs) da Nvidia – muitas vezes por meio de um provedor de computação em nuvem – para treinar e implantar grandes modelos de inteligência artificial usados para aplicativos como o ChatGPT da OpenAI pode ser difícil de obter e caro de executar, um processo que os desenvolvedores chamam de inferência.
“Estamos entregando desempenho que não pode ser alcançado por uma GPU”, disse o CEO da Cerebras, Andrew Feldman, em uma entrevista à Reuters. “Estamos fazendo isso com a mais alta precisão e estamos oferecendo isso pelo menor preço.”
A parte de inferência do mercado de IA é esperada que seja de rápido crescimento e atraente – no final das contas valendo dezenas de bilhões de dólares se consumidores e empresas adotarem ferramentas de IA.
A empresa com sede em Sunnyvale, Califórnia, planeja oferecer vários tipos do produto de inferência por meio de uma chave de desenvolvedor e sua nuvem. A empresa também venderá seus sistemas de IA para clientes que preferem operar seus próprios data centers.
Os chips da Cerebras – cada um do tamanho de um prato de jantar e chamados de Wafer Scale Engines – evitam um dos problemas com a computação de dados de IA: os dados computados por grandes modelos que alimentam aplicativos de IA normalmente não cabem em um único chip e podem exigir centenas ou milhares de chips encadeados.
Isso significa que os chips da Cerebras podem alcançar desempenhos mais rápidos, disse Feldman.
Ela planeja cobrar dos usuários tão pouco quanto 10 centavos por milhão de tokens, que são uma das maneiras pelas quais as empresas podem medir a quantidade de dados de saída de um grande modelo.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 13:27
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…