Inteligência Artificial

Amazon e Hugging Face se unem para rodar modelos de IA em chips personalizados

Publicado por
Isabella Caminoto

A Amazon Web Services (AWS), divisão de computação em nuvem da Amazon.com, anunciou na quarta-feira (24) uma parceria com a startup de inteligência artificial (IA) Hugging Face. O objetivo é facilitar a execução de milhares de modelos de IA nos chips personalizados da Amazon.

Avaliada em US$ 4,5 bilhões, a Hugging Face se tornou um centro crucial para pesquisadores e desenvolvedores de IA compartilharem chatbots e outros softwares de IA. A startup conta com o apoio de gigantes como a própria Amazon, Google (Alphabet) e Nvidia. Ela funciona como o principal hub para obtenção e ajustes de modelos de IA open-source, como o Llama 3 da Meta Platforms.

Depois de ajustar um modelo de IA open-source, os desenvolvedores geralmente buscam implementá-lo em softwares. A parceria anunciada permitirá rodar esses modelos no chip Inferentia2, desenvolvido pela AWS.

“Para nós, a eficiência é fundamental. Queremos garantir que o máximo de pessoas possa rodar modelos de forma econômica”, afirma Jeff Boudier, chefe de produto e crescimento da Hugging Face.

A AWS espera atrair mais desenvolvedores de IA para seus serviços de cloud computing. Embora a Nvidia domine o mercado de treinamento de modelos, a AWS argumenta que seus chips podem executar esses modelos treinados (um processo chamado inferência) a um custo mais baixo a longo prazo.

“Você treina esses modelos talvez uma vez por mês. Mas a inferência pode ser feita dezenas de milhares de vezes por hora. É nesse ponto que o Inferentia2 se destaca”, explica Matt Wood, responsável por produtos de inteligência artificial na AWS.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 20:17

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024