Google adiciona dois novos modelos de IA ao Gemma

O Google revelou o Gemma – sua família de Modelos de Linguagem Grande (LLMs) leves para desenvolvedores de código aberto – em fevereiro. Pesquisadores do Google DeepMind o desenvolveram com o intuito de auxiliar desenvolvedores e pesquisadores na construção responsável de inteligência artificial (IA).

PUBLICIDADE

Agora, anunciaram duas novas adições ao GemmaCodeGemma e RecurrentGemma. Com essa iniciativa, o Google DeepMind pretende manter o ritmo na corrida pela IA, enfrentando a concorrência de gigantes como OpenAI e Microsoft.

Embora a empresa tenha se encontrado em águas turbulentas devido a algumas capacidades de IA de seu modelo de IA mais popular, Gemini, parece que a controvérsia não desacelerou os pesquisadores. Esses novos modelos de IA prometem possibilidades de inovação para desenvolvedores de Aprendizado de Máquina (ML).

Saiba mais sobre os dois novos modelos de IA da Gemma – CodeGemma e Recurrent Gemma

PUBLICIDADE

Google CodeGemma

O primeiro dos dois novos modelos de IA é o CodeGemma, um modelo leve com capacidades de codificação e seguimento de instruções. Está disponível em três variantes:

1. Variante pré-treinada de 7B para tarefas de conclusão e geração de código.

2. Variante ajustada para instruções de 7B para seguimento de instruções e bate-papo de código.

PUBLICIDADE

3. Variante pré-treinada de 2B para conclusão rápida de código em PCs locais.

O Google afirma que o CodeGemma não apenas pode gerar linhas e funções, mas também criar blocos de código, independentemente de estar sendo usado localmente em PCs ou via recursos na nuvem. Ele possui proficiência em vários idiomas, o que significa que você pode usá-lo como assistente ao codificar em linguagens como Python, JavaScript e Java. O código gerado pelo CodeGemma não só é anunciado como sendo sintaticamente preciso, mas também semanticamente correto. Isso promete reduzir erros e tempo de depuração.

Este novo modelo de IA é treinado em 500 bilhões de tokens de dados, principalmente em inglês, incluindo código de repositórios publicamente disponíveis, matemática e documentos na web.

PUBLICIDADE

Google Recurrent Gemma

O outro modelo de IA, chamado RecurrentGemma, tem como objetivo melhorar a eficiência de memória aproveitando redes neurais recorrentes e atenção local. Assim, destina-se à experimentação de pesquisa. Embora entregue desempenho de benchmark similar ao modelo de IA Gemma 2B do DeepMind, o RecurrentGemma tem uma arquitetura única que permite fornecer em três frentes – uso reduzido de memória, maior throughput e inovação em pesquisa.

Segundo o Google, o RecurrentGemma pode gerar amostras mais longas mesmo em dispositivos com memória limitada devido aos requisitos de memória mais baixos. Isso também permite que o modelo de IA execute inferência em lotes grandes, aumentando os tokens por segundo. O Google também afirma que modelos baseados em Transformadores, como Gemma, podem diminuir à medida que as sequências ficam mais longas. Por outro lado, o RecurrentGemma mantém sua velocidade de amostragem independentemente do comprimento da sequência.

Leia também:

* O texto desta matéria foi parcialmente gerado por ferramentas de inteligência artificial, modelos de linguagem de última geração que auxiliam na elaboração, revisão, tradução e resumos de textos. As entradas de texto foram criadas pela equipe do Curto News e as respostas das ferramentas de IA foram utilizadas para aprimorar o conteúdo final.
É importante destacar que as ferramentas de IA são apenas ferramentas, e a responsabilidade final pelo conteúdo publicado é do Curto News. Ao utilizarmos essas ferramentas de forma responsável e ética, nosso objetivo é ampliar as possibilidades da comunicação e democratizar o acesso à informação de qualidade.
🤖

PUBLICIDADE

Procurando uma ferramenta de Inteligência Artificial para facilitar a sua vida? Neste guIA, você navega por um catálogo de robôs movidos a IA e conhece suas funcionalidades. Confira a avaliação que a nossa equipe de jornalistas deu para elas!

Rolar para cima