Hugging Face lança novos modelos de geração de código StarCoder
Créditos da imagem: Reprodução/Hugging Face

Hugging Face lança novos modelos de geração de código StarCoder

O Hugging Face revelou a versão mais recente de seu modelo de geração de código StarCoder – contando com a ajuda da Nvidia para trazê-lo à vida.

O StarCoder original, construído em conjunto com o ServiceNow, foi lançado em maio passado. Esta nova versão, StarCoder2, pode gerar código em mais de 600 linguagens de programação.

PUBLICIDADE

O StarCoder2 vem em três tamanhos, mas foi projetado para ser pequeno – a versão maior tem 15 bilhões de parâmetros – para que os desenvolvedores possam executá-lo com mais eficiência em seus PCs.

As novas versões do StarCoder também são mais poderosas, com o menor do grupo correspondendo ao desempenho do modelo original de 15 bilhões de parâmetros do StarCoder. StarCoder2-15B é o melhor em sua classe de tamanho e corresponde a modelos com o dobro do seu tamanho.

Participação da Nvidia

Uma nova adição ao projeto StarCoder foi a Nvidia. A infraestrutura da gigante fabricante de chips de IA foi usada para treinar a versão de 15 bilhões de parâmetros. A ServiceNow treinou o modelo 3B enquanto a Hugging Face assumiu a responsabilidade pela versão 7B.

PUBLICIDADE

A Nvidia também utilizou sua estrutura NeMo usada no desenvolvimento do maior modelo StarCoder2. NeMo permite que os usuários criem modelos e serviços de IA generativos personalizados.

Jonathan Cohen, vice-presidente de pesquisa aplicada da Nvidia, disse que seu envolvimento no projeto StarCoder “introduz modelos seguros e desenvolvidos de forma responsável e apoia um acesso mais amplo à IA generativa responsável que acreditamos que beneficiará a comunidade global”.

Para acessar o conjunto de dados, vá para Hugging Face. Para baixá-lo em massa, os usuários precisam obter permissão do Software Heritage e Inria.

PUBLICIDADE

Como o The Stack v2 é composto de vários códigos-fonte, há várias licenças a serem enfrentadas, portanto, pode não estar claro se todo o conjunto de dados pode alimentar aplicativos comerciais. Hugging Face compilou uma lista das licenças relevantes para garantir a conformidade.

Leia também:

Rolar para cima