Microsoft anuncia novo modelo de IA rival do Google e OpenAI

Publicado por

Vinicius Siqueira

6 de maio de 2024 16:31

A Microsoft está treinando um novo modelo de linguagem de inteligência artificial (IA) grande o suficiente para competir com os da Alphabet’s Google e da OpenAI, revelou o Information nesta segunda-feira (6).

🇬🇧 Subscribe to the best newsletter about AI (in English 🇬🇧) 

🇧🇷 Assine a melhor newsletter sobre IA (em português 🇧🇷)

O novo modelo, referido internamente como MAI-1, está sendo supervisionado pelo recém-contratado Mustafa Suleyman, co-fundador do Google DeepMind e ex-CEO da startup de IA Inflection, relatou o Information, citando dois funcionários da Microsoft com conhecimento do esforço.

O objetivo exato do modelo ainda não foi determinado e dependerá de seu desempenho. A Microsoft poderá apresentar uma prévia do novo modelo já em sua conferência para desenvolvedores Build ainda neste mês, conforme relatado.

O MAI-1 será “muito maior” do que os modelos menores e de código aberto que a Microsoft havia treinado anteriormente, o que significa que será mais caro, de acordo com o relatório.

No mês passado, a empresa lançou um modelo de inteligência artificial menor chamado Phi-3-mini, buscando atrair uma base de clientes mais ampla com opções mais acessíveis.

A empresa investiu bilhões de dólares na OpenAI e implantou a tecnologia do fabricante do ChatGPT em sua suíte de software de produtividade, permitindo-lhe assumir uma liderança inicial na corrida pela IA generativa.

A Microsoft reservou grandes clusters de servidores equipados com unidades de processamento gráfico da Nvidia, juntamente com grandes quantidades de dados para melhorar o modelo, de acordo com o relatório.

O MAI-1 terá aproximadamente 500 bilhões de parâmetros, disse o relatório, enquanto o GPT-4 da OpenAI é relatado ter um trilhão de parâmetros e o Phi-3 mini mede 3,8 bilhões de parâmetros.

A Microsoft escolheu Suleyman em março como chefe de sua unidade de IA do consumidor recém-criada e contratou vários funcionários da Inflection.

O novo modelo não é derivado da Inflection, embora possa se basear em dados de treinamento da startup, acrescentou o relatório.

Leia também:

Novo iPad Pro da Apple deve se transformar num substituto para valer do laptop

Este post foi modificado pela última vez em %s = human-readable time difference 16:32

Vinicius Siqueira