A Microsoft está treinando um novo modelo de linguagem de inteligência artificial (IA) grande o suficiente para competir com os da Alphabet’s Google e da OpenAI, revelou o Information nesta segunda-feira (6).
🇬🇧 Subscribe to the best newsletter about AI (in English 🇬🇧) 🇧🇷 Assine a melhor newsletter sobre IA (em português 🇧🇷)
O novo modelo, referido internamente como MAI-1, está sendo supervisionado pelo recém-contratado Mustafa Suleyman, co-fundador do Google DeepMind e ex-CEO da startup de IA Inflection, relatou o Information, citando dois funcionários da Microsoft com conhecimento do esforço.
O objetivo exato do modelo ainda não foi determinado e dependerá de seu desempenho. A Microsoft poderá apresentar uma prévia do novo modelo já em sua conferência para desenvolvedores Build ainda neste mês, conforme relatado.
O MAI-1 será “muito maior” do que os modelos menores e de código aberto que a Microsoft havia treinado anteriormente, o que significa que será mais caro, de acordo com o relatório.
No mês passado, a empresa lançou um modelo de inteligência artificial menor chamado Phi-3-mini, buscando atrair uma base de clientes mais ampla com opções mais acessíveis.
A empresa investiu bilhões de dólares na OpenAI e implantou a tecnologia do fabricante do ChatGPT em sua suíte de software de produtividade, permitindo-lhe assumir uma liderança inicial na corrida pela IA generativa.
A Microsoft reservou grandes clusters de servidores equipados com unidades de processamento gráfico da Nvidia, juntamente com grandes quantidades de dados para melhorar o modelo, de acordo com o relatório.
O MAI-1 terá aproximadamente 500 bilhões de parâmetros, disse o relatório, enquanto o GPT-4 da OpenAI é relatado ter um trilhão de parâmetros e o Phi-3 mini mede 3,8 bilhões de parâmetros.
A Microsoft escolheu Suleyman em março como chefe de sua unidade de IA do consumidor recém-criada e contratou vários funcionários da Inflection.
O novo modelo não é derivado da Inflection, embora possa se basear em dados de treinamento da startup, acrescentou o relatório.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 16:32
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…
A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…
Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…
A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…