A Microsoft está treinando um novo modelo de linguagem de inteligência artificial (IA) grande o suficiente para competir com os da Alphabet’s Google e da OpenAI, revelou o Information nesta segunda-feira (6).
🇬🇧 Subscribe to the best newsletter about AI (in English 🇬🇧) 🇧🇷 Assine a melhor newsletter sobre IA (em português 🇧🇷)
O novo modelo, referido internamente como MAI-1, está sendo supervisionado pelo recém-contratado Mustafa Suleyman, co-fundador do Google DeepMind e ex-CEO da startup de IA Inflection, relatou o Information, citando dois funcionários da Microsoft com conhecimento do esforço.
O objetivo exato do modelo ainda não foi determinado e dependerá de seu desempenho. A Microsoft poderá apresentar uma prévia do novo modelo já em sua conferência para desenvolvedores Build ainda neste mês, conforme relatado.
O MAI-1 será “muito maior” do que os modelos menores e de código aberto que a Microsoft havia treinado anteriormente, o que significa que será mais caro, de acordo com o relatório.
No mês passado, a empresa lançou um modelo de inteligência artificial menor chamado Phi-3-mini, buscando atrair uma base de clientes mais ampla com opções mais acessíveis.
A empresa investiu bilhões de dólares na OpenAI e implantou a tecnologia do fabricante do ChatGPT em sua suíte de software de produtividade, permitindo-lhe assumir uma liderança inicial na corrida pela IA generativa.
A Microsoft reservou grandes clusters de servidores equipados com unidades de processamento gráfico da Nvidia, juntamente com grandes quantidades de dados para melhorar o modelo, de acordo com o relatório.
O MAI-1 terá aproximadamente 500 bilhões de parâmetros, disse o relatório, enquanto o GPT-4 da OpenAI é relatado ter um trilhão de parâmetros e o Phi-3 mini mede 3,8 bilhões de parâmetros.
A Microsoft escolheu Suleyman em março como chefe de sua unidade de IA do consumidor recém-criada e contratou vários funcionários da Inflection.
O novo modelo não é derivado da Inflection, embora possa se basear em dados de treinamento da startup, acrescentou o relatório.
Leia também:
Este post foi modificado pela última vez em 6 de maio de 2024 16:32
A gestão de crises tradicional - baseada em processos manuais e decisões centralizadas - mostra-se…
Empresas de redes sociais coletam, compartilham e processam vastos conjuntos de informações sobre seus usuários,…
A Salesforce, conhecida por revolucionar o setor de software com o modelo de Software como…
Um órgão consultivo de inteligência artificial (IA) das Nações Unidas divulgou na quinta-feira (19) seu…
A inteligência artificial (IA) está se espalhando por todo o portfólio de produtos do Google…
O LinkedIn começou a usar os dados de seus usuários para treinar modelos de inteligência…