Chatbots de inteligência artificial, como o ChatGPT da OpenAI, podem construir um software de maneira rápida e econômica, com intervenção humana mínima. Isso é o que indica um novo estudo conduzido por pesquisadores da Brown University e de várias universidades chinesas, que avaliariam se bots de IA alimentados por uma versão do modelo 3.5 do ChatGPT poderiam completar o processo de desenvolvimento de software sem treinamento prévio.
Para testar isso, os pesquisadores criaram uma hipotética empresa de desenvolvimento de software chamada ChatDev. Com base no modelo cascata – uma abordagem sequencial para a criação de software – a empresa foi dividida em quatro etapas em ordem cronológica: design, codificação, teste e documentação.
A partir daí, os pesquisadores atribuíram funções específicas aos bots de IA. Durante cada etapa, os chatbots conversaram uns com os outros com o mínimo de intervenção humana para concluir partes específicas do processo de desenvolvimento de software até que o software estivesse completo.
Depois de atribuir 70 tarefas ao ChatDev, o estudo descobriu que a empresa alimentada por IA foi capaz de concluir o processo completo de desenvolvimento de software “em menos de sete minutos, a um custo de menos de um dólar”, em média – tudo isso enquanto identificava e solucionava “vulnerabilidades potenciais”. Cerca de 86,66% dos sistemas de software gerados foram executados sem falhas, de acordo com os pesquisadores.
Este post foi modificado pela última vez em %s = human-readable time difference 15:00
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…