O que significa o termo Zero-shot? | Glossário do Newsverso

Zero-shot é um termo usado em aprendizado de máquina e processamento de linguagem natural para descrever um tipo de modelo que é capaz de realizar tarefas sem a necessidade de treinamento específico para cada tarefa individual.

Publicado por
Curto IA

Em outras palavras, um modelo zero-shot pode realizar várias tarefas diferentes sem ter sido exposto a exemplos específicos de cada uma delas durante o treinamento.

Essa habilidade é alcançada através de técnicas de transferência de aprendizado, onde o modelo é treinado em uma tarefa ampla e geral que abrange várias informações e contextos. Essa tarefa ampla é projetada para capacitar o modelo a aprender padrões e representações mais abstratas da linguagem.

Quando um modelo zero-shot é aplicado a uma tarefa específica, ele pode usar esse conhecimento prévio para inferir a resposta ou realizar a tarefa sem ter sido treinado em exemplos diretos dessa tarefa. Essa capacidade é extremamente útil, pois reduz a necessidade de treinamento intensivo e o esforço humano para rotular grandes quantidades de dados para cada tarefa individual.

Geralmente, os modelos zero-shot são capazes de realizar tarefas como classificação de texto, tradução, geração de respostas e muitas outras, sem precisar de treinamento específico para cada uma delas. O GPT-3, uma versão anterior deste modelo com base na arquitetura GPT-3.5, também tem a capacidade de realizar tarefas zero-shot, demonstrando sua flexibilidade e generalidade.

Referências:

  • Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI.
  • Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., … & Amodei, D. (2020). Language Models are Few-Shot Learners. OpenAI.

*O texto desta matéria foi parcialmente gerado pelo ChatGPT, um modelo de linguagem baseado em inteligência artificial desenvolvido pela OpenAI. As entradas de texto foram criadas pelo Curto News e as respostas intencionalmente reproduzidas na íntegra. As respostas do ChatGPT são geradas automaticamente e não representam opiniões da OpenAI ou de pessoas associadas ao modelo. Toda a responsabilidade pelo conteúdo publicado é do Curto News.

Saiba também:

Este post foi modificado pela última vez em %s = human-readable time difference 12:20

Curto IA

Posts recentes

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024

Robôs da Figure transformam produção da BMW; saiba como

Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…

20 de novembro de 2024

Microsoft revela agentes de IA especializados e ferramentas de automação

A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…

20 de novembro de 2024