O que significa o termo Zero-shot? | Glossário do Newsverso

Zero-shot é um termo usado em aprendizado de máquina e processamento de linguagem natural para descrever um tipo de modelo que é capaz de realizar tarefas sem a necessidade de treinamento específico para cada tarefa individual.

Publicado por
Curto IA

Em outras palavras, um modelo zero-shot pode realizar várias tarefas diferentes sem ter sido exposto a exemplos específicos de cada uma delas durante o treinamento.

Essa habilidade é alcançada através de técnicas de transferência de aprendizado, onde o modelo é treinado em uma tarefa ampla e geral que abrange várias informações e contextos. Essa tarefa ampla é projetada para capacitar o modelo a aprender padrões e representações mais abstratas da linguagem.

Quando um modelo zero-shot é aplicado a uma tarefa específica, ele pode usar esse conhecimento prévio para inferir a resposta ou realizar a tarefa sem ter sido treinado em exemplos diretos dessa tarefa. Essa capacidade é extremamente útil, pois reduz a necessidade de treinamento intensivo e o esforço humano para rotular grandes quantidades de dados para cada tarefa individual.

Geralmente, os modelos zero-shot são capazes de realizar tarefas como classificação de texto, tradução, geração de respostas e muitas outras, sem precisar de treinamento específico para cada uma delas. O GPT-3, uma versão anterior deste modelo com base na arquitetura GPT-3.5, também tem a capacidade de realizar tarefas zero-shot, demonstrando sua flexibilidade e generalidade.

Referências:

  • Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI.
  • Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., … & Amodei, D. (2020). Language Models are Few-Shot Learners. OpenAI.

*O texto desta matéria foi parcialmente gerado pelo ChatGPT, um modelo de linguagem baseado em inteligência artificial desenvolvido pela OpenAI. As entradas de texto foram criadas pelo Curto News e as respostas intencionalmente reproduzidas na íntegra. As respostas do ChatGPT são geradas automaticamente e não representam opiniões da OpenAI ou de pessoas associadas ao modelo. Toda a responsabilidade pelo conteúdo publicado é do Curto News.

Saiba também:

Este post foi modificado pela última vez em 24 de julho de 2023 12:20

Curto IA

Posts recentes

Como clonar sua voz usando inteligência artificial

Um novo modelo no Replicate chamado OpenVoice permite que você clone qualquer voz gratuitamente, bastando…

16 de maio de 2024

Busca de vídeos do Gemini comete erro factual em demonstração

Uma das demonstrações mais chamativas do Gemini durante o evento do Google I/O foi mais…

16 de maio de 2024

Hugging Face doa poder computacional de US$ 10 milhões para competir com gigantes da IA

O Hugging Face, um dos maiores nomes do aprendizado de máquina, está investindo US$ 10…

16 de maio de 2024

Outlier: Conectando especialistas em IA pelo mundo

O Outlier é uma plataforma feita para conectar especialistas nas diversas áreas de inteligência artificial…

16 de maio de 2024

Futuro incerto: Stability AI busca comprador em meio a crise financeira

Enfrentando uma crise de caixa, o The Information relatou que a startup britânica, Stability AI, conversou com…

16 de maio de 2024

Chatbot Grok chega à Europa; saiba mais

O chatbot Grok, da xAI de Elon Musk, agora está disponível na Europa - após…

16 de maio de 2024