Zero-shot é um termo usado em aprendizado de máquina e processamento de linguagem natural para descrever um tipo de modelo que é capaz de realizar tarefas sem a necessidade de treinamento específico para cada tarefa individual.
Em outras palavras, um modelo zero-shot pode realizar várias tarefas diferentes sem ter sido exposto a exemplos específicos de cada uma delas durante o treinamento.
Essa habilidade é alcançada através de técnicas de transferência de aprendizado, onde o modelo é treinado em uma tarefa ampla e geral que abrange várias informações e contextos. Essa tarefa ampla é projetada para capacitar o modelo a aprender padrões e representações mais abstratas da linguagem.
Quando um modelo zero-shot é aplicado a uma tarefa específica, ele pode usar esse conhecimento prévio para inferir a resposta ou realizar a tarefa sem ter sido treinado em exemplos diretos dessa tarefa. Essa capacidade é extremamente útil, pois reduz a necessidade de treinamento intensivo e o esforço humano para rotular grandes quantidades de dados para cada tarefa individual.
Geralmente, os modelos zero-shot são capazes de realizar tarefas como classificação de texto, tradução, geração de respostas e muitas outras, sem precisar de treinamento específico para cada uma delas. O GPT-3, uma versão anterior deste modelo com base na arquitetura GPT-3.5, também tem a capacidade de realizar tarefas zero-shot, demonstrando sua flexibilidade e generalidade.
Referências:
*O texto desta matéria foi parcialmente gerado pelo ChatGPT, um modelo de linguagem baseado em inteligência artificial desenvolvido pela OpenAI. As entradas de texto foram criadas pelo Curto News e as respostas intencionalmente reproduzidas na íntegra. As respostas do ChatGPT são geradas automaticamente e não representam opiniões da OpenAI ou de pessoas associadas ao modelo. Toda a responsabilidade pelo conteúdo publicado é do Curto News.
Saiba também:
Este post foi modificado pela última vez em %s = human-readable time difference 12:20
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…