Conheça o Falcon 180B, poderoso modelo de linguagem de código aberto

O Falcon 180B é um modelo de linguagem de código aberto criado pelo Instituto de Inovação Tecnológica (TII). É um dos maiores modelos de linguagem já criados, com 180 bilhões de parâmetros. Ele foi treinado em um conjunto de dados de 3,5 trilhões de tokens, o que lhe permite realizar uma ampla gama de tarefas de linguagem natural, incluindo tradução, resumo, geração de texto e resposta a perguntas.

Publicado por
Uesley Durães

O Falcon 180B obtém resultados de ponta em tarefas de linguagem natural, superando a tabela de classificação do Hugging Face para modelos de acesso aberto pré-treinados. No entanto, o modelo tem uma falha importante: ele carece de grades de proteção de alinhamento. Isso significa que o modelo pode produzir saídas problemáticas, especialmente se solicitado.

O TII lançou recentemente dois modelos Falcon 180B: uma versão base e uma versão ajustada nos dados de bate-papo e instruções. A versão base está disponível para uso comercial, mas sob condições muito restritivas. A licença completa está disponível no site do TII.

Aqui estão alguns detalhes adicionais sobre o Falcon 180B:

  • O modelo foi treinado em um conjunto de dados de texto e código da web.
  • O Falcon 180B pode gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder às suas perguntas de forma informativa.
  • O modelo ainda está em desenvolvimento e os pesquisadores do TII estão trabalhando para melhorar suas habilidades e resolver suas limitações.

O Falcon 180B é um modelo de linguagem poderoso com potencial para uma ampla gama de aplicações. No entanto, os usuários devem estar cientes de suas limitações antes de usá-lo. Apesar disso, o modelo se mostra promissor, já que funciona em código aberto.

Veja também:

Este post foi modificado pela última vez em 13 de setembro de 2023 12:28

Uesley Durães

Posts recentes

Transforme seus documentos em planilhas com o ChatGPT

Com apenas um comando simples, o ChatGPT pode analisar documentos, responder perguntas, fazer cálculos e…

30 de junho de 2024

Data centers no espaço: a solução da Europa para a fome de energia da IA?

A explosão da inteligência artificial (IA) está exigindo cada vez mais data centers para processar…

30 de junho de 2024

Meta inicia testes de chatbots de IA criados por usuários no Instagram

Mark Zuckerberg, CEO da Meta, anunciou que a empresa vai começar a liberar no Instagram…

29 de junho de 2024

Watson: Saiba mais sobre o analista de dados com IA da IBM

Watson é uma plataforma de IA desenvolvida pela IBM, conhecida por sua capacidade de treinar,…

29 de junho de 2024

Centro de Jornalismo Investigativo processa OpenAI e Microsoft por violação de direitos autorais

O Centro de Jornalismo Investigativo (CJI), organização sem fins lucrativos responsável pelo Mother Jones e…

28 de junho de 2024

Gigantes da tecnologia na mira da Europa: acordos de IA de Microsoft e Google sob investigação

A parceria da Microsoft com a OpenAI e o acordo de inteligência artificial (IA) do…

28 de junho de 2024