O Falcon 180B é um modelo de linguagem de código aberto criado pelo Instituto de Inovação Tecnológica (TII). É um dos maiores modelos de linguagem já criados, com 180 bilhões de parâmetros. Ele foi treinado em um conjunto de dados de 3,5 trilhões de tokens, o que lhe permite realizar uma ampla gama de tarefas de linguagem natural, incluindo tradução, resumo, geração de texto e resposta a perguntas.
O Falcon 180B obtém resultados de ponta em tarefas de linguagem natural, superando a tabela de classificação do Hugging Face para modelos de acesso aberto pré-treinados. No entanto, o modelo tem uma falha importante: ele carece de grades de proteção de alinhamento. Isso significa que o modelo pode produzir saídas problemáticas, especialmente se solicitado.
O TII lançou recentemente dois modelos Falcon 180B: uma versão base e uma versão ajustada nos dados de bate-papo e instruções. A versão base está disponível para uso comercial, mas sob condições muito restritivas. A licença completa está disponível no site do TII.
O Falcon 180B é um modelo de linguagem poderoso com potencial para uma ampla gama de aplicações. No entanto, os usuários devem estar cientes de suas limitações antes de usá-lo. Apesar disso, o modelo se mostra promissor, já que funciona em código aberto.
Veja também:
Este post foi modificado pela última vez em 13 de setembro de 2023 12:28
Com apenas um comando simples, o ChatGPT pode analisar documentos, responder perguntas, fazer cálculos e…
A explosão da inteligência artificial (IA) está exigindo cada vez mais data centers para processar…
Mark Zuckerberg, CEO da Meta, anunciou que a empresa vai começar a liberar no Instagram…
Watson é uma plataforma de IA desenvolvida pela IBM, conhecida por sua capacidade de treinar,…
O Centro de Jornalismo Investigativo (CJI), organização sem fins lucrativos responsável pelo Mother Jones e…
A parceria da Microsoft com a OpenAI e o acordo de inteligência artificial (IA) do…