Inteligência Artificial

‘Mapeando a Mente de Grandes Modelos de Linguagem’: Entenda a pesquisa da Anthropic

Publicado por
Juliana Caminoto

A Anthropic lançou recentemente uma pesquisa inovadora que conseguiu identificar e mapear – com sucesso – milhões de conceitos interpretáveis por humanos, denominados “recursos”, dentro das redes neurais do modelo Claude.

Usando uma técnica chamada “aprendizado de dicionário“, os pesquisadores conseguiram isolar padrões que correspondiam a uma variedade de conceitos, desde objetos até ideias abstratas. Ajustando esses padrões, eles demonstraram a capacidade de influenciar os resultados gerados pelo modelo Claude, potencialmente abrindo caminho para sistemas mais controláveis.

Além disso, a equipe conseguiu mapear conceitos relacionados às preocupações de segurança da IA, como engano e busca de poder, oferecendo insights sobre como os modelos compreendem essas questões essenciais.

Leia também:

Este post foi modificado pela última vez em 22 de maio de 2024 17:03

Juliana Caminoto

Advogada com especialização em compliance e auditoria, estou sempre conectada às redes sociais e em busca de novos desafios. Sou mãe de pet e amo viajar.

Posts recentes

Stability AI tem novo CEO e injeção de capital; revela publicação

A startup britânica de inteligência artificial (IA) Stability AI tem um novo CEO, Prem Akkaraju,…

21 de junho de 2024

Robôs ingeríveis: Revolucionando a endoscopia com PillBot e IA

Um minúsculo robô ingerível chamado PillBot entrou em ensaios clínicos e se prepara para avaliação…

21 de junho de 2024

Huawei em ritmo acelerado: Empresa diz ter feito grandes avanços em sistemas operacionais e IA

A Huawei Technologies da China disse na sexta-feira (21) que fez avanços em áreas que…

21 de junho de 2024

IA transforma YouTuber ucraniana em russa, expondo perigos da tecnologia

Olga Loiek, uma estudante da Universidade da Pensilvânia, nos EUA, procurava pela atenção do público…

21 de junho de 2024

Empresas de IA burlam protocolo para coletar dados de sites jornalísticos, alerta startup de licenciamento

Várias empresas de inteligência artificial (IA) estão contornando um padrão web comum usado por editores…

21 de junho de 2024

Impacto da IA no setor financeiro: Mudanças inevitáveis e oportunidades promissoras

O Citigroup acaba de lançar um novo relatório do GPS sobre inteligência artificial (IA) em…

21 de junho de 2024