Inteligência Artificial

‘Mapeando a Mente de Grandes Modelos de Linguagem’: Entenda a pesquisa da Anthropic

Publicado por
Juliana Caminoto

A Anthropic lançou recentemente uma pesquisa inovadora que conseguiu identificar e mapear – com sucesso – milhões de conceitos interpretáveis por humanos, denominados “recursos”, dentro das redes neurais do modelo Claude.

Usando uma técnica chamada “aprendizado de dicionário“, os pesquisadores conseguiram isolar padrões que correspondiam a uma variedade de conceitos, desde objetos até ideias abstratas. Ajustando esses padrões, eles demonstraram a capacidade de influenciar os resultados gerados pelo modelo Claude, potencialmente abrindo caminho para sistemas mais controláveis.

Além disso, a equipe conseguiu mapear conceitos relacionados às preocupações de segurança da IA, como engano e busca de poder, oferecendo insights sobre como os modelos compreendem essas questões essenciais.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 17:03

Juliana Caminoto

Advogada com especialização em compliance e auditoria, estou sempre conectada às redes sociais e em busca de novos desafios. Sou mãe de pet e amo viajar.

Posts recentes

Google Gemini agora pode lembrar coisas sobre você; entenda

O Google Gemini agora pode “lembrar” certas coisas sobre você, como seus interesses e preferências…

19 de novembro de 2024

ChatGPT supera médicos em desafio de diagnóstico; veja

Um novo estudo do UVA Health System revelou que o ChatGPT-4 alcançou uma precisão diagnóstica…

19 de novembro de 2024

Perplexity lança experiência de compras com IA

A Perplexity acaba de lançar uma nova experiência de compra para seus usuários Pro nos…

19 de novembro de 2024

Pixtral Large: Mistral lança nova potência multimodal

A startup francesa de inteligência artificial (IA), Mistral, acaba de lançar o Pixtral Large, um…

19 de novembro de 2024

Microsoft cria IA com memória quase infinita; entenda

Mustafa Suleyman, CEO de inteligência artificial (IA) da Microsoft, acabou de revelar que a empresa…

18 de novembro de 2024

Instituto Arc lança ‘ChatGPT para DNA’

Cientistas do Instituto de Pesquisa Arc acabaram de apresentar o Evo, um modelo de inteligência…

18 de novembro de 2024