Confira três inovações de IA mais importantes de 2023:
The 3 most important AI innovations of 2023https://t.co/hCK7vVWLZ4
— TIME (@TIME) December 21, 2023
Multimodalidade
“Multimodalidade” pode parecer jargão, mas vale a pena entender o que significa: é a capacidade de um sistema de IA processar muitos tipos diferentes de dados – não apenas texto, mas também imagens, vídeo, áudio e muito mais.
PUBLICIDADE
Este ano foi a primeira vez que o público teve acesso a poderosos modelos de IA multimodais. O GPT-4 da OpenAI foi o primeiro deles, permitindo aos usuários fazer upload de imagens e também de texto.
O modelo mais recente do Google DeepMind, Gemini, anunciado em dezembro, também pode trabalhar com imagens e áudio.
IA Constitucional
Uma das maiores questões sem resposta na IA é como alinhá-la aos valores humanos. Se estes sistemas se tornarem mais inteligentes e mais poderosos do que os humanos, poderão causar danos incalculáveis à nossa espécie – alguns até dizem a extinção total – a menos que, de alguma forma, sejam limitados por regras que coloquem o florescimento humano no seu centro.
PUBLICIDADE
O processo que a OpenAI utilizou para alinhar o ChatGPT (para evitar os comportamentos racistas e sexistas dos modelos anteriores) funcionou bem – mas exigiu uma grande quantidade de trabalho humano, através de uma técnica conhecida como “aprendizado por reforço com feedback humano”, ou RLHF.
É claro que a IA Constitucional não responde à questão de quais valores a IA deve estar alinhada. Mas a Anthropic está experimentando democratizar essa questão. Em outubro, o laboratório realizou um experimento que pediu a um grupo representativo de 1.000 americanos que ajudasse a escolher regras para um chatbot e descobriu que, embora houvesse alguma polarização, ainda era possível redigir uma constituição viável com base nas declarações que o grupo chegou a um consenso sobre.
Texto para vídeo
Um resultado notável dos bilhões de dólares investidos em IA este ano foi o rápido aumento das ferramentas de texto para vídeo. No ano passado, as ferramentas de conversão de texto em imagem ainda estavam nos estágios iniciais; agora, existem várias empresas que oferecem a capacidade de transformar frases em imagens em movimento com níveis de precisão cada vez mais refinados.
PUBLICIDADE
Leia também: