Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação
Créditos da imagem: Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação

IA supera professores de Direito em estudo de Stanford e acende debate sobre o futuro da educação jurídica; confira

A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um novo estudo liderado por pesquisadores da Universidade de Stanford concluiu que sistemas de IA especializados em linguagem superaram professores de Direito em uma avaliação cega envolvendo questões complexas de Direito Contratual — um campo que exige interpretação, raciocínio crítico e análise contextual, e não apenas a memorização de regras.

PUBLICIDADE

Os resultados chamaram atenção da comunidade acadêmica por indicarem que os modelos de IA já não se destacam apenas em exames padronizados ou questões objetivas. Agora, eles parecem competir de igual para igual — e em muitos casos superar — especialistas humanos em atividades tradicionalmente associadas ao ensino e à orientação jurídica.

Como o estudo foi realizado

A pesquisa analisou um cenário bastante comum nas faculdades de Direito: as perguntas feitas por estudantes durante horários de atendimento dos professores (“office hours”). Diferentemente de testes com respostas claramente certas ou erradas, essas situações exigem julgamento, argumentação e capacidade de explicar conceitos complexos de forma clara e útil.

Para avaliar o desempenho dos sistemas, os pesquisadores reuniram 16 professores de Direito Contratual de 14 instituições diferentes. Os docentes responderam a uma série de perguntas reais de estudantes e, posteriormente, participaram de uma avaliação cega.

PUBLICIDADE

No total, foram analisados 2.918 confrontos entre respostas produzidas pelos próprios professores e respostas geradas por dois sistemas do Google: Gemini 2.5 Pro e NotebookLM.

Os avaliadores não sabiam qual resposta havia sido escrita por um colega humano e qual havia sido produzida por IA.

O resultado foi surpreendente: os professores escolheram as respostas geradas pelos modelos de IA em aproximadamente 75% das comparações.

PUBLICIDADE

Segundo os autores do estudo, apenas um professor considerado entre os mais destacados do grupo conseguiu manter desempenho equivalente ao dos sistemas avaliados.

O avanço além dos exames jurídicos

O desempenho de modelos de IA em áreas jurídicas não é exatamente uma novidade. Desde o lançamento do GPT-4, diversos estudos demonstraram que sistemas de linguagem conseguem atingir ou superar níveis mínimos exigidos em exames profissionais, incluindo o tradicional Bar Exam dos Estados Unidos.

O diferencial desta nova pesquisa está justamente na natureza das tarefas avaliadas.

PUBLICIDADE

Enquanto exames de certificação costumam medir conhecimento técnico e aplicação de normas, as perguntas analisadas neste estudo exigiam interpretação, contextualização e capacidade pedagógica — habilidades frequentemente associadas à experiência humana.

Em outras palavras, o teste buscou avaliar não apenas quem “sabia mais”, mas quem conseguia ensinar melhor.

Os resultados sugerem que os modelos mais avançados estão começando a demonstrar competências que se aproximam do papel de tutores acadêmicos.

PUBLICIDADE

Claude lidera ranking ampliado

Após a fase principal do experimento, os pesquisadores expandiram a análise utilizando um sistema automatizado de avaliação baseado em IA para comparar um conjunto maior de modelos.

Nesse ranking ampliado, nove sistemas adicionais foram testados.

O destaque ficou para o modelo Claude Opus 4.7, da Anthropic, que alcançou a melhor colocação geral. De acordo com os resultados apresentados pelos autores, todos os modelos avaliados nessa etapa superaram o desempenho médio dos professores participantes.

Embora a utilização de uma IA como avaliadora gere discussões metodológicas, os pesquisadores argumentam que os resultados reforçam uma tendência observada em diferentes testes: os modelos de fronteira estão se tornando extremamente eficazes na produção de explicações sofisticadas, organizadas e pedagogicamente úteis.

O que isso significa para a educação?

O estudo surge em um momento em que o uso de inteligência artificial em ambientes educacionais continua gerando controvérsia.

Críticos alertam para riscos relacionados à dependência excessiva da tecnologia, à redução do pensamento crítico e à possibilidade de erros ou “alucinações” dos modelos. Já defensores argumentam que ferramentas de IA podem democratizar o acesso a tutoria personalizada, oferecendo suporte acadêmico instantâneo a milhões de estudantes.

Nesse contexto, os resultados de Stanford fortalecem a visão de que a IA pode desempenhar um papel importante como tutora sob demanda, especialmente em áreas que exigem acompanhamento individualizado e disponibilidade constante.

Isso não significa necessariamente que professores serão substituídos. Pelo contrário, especialistas apontam que o papel dos docentes pode evoluir para funções mais estratégicas, focadas em supervisão, mentoria, desenvolvimento de pensamento crítico e validação das respostas produzidas pelos sistemas.

O que parece cada vez mais claro é que a próxima geração de estudantes provavelmente aprenderá em um ambiente onde professores humanos e tutores de IA trabalharão lado a lado — uma transformação que promete redefinir a educação jurídica e, possivelmente, o ensino superior como um todo.

Leia também:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima