IA supera professores de Direito em estudo de Stanford e acende debate sobre o futuro da educação jurídica; confira

A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um novo estudo liderado por pesquisadores da Universidade de Stanford concluiu que sistemas de IA especializados em linguagem superaram professores de Direito em uma avaliação cega envolvendo questões complexas de Direito Contratual — um campo que exige interpretação, raciocínio crítico e análise contextual, e não apenas a memorização de regras.

Os resultados chamaram atenção da comunidade acadêmica por indicarem que os modelos de IA já não se destacam apenas em exames padronizados ou questões objetivas. Agora, eles parecem competir de igual para igual — e em muitos casos superar — especialistas humanos em atividades tradicionalmente associadas ao ensino e à orientação jurídica.

Como o estudo foi realizado

A pesquisa analisou um cenário bastante comum nas faculdades de Direito: as perguntas feitas por estudantes durante horários de atendimento dos professores (“office hours”). Diferentemente de testes com respostas claramente certas ou erradas, essas situações exigem julgamento, argumentação e capacidade de explicar conceitos complexos de forma clara e útil.

Para avaliar o desempenho dos sistemas, os pesquisadores reuniram 16 professores de Direito Contratual de 14 instituições diferentes. Os docentes responderam a uma série de perguntas reais de estudantes e, posteriormente, participaram de uma avaliação cega.

No total, foram analisados 2.918 confrontos entre respostas produzidas pelos próprios professores e respostas geradas por dois sistemas do Google: Gemini 2.5 Pro e NotebookLM.

Os avaliadores não sabiam qual resposta havia sido escrita por um colega humano e qual havia sido produzida por IA.

O resultado foi surpreendente: os professores escolheram as respostas geradas pelos modelos de IA em aproximadamente 75% das comparações.

Segundo os autores do estudo, apenas um professor considerado entre os mais destacados do grupo conseguiu manter desempenho equivalente ao dos sistemas avaliados.

O avanço além dos exames jurídicos

O desempenho de modelos de IA em áreas jurídicas não é exatamente uma novidade. Desde o lançamento do GPT-4, diversos estudos demonstraram que sistemas de linguagem conseguem atingir ou superar níveis mínimos exigidos em exames profissionais, incluindo o tradicional Bar Exam dos Estados Unidos.

O diferencial desta nova pesquisa está justamente na natureza das tarefas avaliadas.

Enquanto exames de certificação costumam medir conhecimento técnico e aplicação de normas, as perguntas analisadas neste estudo exigiam interpretação, contextualização e capacidade pedagógica — habilidades frequentemente associadas à experiência humana.

Em outras palavras, o teste buscou avaliar não apenas quem “sabia mais”, mas quem conseguia ensinar melhor.

Os resultados sugerem que os modelos mais avançados estão começando a demonstrar competências que se aproximam do papel de tutores acadêmicos.

Claude lidera ranking ampliado

Após a fase principal do experimento, os pesquisadores expandiram a análise utilizando um sistema automatizado de avaliação baseado em IA para comparar um conjunto maior de modelos.

Nesse ranking ampliado, nove sistemas adicionais foram testados.

O destaque ficou para o modelo Claude Opus 4.7, da Anthropic, que alcançou a melhor colocação geral. De acordo com os resultados apresentados pelos autores, todos os modelos avaliados nessa etapa superaram o desempenho médio dos professores participantes.

Embora a utilização de uma IA como avaliadora gere discussões metodológicas, os pesquisadores argumentam que os resultados reforçam uma tendência observada em diferentes testes: os modelos de fronteira estão se tornando extremamente eficazes na produção de explicações sofisticadas, organizadas e pedagogicamente úteis.

O que isso significa para a educação?

O estudo surge em um momento em que o uso de inteligência artificial em ambientes educacionais continua gerando controvérsia.

Críticos alertam para riscos relacionados à dependência excessiva da tecnologia, à redução do pensamento crítico e à possibilidade de erros ou “alucinações” dos modelos. Já defensores argumentam que ferramentas de IA podem democratizar o acesso a tutoria personalizada, oferecendo suporte acadêmico instantâneo a milhões de estudantes.

Nesse contexto, os resultados de Stanford fortalecem a visão de que a IA pode desempenhar um papel importante como tutora sob demanda, especialmente em áreas que exigem acompanhamento individualizado e disponibilidade constante.

Isso não significa necessariamente que professores serão substituídos. Pelo contrário, especialistas apontam que o papel dos docentes pode evoluir para funções mais estratégicas, focadas em supervisão, mentoria, desenvolvimento de pensamento crítico e validação das respostas produzidas pelos sistemas.

O que parece cada vez mais claro é que a próxima geração de estudantes provavelmente aprenderá em um ambiente onde professores humanos e tutores de IA trabalharão lado a lado — uma transformação que promete redefinir a educação jurídica e, possivelmente, o ensino superior como um todo.

Leia também:

Copa do Mundo 2026 aposta em IA para proteger jogadores de ataques online

IA supera professores de Direito em estudo de Stanford e acende debate sobre o futuro da educação jurídica; confira

Como o estudo foi realizado

O avanço além dos exames jurídicos

Claude lidera ranking ampliado

O que isso significa para a educação?

Sobre o autor

Isabella Caminoto

Como o estudo foi realizado

O avanço além dos exames jurídicos

Claude lidera ranking ampliado

O que isso significa para a educação?

Sobre o autor

Isabella Caminoto

Mais lidas

Relacionados