Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação
A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um novo estudo liderado por pesquisadores da Universidade de Stanford concluiu que sistemas de IA especializados em linguagem superaram professores de Direito em uma avaliação cega envolvendo questões complexas de Direito Contratual — um campo que exige interpretação, raciocínio crítico e análise contextual, e não apenas a memorização de regras.
Os resultados chamaram atenção da comunidade acadêmica por indicarem que os modelos de IA já não se destacam apenas em exames padronizados ou questões objetivas. Agora, eles parecem competir de igual para igual — e em muitos casos superar — especialistas humanos em atividades tradicionalmente associadas ao ensino e à orientação jurídica.
A pesquisa analisou um cenário bastante comum nas faculdades de Direito: as perguntas feitas por estudantes durante horários de atendimento dos professores (“office hours”). Diferentemente de testes com respostas claramente certas ou erradas, essas situações exigem julgamento, argumentação e capacidade de explicar conceitos complexos de forma clara e útil.
Para avaliar o desempenho dos sistemas, os pesquisadores reuniram 16 professores de Direito Contratual de 14 instituições diferentes. Os docentes responderam a uma série de perguntas reais de estudantes e, posteriormente, participaram de uma avaliação cega.
No total, foram analisados 2.918 confrontos entre respostas produzidas pelos próprios professores e respostas geradas por dois sistemas do Google: Gemini 2.5 Pro e NotebookLM.
Os avaliadores não sabiam qual resposta havia sido escrita por um colega humano e qual havia sido produzida por IA.
O resultado foi surpreendente: os professores escolheram as respostas geradas pelos modelos de IA em aproximadamente 75% das comparações.
Segundo os autores do estudo, apenas um professor considerado entre os mais destacados do grupo conseguiu manter desempenho equivalente ao dos sistemas avaliados.
O desempenho de modelos de IA em áreas jurídicas não é exatamente uma novidade. Desde o lançamento do GPT-4, diversos estudos demonstraram que sistemas de linguagem conseguem atingir ou superar níveis mínimos exigidos em exames profissionais, incluindo o tradicional Bar Exam dos Estados Unidos.
O diferencial desta nova pesquisa está justamente na natureza das tarefas avaliadas.
Enquanto exames de certificação costumam medir conhecimento técnico e aplicação de normas, as perguntas analisadas neste estudo exigiam interpretação, contextualização e capacidade pedagógica — habilidades frequentemente associadas à experiência humana.
Em outras palavras, o teste buscou avaliar não apenas quem “sabia mais”, mas quem conseguia ensinar melhor.
Os resultados sugerem que os modelos mais avançados estão começando a demonstrar competências que se aproximam do papel de tutores acadêmicos.
Após a fase principal do experimento, os pesquisadores expandiram a análise utilizando um sistema automatizado de avaliação baseado em IA para comparar um conjunto maior de modelos.
Nesse ranking ampliado, nove sistemas adicionais foram testados.
O destaque ficou para o modelo Claude Opus 4.7, da Anthropic, que alcançou a melhor colocação geral. De acordo com os resultados apresentados pelos autores, todos os modelos avaliados nessa etapa superaram o desempenho médio dos professores participantes.
Embora a utilização de uma IA como avaliadora gere discussões metodológicas, os pesquisadores argumentam que os resultados reforçam uma tendência observada em diferentes testes: os modelos de fronteira estão se tornando extremamente eficazes na produção de explicações sofisticadas, organizadas e pedagogicamente úteis.
O estudo surge em um momento em que o uso de inteligência artificial em ambientes educacionais continua gerando controvérsia.
Críticos alertam para riscos relacionados à dependência excessiva da tecnologia, à redução do pensamento crítico e à possibilidade de erros ou “alucinações” dos modelos. Já defensores argumentam que ferramentas de IA podem democratizar o acesso a tutoria personalizada, oferecendo suporte acadêmico instantâneo a milhões de estudantes.
Nesse contexto, os resultados de Stanford fortalecem a visão de que a IA pode desempenhar um papel importante como tutora sob demanda, especialmente em áreas que exigem acompanhamento individualizado e disponibilidade constante.
Isso não significa necessariamente que professores serão substituídos. Pelo contrário, especialistas apontam que o papel dos docentes pode evoluir para funções mais estratégicas, focadas em supervisão, mentoria, desenvolvimento de pensamento crítico e validação das respostas produzidas pelos sistemas.
O que parece cada vez mais claro é que a próxima geração de estudantes provavelmente aprenderá em um ambiente onde professores humanos e tutores de IA trabalharão lado a lado — uma transformação que promete redefinir a educação jurídica e, possivelmente, o ensino superior como um todo.
Leia também:
Este post foi modificado pela última vez em 9 de junho de 2026 17:41
A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…
A Copa do Mundo de 2026, que será realizada nos Estados Unidos, Canadá e México,…
O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…
A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…
A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…
A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…