HealthBench: Novo padrão da OpenAI para avaliar IA na saúde
A OpenAI lançou o HealthBench, um benchmark criado com 262 médicos para avaliar o desempenho de sistemas de inteligência artificial (IA) em conversas sobre saúde – e estabelecer um novo padrão para medir a segurança e a eficácia da IA em contextos médicos.
Há uma quantidade esmagadora de evidências de que a IA pode proporcionar melhorias significativas em todos os aspectos em ambientes de saúde, e ter benchmarks validados por médicos é um passo importante tanto para medir o desempenho de cada modelo em contextos médicos quanto para decidir quando e como implantá-los.
Leia também:
Este post foi modificado pela última vez em 13 de maio de 2025 14:18
A Copa do Mundo de 2026, que será realizada nos Estados Unidos, Canadá e México,…
O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…
A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…
A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…
A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…
A disputa entre gigantes da inteligência artificial (IA) acaba de atingir um novo patamar —…